archive

Archives de Tag: e-reputation

Bonjour tout le monde !

Hier, je vous ai montrĂ© comment faire une veille automatique et une collecte sur des tweets. Aujourd’hui, je reviens avec un article sur une veille automatisĂ©e et l’extraction des commentaires dans les publications sur les mĂ©dias traditionnels ou les blogs et/ou les forums.

Les commentaires sont Ă©galement des verbatims intĂ©ressants Ă  Ă©tudier pour  l’e-rĂ©putation ou l’analyse d’opinions. En effet, c’est souvent dans ces derniers que les internautes expriment leurs pensĂ©es et leurs opinions sur un sujet.

Voici rapidement comment je fais pour collecter efficacement et rapidement des commentaires:

1) J’utilise AUTOVEILLE Monitoring et AUTOVEILLE Corpus pour faire ma collecte automatique (si vous voulez en savoir plus sur ces outils, je vous invite Ă  aller sur mon site ou Ă  m’Ă©crire).

Exemple > Extraction des commentaires ci-dessous:

commentaires Figaro

2) Mes robots récupérent les commentaires au format HTML, et je fais une extraction de ces derniers dans un autre format exploitable par la plupart des outils de traitement automatique

Exemple > Les commentaires affichés dans ma Konsole (qui nécessitent bien évidemment encore quelques nettoyages)

commentaires-figaro-2

3)  Le corpus de commentaires extraits (Ă  titre d’exemple)

Corpus et collecte de commentaires / verbatims

Chaque collecte pour crĂ©er un corpus de commentaires est Ă©tudiĂ© et personnalisĂ© parce que chaque site ne prĂ©sente pas les choses de la mĂȘme façon. Il faut donc des outils adaptables pour rapatrier un maximum de verbatims.

 

N’hĂ©sitez pas Ă  me donner vos avis, vos idĂ©es ou Ă  m’Ă©crire si vous voulez en savoir plus 🙂

Bon courage –

VĂ©ronique Duong

Bonjour Ă  tous,

Comme on me le demande souvent, j’ai dĂ©cidĂ© de faire un article pour vous montrer comment faire une veille automatique ainsi qu’une collecte automatique des tweets depuis Twitter.

Pour cela, je dĂ©veloppe un script Perl pour chaque crawl. C’est Ă  dire que j’adapte mes crawls en fonction du type d’Ă©lĂ©ments Ă  crawler. RĂ©cupĂ©rer des tweets est diffĂ©rent de rĂ©cupĂ©rer des pages web par exemple.

A partir d’une recherche de tweets par #hashtag, mot-clĂ© ou expressions clĂ©s, j’en crĂ©e un flux RSS que je passe sous AUTOVEILLE. Ensuite, mon logiciel de veille collecte les tweets au format XML, et je traite ce XML au format demandĂ© par le client.

Voici un exemple d’un tweet au format XML:

collecte automatique de tweets

Avec quelques lignes de commandes Bash (Shell), je récupÚre uniquement les liens vers mes tweets collectés:

collecte automatique de tweets

Encore un peu de nettoyage automatique pour retirer les balises link

tweets collectés

Voilà, avec cette collecte, vous pouvez sauvegarder vos précieux tweets. Pour les afficher, il suffit de les repasser au format XML ou HTML. En repassant au format HTML, on obtient des tweets dans ce format:

tweet-format-html

J’adapte chaque veille / chaque collecte au cas par cas comme vous pouvez le constater.

Bon courage !

VĂ©ronique Duong –

Bonjour Ă  tous !

DerniĂšrement, je vous parlais souvent d’e-rĂ©putation. Dans un de mes articles prĂ©cĂ©dents, je vous ai donnĂ© quelques pistes pour nettoyer votre rĂ©putation web si jamais elle a Ă©tĂ© « endommagĂ©e » par des verbatims Ă  votre encontre.

Et aujourd’hui, dans cet article, je vais vous donner quelques astuces pour mettre en place une identitĂ© numĂ©rique solide et Ă  long terme sur la premiĂšre page Google.

1) Lorsqu’on tape votre marque ou votre nom, on doit vous trouver en 1er. Pour cela, il faut employer une sacrĂ© stratĂ©gie de SEO en produisant plus de contenus de qualitĂ© avec comme mot-clĂ© principal, votre marque ou votre nom, et en trouvant des backlinks de qualitĂ© (sur les sites connus par exemple)

2) Que vous soyez un particulier, une entreprise ou autre, ayez un profil Linkedin complétement rempli et clair. Cela est trÚs important.

3) Si vous avez un site, je vous conseille de crĂ©er un profil Google + si ce n’est pas encore fait (!). Dans le monde du rĂ©fĂ©rencement, on parle beaucoup du critĂšre de l’Author Rank qui serait un futur facteur de ranking pour Google. AprĂšs avoir crĂ©Ă© votre profil, liez ce dernier aux pages web de votre site.

4) Ayez un blog oĂč vous pouvez produire souvent et dynamiser vos contenus en proposant des mises Ă  jour, des nouveautĂ©s, etc. Innovez sans cesse. Les gens aiment tout ce qui est original.

5) Faites attention Ă  ce que vous postez sur le web, surtout si vous signez avec votre marque et / ou votre nom.

6) Faites de la veille sur vous, votre marque, vos thématiques, etc.

Il y a encore d’autres astuces, mais ce sont les principales des principales Ă  appliquer pour commencer tranquillement 🙂

E-réputation et identité numérique

E-réputation et identité numérique

 

Bon courage !

VĂ©ronique Duong

Bonjour Ă  tous !

Un petit article sur l’opinion mining / analyse des opinions / des sentiments (bref, toutes les appellations possibles et inimaginables). A travers ce post, je souhaite faire comprendre aux personnes qui sont intĂ©ressĂ©es par ces domaines que l’analyse des opinions ou des sentiments ne peut (pour l’instant ?) se faire que manuellement pour assurer un maximum de qualitĂ©. En effet, aucune machine ou aucun outil peut dĂ©terminer la tonalitĂ© d’un texte. J’ai travaillĂ© sur ce sujet Ă  plusieurs reprises, testĂ© des outils, dĂ©veloppĂ© mes propres outils, et les rĂ©sultats en sortie Ă©taient toujours assez peu prĂ©cis.

En revanche, on peut toujours se servir d’un catĂ©goriseur automatique pour faire le premier gros tri parmi les 1000000 contenus rapatriĂ©s lors de la collecte. RĂ©cemment, j’ai dĂ©veloppĂ© un catĂ©goriseur de tonalitĂ©s, mais je le mentionne une nouvelle fois, un tri Ă  la main est obligatoire.

Pour travailler dans la e-rĂ©putation, je pense que les outils peuvent rĂ©ellement intervenir lors de la fouille d’opinions (opinions mining), dans la collecte des contenus, en fait. Ces outils peuvent ĂȘtre une grande aide pour trouver tous les contenus possibles / existants sur un sujet, mais ensuite l’analyse de ces opinions doivent se faire, en grande partie, Ă  la main. Non seulement, la qualitĂ© est assurĂ©e, mais en plus vous serez sĂ»r de vous quand vous allez prĂ©senter les rĂ©sultats aux clients.

analyse des sentiments, analyse des opinions, ereputation

Bon, je retourne constituer un corpus de tweets 😀

Bon courage !

VĂ©ronique Duong

Hello tout le monde,

Je vais crĂ©er une catĂ©gorie « J’ai testĂ© … » pour ce blog. Et le premier outil en liste est ERDIL CRM Analytics. Cet outil permet de faire une analyse sĂ©mantique automatiquement. Voici le test en image:

Image

Humainement, il m’a fallu 49 secondes pour dĂ©terminer la tonalitĂ© et les concepts du verbatim. L’outil a mis 0.03 secondes. Je pense que pour ce test en ligne, il y a dĂ©jĂ  un grand corpus de verbatims tout prĂȘt et annotĂ© avec les tonalitĂ©s et les concepts.

Toutefois, je trouve que l’outil peut ĂȘtre pas mal pour faire une premiĂšre catĂ©gorisation des contenus collectĂ©s sur le web. Mais, il faut toujours une analyse humaine pour mieux dĂ©finir les tons, les sens, etc.

Un outil comme celui-ci pourrait ĂȘtre tout Ă  fait dĂ©velopper par un(e) ingĂ©nieur(e) linguiste :p car c’est notre coeur de mĂ©tier (traitement automatique des langues).

Bon courage

VĂ©ronique Duong

Hello tout le monde !

Je fais beaucoup de veilles, de SEO, mais Ă©galement des Ă©tudes et des analyses d’e-rĂ©putation !

Automatiser l’analyse des tonalitĂ©s dans les verbatims = pratiquement impossible pour le moment. Avec l’automatisation, on peut catĂ©goriser les contenus en deux grands thĂšmes comme « positif » / « nĂ©gatif », et encore … car un poste avec pleins de termes Ă  tonalitĂ© positif peut ĂȘtre Ă©crit avec un ton ironique et moqueur, et vice versa. Vous voyez ce que je veux dire.

De ce fait, pour une analyse sérieuse des opinions, il faut une analyse humaine.

Avec AUTOVEILLE monitoring, je constitue mon corpus de verbatims en collectant automatiquement ces derniers via les blogs, forums, Twitter, Facebook, etc. Puis, je trie ces contenus avec mon moteur de recherche interne pour extraire les meilleurs, et je les analyse de façon humaine pour les catégoriser en positif / neutre / négatif.

Faites attention aux agences qui vous disent qu’ils ont des outils pour faire l’analyse. Ils ont des outils pour collecter, mais pour analyser et catĂ©goriser, ça doit rester le travail des humains, et non des robots :).

opinion-mining-ereputation

Surveillez votre rĂ©putation sur le web ! 😉

VĂ©ronique

Bonjour Ă  tous !

J’ai ajoutĂ© la balise <a href= »[profile_url]?rel=author »>Google</a> et liĂ© mon compte Google + Ă  mon site AUTOVEILLE ce matin.

Dans mon article Author Rank: le nouvel Ă©lĂ©ment Ă  la mode en SEO, je vous disais que ce critĂšre d’auteur est de plus en plus pris en compte par Google. La preuve avec ces rĂ©sultats de recherche.

Google prend en compte le Author Rank

On constate que dans les SERP, le profil Google + de l’auteur est associĂ© au contenu / Ă  un article du site / blog (avec le nombre de cercles oĂč il se trouve). La notoriĂ©tĂ© et la rĂ©putation de l’auteur peut jouer Ă©normĂ©ment sur la confiance des internautes par rapport Ă  ses propos (pour Olivier Duffez, je pense qu’il est LA rĂ©fĂ©rence pour le SEO en France, avec Olivier Andrieu, bien sĂ»r).

En tout cas, faites attention Ă  l’Author Rank. Rien n’est totalement officiel, mais mon Ă©tude montre que la notion de confiance / rĂ©putation est tout de mĂȘme sĂ©rieuse.

Bon courage !

VĂ©ronique Duong

%d blogueurs aiment cette page :