archive

Archives de Tag: analyse d’opinions

Bonjour tout le monde !

Cela fait une semaine que je n’ai pas rĂ©digĂ© de nouveaux articles sur la veille stratĂ©gique, sur mon logiciel de veille ou encore sur le rĂ©fĂ©rencement naturel pour mon blog afin faire un petit test « d’audience ».

La consĂ©quence a Ă©tĂ© inĂ©vitable : j’ai tout de suite perdu en termes de trafic ! Un test pour vous montrer que vous devez sans cesse proposer de nouveaux contenus Ă  vos lecteurs afin de maintenir un taux de visites / visibilitĂ© stable.

Aujourd’hui, je reviens donc avec un article sur … comment faire un audit d’e-rĂ©putation et analyse d’opinions ? Depuis quelques mois, je me spĂ©cialise sur l’E-rĂ©putation et tous les sujets connexes Ă  ce domaine (Personal Branding, Sentiment Analysis, etc.). J’Ă©cris moins sur l’E-rĂ©putation sur ce blog car j’ai co-crĂ©Ă© un autre blog avec mon meilleur ami qui est uniquement dĂ©diĂ© Ă  ce sujet : ASVD (Analyse de Sentiment, de Verbatim et de DonnĂ©es). Je vous invite Ă  le lire au passage 🙂

Je vais donc faire une mini analyse d’opinions sur les avis des lecteurs du Figaro concernant la robotisation des tĂąches en France (article oĂč j’ai prĂ©levĂ© les commentaires : Les robots deviennent presque des collĂšgues).

Cette analyse a Ă©tĂ© rĂ©alisĂ©e sur un minuscule corpus de 8 verbatims pour vous donner une idĂ©e de la mĂ©thode que j’emploie pour faire un audit d’e-rĂ©putation. L’article est datĂ© du mercredi 19 mars 2014.

Dans l’ensemble, les lecteurs du Figaro (tous des hommes pour cette Ă©tude) sont POUR la robotisation des tĂąches car cela apporte de « l’innovation » et permet de rattraper le retard en termes de « haute technologie » en France :

Etude opinions et e-réputation sur la robotisation en France - AUTOVEILLE

 

Les thĂšmes abordĂ©s dans les commentaires concernent surtout la robotisation et le problĂšme de l’emploi (augmentation du chĂŽmage ou pas), la nĂ©cessitĂ© de robotiser, l’innovation grĂące Ă  l’automatisation de certaines tĂąches, etc.

Audit E-réputation : Robotisation en France - AUTOVEILLE

 

Tous les commentaires proviennent d’un lecteur fidĂšle du Figaro. Dans l’ensemble, les lecteurs masculins et fidĂšles du Figaro ne pensent pas que la robotisation tue l’empoi, et ils sont plutĂŽt pour cette derniĂšre.

Si j’ai plus de donnĂ©es (lieux / villes de rĂ©sidence, Ăąges, emplois des auteurs, etc.), je peux Ă©galement Ă©tudier ces derniĂšres afin de fournir des Ă©tudes complĂštes. Mais pour cela, il faut Ă©galement que le corpus soit beaucoup plus gros (avec une centaine de verbatims provenant de sources variĂ©es, par exemple).

L’e-rĂ©putation et le SEO sont deux domaines totalement liĂ©s. Lorsqu’on tape « robotisation » sur Google, on voit que la requĂȘte « robotisation » affiche des rĂ©sultats Ă  diverses tonalitĂ©s (essentiellement nĂ©gatives,  mais on y voit aussi du positif) :

SEO et e-réputation "Robotisation" - AUTOVEILLE

 

Il faut faire une veille stratĂ©gique rĂ©guliĂšre sur les rĂ©sultats de recherche afin de voir si on produit des contenus Ă  l’encontre de votre domaine d’activitĂ© ou autre.

Je travaille souvent sur ce sujet avec mon co-Ă©quipier ASVD, et si vous souhaitez lire d’autres audits, rendez-vous sur notre blog ASVD.

Bon courage Ă  tous !

VĂ©ronique Duong –

Publicité

Bonjour tout le monde !

Hier, je vous ai montrĂ© comment faire une veille automatique et une collecte sur des tweets. Aujourd’hui, je reviens avec un article sur une veille automatisĂ©e et l’extraction des commentaires dans les publications sur les mĂ©dias traditionnels ou les blogs et/ou les forums.

Les commentaires sont Ă©galement des verbatims intĂ©ressants Ă  Ă©tudier pour  l’e-rĂ©putation ou l’analyse d’opinions. En effet, c’est souvent dans ces derniers que les internautes expriment leurs pensĂ©es et leurs opinions sur un sujet.

Voici rapidement comment je fais pour collecter efficacement et rapidement des commentaires:

1) J’utilise AUTOVEILLE Monitoring et AUTOVEILLE Corpus pour faire ma collecte automatique (si vous voulez en savoir plus sur ces outils, je vous invite Ă  aller sur mon site ou Ă  m’Ă©crire).

Exemple > Extraction des commentaires ci-dessous:

commentaires Figaro

2) Mes robots récupérent les commentaires au format HTML, et je fais une extraction de ces derniers dans un autre format exploitable par la plupart des outils de traitement automatique

Exemple > Les commentaires affichés dans ma Konsole (qui nécessitent bien évidemment encore quelques nettoyages)

commentaires-figaro-2

3)  Le corpus de commentaires extraits (Ă  titre d’exemple)

Corpus et collecte de commentaires / verbatims

Chaque collecte pour crĂ©er un corpus de commentaires est Ă©tudiĂ© et personnalisĂ© parce que chaque site ne prĂ©sente pas les choses de la mĂȘme façon. Il faut donc des outils adaptables pour rapatrier un maximum de verbatims.

 

N’hĂ©sitez pas Ă  me donner vos avis, vos idĂ©es ou Ă  m’Ă©crire si vous voulez en savoir plus 🙂

Bon courage –

VĂ©ronique Duong

Bonjour Ă  tous !

Un petit article sur l’opinion mining / analyse des opinions / des sentiments (bref, toutes les appellations possibles et inimaginables). A travers ce post, je souhaite faire comprendre aux personnes qui sont intĂ©ressĂ©es par ces domaines que l’analyse des opinions ou des sentiments ne peut (pour l’instant ?) se faire que manuellement pour assurer un maximum de qualitĂ©. En effet, aucune machine ou aucun outil peut dĂ©terminer la tonalitĂ© d’un texte. J’ai travaillĂ© sur ce sujet Ă  plusieurs reprises, testĂ© des outils, dĂ©veloppĂ© mes propres outils, et les rĂ©sultats en sortie Ă©taient toujours assez peu prĂ©cis.

En revanche, on peut toujours se servir d’un catĂ©goriseur automatique pour faire le premier gros tri parmi les 1000000 contenus rapatriĂ©s lors de la collecte. RĂ©cemment, j’ai dĂ©veloppĂ© un catĂ©goriseur de tonalitĂ©s, mais je le mentionne une nouvelle fois, un tri Ă  la main est obligatoire.

Pour travailler dans la e-rĂ©putation, je pense que les outils peuvent rĂ©ellement intervenir lors de la fouille d’opinions (opinions mining), dans la collecte des contenus, en fait. Ces outils peuvent ĂȘtre une grande aide pour trouver tous les contenus possibles / existants sur un sujet, mais ensuite l’analyse de ces opinions doivent se faire, en grande partie, Ă  la main. Non seulement, la qualitĂ© est assurĂ©e, mais en plus vous serez sĂ»r de vous quand vous allez prĂ©senter les rĂ©sultats aux clients.

analyse des sentiments, analyse des opinions, ereputation

Bon, je retourne constituer un corpus de tweets 😀

Bon courage !

VĂ©ronique Duong

Bonsoir !

J’ai dĂ©cidĂ© de poster un petit article sur Lexico 3, un outil de lexicomĂ©trie / textomĂ©trie fournissant des statistiques textuelles dĂ©veloppĂ© par l’UniversitĂ© Sorbonne Nouvelle.

Il y a deux ans (pratiquement jour pour jour !), je me suis servie de cet outil pour faire des analyses sĂ©mantiques (style « journalistique » et style « conversations en ligne » sur les forums, blogs, etc.), et cela avait bien marchĂ©. Les spĂ©cificitĂ©s positives, nĂ©gatives, statistiques textuelles sont prĂ©cises, et permettent de faire de bonnes analyses.

Par exemple, pour le style « conversations en ligne », j’ai travaillĂ© sur les contenus textuels du site communautaire Samestory. Il fallait catĂ©goriser les verbatims en positif / neutre / nĂ©gatif Ă  l’aide de Lexico 3 (concordances / collocations / coocurrences). Vous remarquerez que les textes sont effectivement classĂ©s par tonalitĂ© dans le site:

tonalité discours samestory

Lexico 3 nous offre la possibilitĂ© d’avoir un outil de concordance pour identifier tous les contextes oĂč chaque mot-clĂ© qu’on aura dĂ©terminĂ© se trouve. Un mot positif dans un contexte nĂ©gatif a une tonalitĂ© nĂ©gative, et vice-versa. Il faut Ă©galement faire attention aux textes avec un ton ironique, humoristique, les sous-entendus, etc.

C’est pour cela que nous avons besoin d’analyser les contextes.

outil concordance lexico3

De plus, pour mesurer la prĂ©sence d’un mot dans les contenus textuels, on peut utiliser les statistiques textuelles, et en former des graphes ou des histogrammes. La version histogramme est plus claire Ă  mon goĂ»t car on voit tout de suite si un mot est plus prĂ©sent dans une thĂ©matique par rapport Ă  une autre, ou selon votre catĂ©gorisation:

histogramme Lexico 3

 

En tout cas, cet outil est utile pour faire de l’analyse sĂ©mantique reposant sur des statistiques textuelles. Je l’utilise Ă©galement pour faire de l’analyse d’opinions.

La prise en main peut ĂȘtre un peu technique au dĂ©but, mais on s’habitue trĂšs vite (si on l’utilise rĂ©guliĂšrement). Lexico 3 prend un certain format de balises dans le corpus.txt Ă  mettre en entrĂ©e.

Si vous voulez en savoir plus, je peux vous expliquer plus en dĂ©tails avec les Ă©tudes que j’ai faites.

Bon courage 🙂

VĂ©ronique Duong

 

 

Hello tout le monde,

Je vais crĂ©er une catĂ©gorie « J’ai testĂ© … » pour ce blog. Et le premier outil en liste est ERDIL CRM Analytics. Cet outil permet de faire une analyse sĂ©mantique automatiquement. Voici le test en image:

Image

Humainement, il m’a fallu 49 secondes pour dĂ©terminer la tonalitĂ© et les concepts du verbatim. L’outil a mis 0.03 secondes. Je pense que pour ce test en ligne, il y a dĂ©jĂ  un grand corpus de verbatims tout prĂȘt et annotĂ© avec les tonalitĂ©s et les concepts.

Toutefois, je trouve que l’outil peut ĂȘtre pas mal pour faire une premiĂšre catĂ©gorisation des contenus collectĂ©s sur le web. Mais, il faut toujours une analyse humaine pour mieux dĂ©finir les tons, les sens, etc.

Un outil comme celui-ci pourrait ĂȘtre tout Ă  fait dĂ©velopper par un(e) ingĂ©nieur(e) linguiste :p car c’est notre coeur de mĂ©tier (traitement automatique des langues).

Bon courage

VĂ©ronique Duong

%d blogueurs aiment cette page :