archive

Archives de Tag: analyse d’opinions

Bonjour tout le monde !

Cela fait une semaine que je n’ai pas rédigé de nouveaux articles sur la veille stratégique, sur mon logiciel de veille ou encore sur le référencement naturel pour mon blog afin faire un petit test « d’audience ».

La conséquence a été inévitable : j’ai tout de suite perdu en termes de trafic ! Un test pour vous montrer que vous devez sans cesse proposer de nouveaux contenus à vos lecteurs afin de maintenir un taux de visites / visibilité stable.

Aujourd’hui, je reviens donc avec un article sur … comment faire un audit d’e-réputation et analyse d’opinions ? Depuis quelques mois, je me spécialise sur l’E-réputation et tous les sujets connexes à ce domaine (Personal Branding, Sentiment Analysis, etc.). J’écris moins sur l’E-réputation sur ce blog car j’ai co-créé un autre blog avec mon meilleur ami qui est uniquement dédié à ce sujet : ASVD (Analyse de Sentiment, de Verbatim et de Données). Je vous invite à le lire au passage 🙂

Je vais donc faire une mini analyse d’opinions sur les avis des lecteurs du Figaro concernant la robotisation des tâches en France (article où j’ai prélevé les commentaires : Les robots deviennent presque des collègues).

Cette analyse a été réalisée sur un minuscule corpus de 8 verbatims pour vous donner une idée de la méthode que j’emploie pour faire un audit d’e-réputation. L’article est daté du mercredi 19 mars 2014.

Dans l’ensemble, les lecteurs du Figaro (tous des hommes pour cette étude) sont POUR la robotisation des tâches car cela apporte de « l’innovation » et permet de rattraper le retard en termes de « haute technologie » en France :

Etude opinions et e-réputation sur la robotisation en France - AUTOVEILLE

 

Les thèmes abordés dans les commentaires concernent surtout la robotisation et le problème de l’emploi (augmentation du chômage ou pas), la nécessité de robotiser, l’innovation grâce à l’automatisation de certaines tâches, etc.

Audit E-réputation : Robotisation en France - AUTOVEILLE

 

Tous les commentaires proviennent d’un lecteur fidèle du Figaro. Dans l’ensemble, les lecteurs masculins et fidèles du Figaro ne pensent pas que la robotisation tue l’empoi, et ils sont plutôt pour cette dernière.

Si j’ai plus de données (lieux / villes de résidence, âges, emplois des auteurs, etc.), je peux également étudier ces dernières afin de fournir des études complètes. Mais pour cela, il faut également que le corpus soit beaucoup plus gros (avec une centaine de verbatims provenant de sources variées, par exemple).

L’e-réputation et le SEO sont deux domaines totalement liés. Lorsqu’on tape « robotisation » sur Google, on voit que la requête « robotisation » affiche des résultats à diverses tonalités (essentiellement négatives,  mais on y voit aussi du positif) :

SEO et e-réputation "Robotisation" - AUTOVEILLE

 

Il faut faire une veille stratégique régulière sur les résultats de recherche afin de voir si on produit des contenus à l’encontre de votre domaine d’activité ou autre.

Je travaille souvent sur ce sujet avec mon co-équipier ASVD, et si vous souhaitez lire d’autres audits, rendez-vous sur notre blog ASVD.

Bon courage à tous !

Véronique Duong –

Publicités

Bonjour tout le monde !

Hier, je vous ai montré comment faire une veille automatique et une collecte sur des tweets. Aujourd’hui, je reviens avec un article sur une veille automatisée et l’extraction des commentaires dans les publications sur les médias traditionnels ou les blogs et/ou les forums.

Les commentaires sont également des verbatims intéressants à étudier pour  l’e-réputation ou l’analyse d’opinions. En effet, c’est souvent dans ces derniers que les internautes expriment leurs pensées et leurs opinions sur un sujet.

Voici rapidement comment je fais pour collecter efficacement et rapidement des commentaires:

1) J’utilise AUTOVEILLE Monitoring et AUTOVEILLE Corpus pour faire ma collecte automatique (si vous voulez en savoir plus sur ces outils, je vous invite à aller sur mon site ou à m’écrire).

Exemple > Extraction des commentaires ci-dessous:

commentaires Figaro

2) Mes robots récupérent les commentaires au format HTML, et je fais une extraction de ces derniers dans un autre format exploitable par la plupart des outils de traitement automatique

Exemple > Les commentaires affichés dans ma Konsole (qui nécessitent bien évidemment encore quelques nettoyages)

commentaires-figaro-2

3)  Le corpus de commentaires extraits (à titre d’exemple)

Corpus et collecte de commentaires / verbatims

Chaque collecte pour créer un corpus de commentaires est étudié et personnalisé parce que chaque site ne présente pas les choses de la même façon. Il faut donc des outils adaptables pour rapatrier un maximum de verbatims.

 

N’hésitez pas à me donner vos avis, vos idées ou à m’écrire si vous voulez en savoir plus 🙂

Bon courage –

Véronique Duong

Bonjour à tous !

Un petit article sur l’opinion mining / analyse des opinions / des sentiments (bref, toutes les appellations possibles et inimaginables). A travers ce post, je souhaite faire comprendre aux personnes qui sont intéressées par ces domaines que l’analyse des opinions ou des sentiments ne peut (pour l’instant ?) se faire que manuellement pour assurer un maximum de qualité. En effet, aucune machine ou aucun outil peut déterminer la tonalité d’un texte. J’ai travaillé sur ce sujet à plusieurs reprises, testé des outils, développé mes propres outils, et les résultats en sortie étaient toujours assez peu précis.

En revanche, on peut toujours se servir d’un catégoriseur automatique pour faire le premier gros tri parmi les 1000000 contenus rapatriés lors de la collecte. Récemment, j’ai développé un catégoriseur de tonalités, mais je le mentionne une nouvelle fois, un tri à la main est obligatoire.

Pour travailler dans la e-réputation, je pense que les outils peuvent réellement intervenir lors de la fouille d’opinions (opinions mining), dans la collecte des contenus, en fait. Ces outils peuvent être une grande aide pour trouver tous les contenus possibles / existants sur un sujet, mais ensuite l’analyse de ces opinions doivent se faire, en grande partie, à la main. Non seulement, la qualité est assurée, mais en plus vous serez sûr de vous quand vous allez présenter les résultats aux clients.

analyse des sentiments, analyse des opinions, ereputation

Bon, je retourne constituer un corpus de tweets 😀

Bon courage !

Véronique Duong

Bonsoir !

J’ai décidé de poster un petit article sur Lexico 3, un outil de lexicométrie / textométrie fournissant des statistiques textuelles développé par l’Université Sorbonne Nouvelle.

Il y a deux ans (pratiquement jour pour jour !), je me suis servie de cet outil pour faire des analyses sémantiques (style « journalistique » et style « conversations en ligne » sur les forums, blogs, etc.), et cela avait bien marché. Les spécificités positives, négatives, statistiques textuelles sont précises, et permettent de faire de bonnes analyses.

Par exemple, pour le style « conversations en ligne », j’ai travaillé sur les contenus textuels du site communautaire Samestory. Il fallait catégoriser les verbatims en positif / neutre / négatif à l’aide de Lexico 3 (concordances / collocations / coocurrences). Vous remarquerez que les textes sont effectivement classés par tonalité dans le site:

tonalité discours samestory

Lexico 3 nous offre la possibilité d’avoir un outil de concordance pour identifier tous les contextes où chaque mot-clé qu’on aura déterminé se trouve. Un mot positif dans un contexte négatif a une tonalité négative, et vice-versa. Il faut également faire attention aux textes avec un ton ironique, humoristique, les sous-entendus, etc.

C’est pour cela que nous avons besoin d’analyser les contextes.

outil concordance lexico3

De plus, pour mesurer la présence d’un mot dans les contenus textuels, on peut utiliser les statistiques textuelles, et en former des graphes ou des histogrammes. La version histogramme est plus claire à mon goût car on voit tout de suite si un mot est plus présent dans une thématique par rapport à une autre, ou selon votre catégorisation:

histogramme Lexico 3

 

En tout cas, cet outil est utile pour faire de l’analyse sémantique reposant sur des statistiques textuelles. Je l’utilise également pour faire de l’analyse d’opinions.

La prise en main peut être un peu technique au début, mais on s’habitue très vite (si on l’utilise régulièrement). Lexico 3 prend un certain format de balises dans le corpus.txt à mettre en entrée.

Si vous voulez en savoir plus, je peux vous expliquer plus en détails avec les études que j’ai faites.

Bon courage 🙂

Véronique Duong

 

 

Hello tout le monde,

Je vais créer une catégorie « J’ai testé … » pour ce blog. Et le premier outil en liste est ERDIL CRM Analytics. Cet outil permet de faire une analyse sémantique automatiquement. Voici le test en image:

Image

Humainement, il m’a fallu 49 secondes pour déterminer la tonalité et les concepts du verbatim. L’outil a mis 0.03 secondes. Je pense que pour ce test en ligne, il y a déjà un grand corpus de verbatims tout prêt et annoté avec les tonalités et les concepts.

Toutefois, je trouve que l’outil peut être pas mal pour faire une première catégorisation des contenus collectés sur le web. Mais, il faut toujours une analyse humaine pour mieux définir les tons, les sens, etc.

Un outil comme celui-ci pourrait être tout à fait développer par un(e) ingénieur(e) linguiste :p car c’est notre coeur de métier (traitement automatique des langues).

Bon courage

Véronique Duong

%d blogueurs aiment cette page :