archive

Archives de Tag: opinion mining

Bonjour Ă  tous,

Comme on me le demande souvent, j’ai dĂ©cidĂ© de faire un article pour vous montrer comment faire une veille automatique ainsi qu’une collecte automatique des tweets depuis Twitter.

Pour cela, je dĂ©veloppe un script Perl pour chaque crawl. C’est Ă  dire que j’adapte mes crawls en fonction du type d’Ă©lĂ©ments Ă  crawler. RĂ©cupĂ©rer des tweets est diffĂ©rent de rĂ©cupĂ©rer des pages web par exemple.

A partir d’une recherche de tweets par #hashtag, mot-clĂ© ou expressions clĂ©s, j’en crĂ©e un flux RSS que je passe sous AUTOVEILLE. Ensuite, mon logiciel de veille collecte les tweets au format XML, et je traite ce XML au format demandĂ© par le client.

Voici un exemple d’un tweet au format XML:

collecte automatique de tweets

Avec quelques lignes de commandes Bash (Shell), je récupÚre uniquement les liens vers mes tweets collectés:

collecte automatique de tweets

Encore un peu de nettoyage automatique pour retirer les balises link

tweets collectés

Voilà, avec cette collecte, vous pouvez sauvegarder vos précieux tweets. Pour les afficher, il suffit de les repasser au format XML ou HTML. En repassant au format HTML, on obtient des tweets dans ce format:

tweet-format-html

J’adapte chaque veille / chaque collecte au cas par cas comme vous pouvez le constater.

Bon courage !

VĂ©ronique Duong –

Publicités

Hello tout le monde !

Dans ma foulĂ©e des articles sur l’e-rĂ©putation / l’analyse des opinions et des avis d’internautes, je vous fais un petit article sur Douban, le Ciao chinois ! Douban est un comparateur d’avis et d’opinions sur divers sujets comme les livres, les films, les produits de beautĂ©, et autres.

Douban n’est pas aussi utilisĂ© que Weibo en Chine, mais il ne faut pas le nĂ©gliger car il comporte Ă©galement des avis qui pourraient ĂȘtre des informations pĂ©pites sur l’un de vos produits.

Alors comment faire pour utiliser Douban ?

1) Aller sur http://www.douban.com

2) Faire une recherche avec des mots-clés en chinois dans le champs ci-dessous

Douban recherche d'opinions sur les produits

3) Filtrer et trier vos résultats grùce au menu à gauche

douban menu gauchePour ceux qui ne lisent pas le chinois, voici une rapide traduction du menu:

  • Membre
  • Groupe
  • Entreprise / Organisation
  • Livres
  • Films
  • Musique
  • Trucs
  • Journal intime
  • Application mobile
  • ActivitĂ©s locales

4) Consulter les opinions d’un produit (j’ai pris un dĂ©maquillant de L’OrĂ©al :))

Douban / opinion sur l'Oréal

Pour poster un avis, il faut juste avoir un compte sur Douban. L’inscription est simple (contraitement Ă  Weibo.com oĂč il faut donner un numĂ©ro de tĂ©lĂ©phone chinois …).

Bon courage !

VĂ©ronique Duong

Bonjour Ă  tous !

Si vous me suivez sur Twitter, vous devriez déjà avoir vu passé un petit tweet sur cette nouvelle: je suis en train de développer deux outils >> un pour trouver les pages NON indexées par Google, et un autre pour catégoriser automatiquement en trois grandes catégories (positif / neutre / négatif) des contenus extraits depuis les réseaux et les médias sociaux.

Pour cet article, il est question de ce deuxiĂšme outil: le catĂ©goriseur automatique en positif, neutre et nĂ©gatif. Evidemment, je le disais dans mes posts prĂ©cĂ©dents, ce catĂ©goriseur ne pourra en AUCUN cas remplacer une analyse humaine des contenus qui devra ĂȘtre effecutĂ©e ensuite. Il permettra de faire un bon tri parmi l’ensemble des contenus collectĂ©s automatiquement avec AUTOVEILLE (par exemple).

Pour le moment, mon outil est composĂ© de 2 Ă©lĂ©ments indispensables: le catĂ©goriseur, le fichier d’entrĂ©e avec les verbatims. Trois fichiers (positif / neutre / nĂ©gatif) sont ensuite automatiquement gĂ©nĂ©rĂ©s par l’outil de catĂ©gorisation.

Voici dĂ©jĂ  un petit exemple gĂ©nĂ©rĂ© automatiquement pour le fichier « positif »:

Outil analyse Opinion Mining

Son développement est toujours en cours. Des nouveautés à venir trÚs bientÎt !

Bon courage

VĂ©ronique Duong

Hello tout le monde !

Je fais beaucoup de veilles, de SEO, mais Ă©galement des Ă©tudes et des analyses d’e-rĂ©putation !

Automatiser l’analyse des tonalitĂ©s dans les verbatims = pratiquement impossible pour le moment. Avec l’automatisation, on peut catĂ©goriser les contenus en deux grands thĂšmes comme « positif » / « nĂ©gatif », et encore … car un poste avec pleins de termes Ă  tonalitĂ© positif peut ĂȘtre Ă©crit avec un ton ironique et moqueur, et vice versa. Vous voyez ce que je veux dire.

De ce fait, pour une analyse sérieuse des opinions, il faut une analyse humaine.

Avec AUTOVEILLE monitoring, je constitue mon corpus de verbatims en collectant automatiquement ces derniers via les blogs, forums, Twitter, Facebook, etc. Puis, je trie ces contenus avec mon moteur de recherche interne pour extraire les meilleurs, et je les analyse de façon humaine pour les catégoriser en positif / neutre / négatif.

Faites attention aux agences qui vous disent qu’ils ont des outils pour faire l’analyse. Ils ont des outils pour collecter, mais pour analyser et catĂ©goriser, ça doit rester le travail des humains, et non des robots :).

opinion-mining-ereputation

Surveillez votre rĂ©putation sur le web ! 😉

VĂ©ronique

%d blogueurs aiment cette page :