archive

Archives de Tag: opinion mining

Bonjour à tous,

Comme on me le demande souvent, j’ai décidé de faire un article pour vous montrer comment faire une veille automatique ainsi qu’une collecte automatique des tweets depuis Twitter.

Pour cela, je développe un script Perl pour chaque crawl. C’est à dire que j’adapte mes crawls en fonction du type d’éléments à crawler. Récupérer des tweets est différent de récupérer des pages web par exemple.

A partir d’une recherche de tweets par #hashtag, mot-clé ou expressions clés, j’en crée un flux RSS que je passe sous AUTOVEILLE. Ensuite, mon logiciel de veille collecte les tweets au format XML, et je traite ce XML au format demandé par le client.

Voici un exemple d’un tweet au format XML:

collecte automatique de tweets

Avec quelques lignes de commandes Bash (Shell), je récupère uniquement les liens vers mes tweets collectés:

collecte automatique de tweets

Encore un peu de nettoyage automatique pour retirer les balises link

tweets collectés

Voilà, avec cette collecte, vous pouvez sauvegarder vos précieux tweets. Pour les afficher, il suffit de les repasser au format XML ou HTML. En repassant au format HTML, on obtient des tweets dans ce format:

tweet-format-html

J’adapte chaque veille / chaque collecte au cas par cas comme vous pouvez le constater.

Bon courage !

Véronique Duong –

Publicité

Hello tout le monde !

Dans ma foulée des articles sur l’e-réputation / l’analyse des opinions et des avis d’internautes, je vous fais un petit article sur Douban, le Ciao chinois ! Douban est un comparateur d’avis et d’opinions sur divers sujets comme les livres, les films, les produits de beauté, et autres.

Douban n’est pas aussi utilisé que Weibo en Chine, mais il ne faut pas le négliger car il comporte également des avis qui pourraient être des informations pépites sur l’un de vos produits.

Alors comment faire pour utiliser Douban ?

1) Aller sur http://www.douban.com

2) Faire une recherche avec des mots-clés en chinois dans le champs ci-dessous

Douban recherche d'opinions sur les produits

3) Filtrer et trier vos résultats grâce au menu à gauche

douban menu gauchePour ceux qui ne lisent pas le chinois, voici une rapide traduction du menu:

  • Membre
  • Groupe
  • Entreprise / Organisation
  • Livres
  • Films
  • Musique
  • Trucs
  • Journal intime
  • Application mobile
  • Activités locales

4) Consulter les opinions d’un produit (j’ai pris un démaquillant de L’Oréal :))

Douban / opinion sur l'Oréal

Pour poster un avis, il faut juste avoir un compte sur Douban. L’inscription est simple (contraitement à Weibo.com où il faut donner un numéro de téléphone chinois …).

Bon courage !

Véronique Duong

Bonjour à tous !

Si vous me suivez sur Twitter, vous devriez déjà avoir vu passé un petit tweet sur cette nouvelle: je suis en train de développer deux outils >> un pour trouver les pages NON indexées par Google, et un autre pour catégoriser automatiquement en trois grandes catégories (positif / neutre / négatif) des contenus extraits depuis les réseaux et les médias sociaux.

Pour cet article, il est question de ce deuxième outil: le catégoriseur automatique en positif, neutre et négatif. Evidemment, je le disais dans mes posts précédents, ce catégoriseur ne pourra en AUCUN cas remplacer une analyse humaine des contenus qui devra être effecutée ensuite. Il permettra de faire un bon tri parmi l’ensemble des contenus collectés automatiquement avec AUTOVEILLE (par exemple).

Pour le moment, mon outil est composé de 2 éléments indispensables: le catégoriseur, le fichier d’entrée avec les verbatims. Trois fichiers (positif / neutre / négatif) sont ensuite automatiquement générés par l’outil de catégorisation.

Voici déjà un petit exemple généré automatiquement pour le fichier « positif »:

Outil analyse Opinion Mining

Son développement est toujours en cours. Des nouveautés à venir très bientôt !

Bon courage

Véronique Duong

Hello tout le monde !

Je fais beaucoup de veilles, de SEO, mais également des études et des analyses d’e-réputation !

Automatiser l’analyse des tonalités dans les verbatims = pratiquement impossible pour le moment. Avec l’automatisation, on peut catégoriser les contenus en deux grands thèmes comme « positif » / « négatif », et encore … car un poste avec pleins de termes à tonalité positif peut être écrit avec un ton ironique et moqueur, et vice versa. Vous voyez ce que je veux dire.

De ce fait, pour une analyse sérieuse des opinions, il faut une analyse humaine.

Avec AUTOVEILLE monitoring, je constitue mon corpus de verbatims en collectant automatiquement ces derniers via les blogs, forums, Twitter, Facebook, etc. Puis, je trie ces contenus avec mon moteur de recherche interne pour extraire les meilleurs, et je les analyse de façon humaine pour les catégoriser en positif / neutre / négatif.

Faites attention aux agences qui vous disent qu’ils ont des outils pour faire l’analyse. Ils ont des outils pour collecter, mais pour analyser et catégoriser, ça doit rester le travail des humains, et non des robots :).

opinion-mining-ereputation

Surveillez votre réputation sur le web ! 😉

Véronique

%d blogueurs aiment cette page :