archive

E-réputation / Opinion mining

Bonjour à tous,

Comme on me le demande souvent, j’ai décidé de faire un article pour vous montrer comment faire une veille automatique ainsi qu’une collecte automatique des tweets depuis Twitter.

Pour cela, je développe un script Perl pour chaque crawl. C’est à dire que j’adapte mes crawls en fonction du type d’éléments à crawler. Récupérer des tweets est différent de récupérer des pages web par exemple.

A partir d’une recherche de tweets par #hashtag, mot-clé ou expressions clés, j’en crée un flux RSS que je passe sous AUTOVEILLE. Ensuite, mon logiciel de veille collecte les tweets au format XML, et je traite ce XML au format demandé par le client.

Voici un exemple d’un tweet au format XML:

collecte automatique de tweets

Avec quelques lignes de commandes Bash (Shell), je récupère uniquement les liens vers mes tweets collectés:

collecte automatique de tweets

Encore un peu de nettoyage automatique pour retirer les balises link

tweets collectés

Voilà, avec cette collecte, vous pouvez sauvegarder vos précieux tweets. Pour les afficher, il suffit de les repasser au format XML ou HTML. En repassant au format HTML, on obtient des tweets dans ce format:

tweet-format-html

J’adapte chaque veille / chaque collecte au cas par cas comme vous pouvez le constater.

Bon courage !

Véronique Duong –

Bonjour à tous !!

J’espère que vous avez passé des jours fériés agréables ! Alors aujourd’hui, en revenant au bureau (oui, je ne fais pas le pont), je découvre un mail de la part de mon responsable qui me « nomme chef de projet Google + » pour un super client du domaine dentaire professionnel. Je suis bien contente, mais cela veut dire qu’il faut redoubler ses efforts, ses stratégies, etc.

J’ai travaillé, et je travaille encore pas mal sur Google +. Vous pouvez lire mes billets sur ce réseau social en tapant dans la barre recherche « Google + ». Sinon, je vous invite à lire ces articles ci-dessous:

Guide des best practises de Google +

Google préfére Google + que Facebook, Twitter, etc.

Préférer Google + à Facebook

Voilà, je voulais partager cette petite nouvelle avec vous !!

Chef de projet SMO
Chef de projet SMO Google +

Bon courage !

Véronique D. –

Bonjour tout le monde !

J’espère que vous allez bien ! Alors un petit article très rapide pour vous parler d’analyse de verbatims / d’opinions en cantonais. Les internautes aiment l’originalité, et jusqu’à présent, vu que j’ai rarement vu des articles ou des travaux sur la langue cantonaise (粵語), je me lance ! GO !

Avec la Chine qui monte en pleine puissance, et Hong Kong qui est très très présent sur les marchés économiques et commerciaux, les entreprises européennes ont tout intérêt à s’intéresser aux marchés asiatiques.

Bon, pour ceux qui ont eu la curiosité de lire ma biographie ou mon profil Linkedin, vous avez dû voir que le cantonais est ma seconde langue maternelle. Cette langue est très très orale, et ce n’est que très récemment qu’elle a commencé à avoir ses propres caractères. Hong Kong a été à l’initiative de cette nouvelle écriture. Très bizarrement, je n’ai jamais appris à lire le cantonais, mais dès que j’ai eu ces caractères sous les yeux, j’ai réussi à les prononcer. Je pense que grâce à ma maîtrise du chinois mandarin, cela m’aide beaucoup.

Quand j’étais en Master 1 (wow, on remonte le temps là), j’avais effectué une recherche sur trois langues chinoises dont le mandarin, le cantonais et le teochew. Ces trois langues sont très très différentes les unes des autres. Vous pouvez lire le PowerPoint de cette recherche sur mon profil Academia.edu >> Linguistique comparative des langues chinoises aux langues occidentales.

Comment reconnaître qu’un verbatim est écrit en cantonais ?

Si vous lisez le mandarin, vous allez facilement lire un verbatim écrit en caractères chinois, par contre si vous tombez sur des caractères un peu « bizarre » dont vous n’avez jamais vu, cela est fort probable que c’est du cantonais. Quelques caractères chinois et cantonais qui veulent dire la même chose:

Exemple 1

Mandarin: 没有

Cantonais: 冇

Français: ne pas avoir

Exemple 2

Mandarin: 是

Cantonais: ä¿‚

Français: être / oui

Exemple 3

Mandarin: 什么

Cantonais: 乜

Français: quoi ?!

Vous voyez que les caractères chinois et cantonais ne se ressemblent pas du tout.

Pour finir cet article, je termine sur l’analyse d’un verbatim en cantonais rien que pour vous !

verbatim cantonais

Traduction: « Y a-t-il quelqu’un qui aurait déjà acheté une Rolex sur le site web hong kongais (chxxxx24), j’ai déjà posé des questions pour une montre 1166713ln (ref. de la montre) neuve vendue à 7000, dois-je faire confiance ? »

Tonalité: Doute de l’internaute vis à vis du site web / Demande d’avis / A déjà démarché auprès du site (globalement négative)
Par ailleurs, comment voulez-vous qu’une machine repère la tonalité de ce verbatim ? Il n’y a aucun terme à tonalité (joie / peine) dans ce contenu.

Bon courage ! 😉

Véronique Duong –

Hello tout le monde !

Dans ma foulée des articles sur l’e-réputation / l’analyse des opinions et des avis d’internautes, je vous fais un petit article sur Douban, le Ciao chinois ! Douban est un comparateur d’avis et d’opinions sur divers sujets comme les livres, les films, les produits de beauté, et autres.

Douban n’est pas aussi utilisé que Weibo en Chine, mais il ne faut pas le négliger car il comporte également des avis qui pourraient être des informations pépites sur l’un de vos produits.

Alors comment faire pour utiliser Douban ?

1) Aller sur http://www.douban.com

2) Faire une recherche avec des mots-clés en chinois dans le champs ci-dessous

Douban recherche d'opinions sur les produits

3) Filtrer et trier vos résultats grâce au menu à gauche

douban menu gauchePour ceux qui ne lisent pas le chinois, voici une rapide traduction du menu:

  • Membre
  • Groupe
  • Entreprise / Organisation
  • Livres
  • Films
  • Musique
  • Trucs
  • Journal intime
  • Application mobile
  • Activités locales

4) Consulter les opinions d’un produit (j’ai pris un démaquillant de L’Oréal :))

Douban / opinion sur l'Oréal

Pour poster un avis, il faut juste avoir un compte sur Douban. L’inscription est simple (contraitement à Weibo.com où il faut donner un numéro de téléphone chinois …).

Bon courage !

Véronique Duong

Bonjour à tous !

Dernièrement, je vous parlais souvent d’e-réputation. Dans un de mes articles précédents, je vous ai donné quelques pistes pour nettoyer votre réputation web si jamais elle a été « endommagée » par des verbatims à votre encontre.

Et aujourd’hui, dans cet article, je vais vous donner quelques astuces pour mettre en place une identité numérique solide et à long terme sur la première page Google.

1) Lorsqu’on tape votre marque ou votre nom, on doit vous trouver en 1er. Pour cela, il faut employer une sacré stratégie de SEO en produisant plus de contenus de qualité avec comme mot-clé principal, votre marque ou votre nom, et en trouvant des backlinks de qualité (sur les sites connus par exemple)

2) Que vous soyez un particulier, une entreprise ou autre, ayez un profil Linkedin complétement rempli et clair. Cela est très important.

3) Si vous avez un site, je vous conseille de créer un profil Google + si ce n’est pas encore fait (!). Dans le monde du référencement, on parle beaucoup du critère de l’Author Rank qui serait un futur facteur de ranking pour Google. Après avoir créé votre profil, liez ce dernier aux pages web de votre site.

4) Ayez un blog où vous pouvez produire souvent et dynamiser vos contenus en proposant des mises à jour, des nouveautés, etc. Innovez sans cesse. Les gens aiment tout ce qui est original.

5) Faites attention à ce que vous postez sur le web, surtout si vous signez avec votre marque et / ou votre nom.

6) Faites de la veille sur vous, votre marque, vos thématiques, etc.

Il y a encore d’autres astuces, mais ce sont les principales des principales à appliquer pour commencer tranquillement 🙂

E-réputation et identité numérique

E-réputation et identité numérique

 

Bon courage !

Véronique Duong