archive

Archives de Tag: e-reputation

Bonjour tout le monde !

Comme vous le savez tous, de formation, je suis ingĂ©nieure linguiste, et je suis autant passionnĂ©e par le TAL que par le SEO. Je dirais toujours que c’est le TAL qui m’a menĂ©e vers le SEO car j’ai vu le lien entre ces deux domaines dĂšs le dĂ©but : Linguistique x Informatique en TAL, et SĂ©mantique x Technique en SEO. Je me dĂ©finirais toujours comme une spĂ©cialiste du SEO et du Traitement Automatique des Langues. Il y a moins d’Ă©vĂ©nements sur le TAL que le SEO, et je trouve cela extrĂȘmement dommage car le TAL, la science du langage a tout le mĂ©rite de se faire connaĂźtre.

En TAL, on produit des outils, des scripts qui servent, qui sont utiles pour des expĂ©riences scientifiques, et cela permet de faire progresser la R&D pour beaucoup de choses. Typiquement, j’utilise mes compĂ©tences en TAL pour automatiser certaines phases super chronophages (nettoyage des textes, optimisation des mĂ©ta tags, etc.). autant que possible.

Pendant ce HackaTAL 2017 qui s’est dĂ©roulĂ© Ă  OrlĂ©ans, au Lab’O (incubateur de start-ups dans le numĂ©rique), on a eu droit Ă  quelques petites confĂ©rences d’entreprises spĂ©cialisĂ©es dans le TAL, telles que Recital (gĂ©nĂ©ration de rĂ©sumĂ© automatique), Mood Messenger, etc.

On avait des tùches trÚs précises à réaliser, et voici les consignes officielles :

TĂąches

1. Résumé automatique de commentaires sur des produits en ligne

Objectifs

Dans le cadre de la promotion de produits sur les plateformes en ligne, l’apprĂ©ciation peut ĂȘtre analysĂ©e Ă  partir des retours utilisateurs (User Generated Content). Ces derniers peuvent se prĂ©senter : notes, Ă©toiles, mais aussi avis et commentaires textuels. Les notes n’étant pas toujours en adĂ©quation avec les contenus textuels, de plus en plus d’acteurs cherchent Ă  qualifier l’opinion des utilisateurs et Ă  dĂ©terminer quels sont leurs arguments.

La thĂ©matique est orientĂ©e sur les avis et commentaires concernant l’offre de logements en rĂ©gion centre (particuliers, auberges, hĂŽtels, luxe, etc.). Il s’agira de construire un rĂ©sumĂ© automatique des commentaires, Ă  partir des arguments dĂ©tectĂ©s dans ces derniers, Ă  comparer aux notes et/ou Ă  la description. Ce rĂ©sumĂ© orientĂ© devra ĂȘtre sĂ©parĂ© en deux champs principaux : points positifs et points nĂ©gatifs sur des critĂšres communs : accueil, confort, services, propretĂ©, accessibilitĂ©, etc. D’autres champs peuvent ĂȘtre proposĂ©s par les participants selon les arguments extraits Ă  partir des commentaires.

Sous tĂąches

  • Traitement / dĂ©bruitage de donnĂ©es UGC
  • DĂ©tection et extraction d’arguments
  • AgrĂ©gation des valeurs par produits
  • DĂ©tection et rĂ©solution de contradictions
  • RĂ©sumĂ© automatique d’opinions sur les aspects

Données et évaluation

Collection de données représentant chaque produit en ligne (champs de description du produit, notes ou étoiles, liste des commentaires associés) en français et en anglais. Les données seront fournies sous-forme de corpus (pour le corpus collecté sur Internet) et/ou via des liens à télécharger (pour les données fournies par les partenaires, à préciser).

L’évaluation portera sur la capacitĂ© Ă  calculer automatiquement les scores pour chaque catĂ©gorie d’évaluation du produit (accueil, propretĂ©, emplacement, etc.). Pour chacun de ces scores, un argumentaire rĂ©sumĂ© automatiquement devra ĂȘtre fourni qui pourra faire l’objet d’évaluation qualitatives.

2. Identification des tendances stratégiques liées aux brevets

Objectifs

La stratĂ©gie de dĂ©pĂŽt de brevets par des entreprises ou des individus reprĂ©sente un enjeu considĂ©rable, qui a donnĂ© lieu Ă  des affaires mondialement connues (Apple vs Samsung, Microsoft vs Google). Cet outil juridique reste cependant difficilement accessible pour les entreprises de petite taille ou les individus. En particulier, il n’est pas Ă©vident de dĂ©terminer quelles technologies vont avoir tendance Ă  ĂȘtre l’objet de brevets, dans une optique de veille ou de prĂ©servation de la propriĂ©tĂ© intellectuelle.

La tĂąche proposĂ©e vise Ă  mieux modĂ©liser les mĂ©canismes qui permettent de prĂ©dire l’apparition de brevets pour des technologies en essor, par utilisation de mĂ©thodes d’IA et de TAL (terminologie et expressions multi-mots, catĂ©gorisation des brevets, Ă©volution des termes et des n-grams, prĂ©diction de tendances). L’objectif est de dĂ©terminer, au regard des donnĂ©es collectĂ©es sur des brevets (par ex. distribution des termes entre 2001 et 2009), quels brevets seront dĂ©posĂ©s (par ex. en 2010). Pour illustration : si “tactile” est recensĂ© avec une grande montĂ©e en 2010, pouvait-on prĂ©dire cette montĂ©e en exploitant les donnĂ©es de la dĂ©cennie prĂ©cĂ©dente ?

Sous tĂąches

  • PrĂ©traitement du langage et de la structure des brevets
  • Extraction de terminologies liĂ©es aux technologies
  • Comparaison des termes des brevets avec les sites technologiques
  • DĂ©tection de signaux faibles
  • Analyse et prĂ©diction de tendances

De mon cĂŽtĂ©, je me suis penchĂ©e sur le rĂ©sumĂ© automatique de commentaires sur des produits en ligne. J’ai dĂ©jĂ  eu des sujets similaires Ă  traiter, et je trouve cela plus concret et utilisable tout de suite derriĂšre (une fois que le script est prĂȘt, l’outil peut servir !! 🙂 ) On Ă©tait une Ă©quipe de 3 : deux dĂ©veloppeurs web et moi. La technologie utilisĂ©e Ă©tait du PHP, des Regex, de l’Ă©tiquetage de donnĂ©es, et la stratĂ©gie Ă©tait d’utiliser les mots ayant le plus de poids dans une phrase (adverbe, adjectifs, verbes). Avec cette mĂ©thode, on a eu un Rappel de prĂšs de 80% ! (Rappel = le nombre de documents correctement retrouvĂ© dans sa classe, PrĂ©cision = le nombre de documents correctement attribuĂ© dans sa classe (ex : pour le rappel, cela veut dire que le commentaire a bien Ă©tĂ© retrouvĂ© dans telle ou telle catĂ©gorie automatiquement, et la prĂ©cision correspond au fait si le commentaire est bien attribuĂ© positif / neutre / nĂ©gatif).

C’est mon Ă©quipe qui a gagnĂ© le HackaTAL 2017 !!! Je suis trĂšs contente que ma stratĂ©gie / rĂ©flexion marche (avec les ADJ, les ADV, etc.), et on s’est bien dĂ©brouillĂ© avec les dĂ©veloppeurs ! Un Grand MERCI Ă  Nicolas Le Flohic et Fanny Jan, mes co-Ă©quipiers.

hackatal 2017 - Ă©quipe Wild gagnante

Voici quelques clichés du HackaTAL 2017 :

La jolie photo de souvenirs devant le logo du Lab’O !

Présentations des projets de chaque équipe :

Ca code, ça code !! Prùs de 48 heures de scripting 😉

Toutes les Ă©quipes ont bien travaillĂ©es, et ce sont donnĂ©es Ă  200% !!! Un week-end intense avec de belles rencontres, des Ă©changes hyper intĂ©ressants, et … cela m’a redonnĂ©e une folle envie de me remettre dans le TAL !!

En tout cas, une chose est sĂ»r, la Science du Langage est une science qui a beaucoup d’avenir :

Je pense qu’il y a moyen qu’un jour, je retourne Ă  100% dans les Sciences du Langage, dans le Traitement Automatique des Langues. On verra ce que la vie me donnera !

J’espĂšre que cet article vous aura plu, il change un peu du SEO 😉

Un Ă©norme merci Ă  Damien Nouvel (ERTIM / INALCO), au Lab’O et tous ceux qui ont organisĂ© cet superbe Ă©vĂ©nement concret et intense !

Bon courage Ă  tous,

VĂ©ronique Duong – IngĂ©nieure Linguiste … avant tout 🙂 !

Publicités

Bonjour tout le monde !

Cela fait longtemps que je n’ai pas Ă©crit d’articles sur la e-rĂ©putation ou l’identitĂ© numĂ©rique (entre SEO, veille automatique, traitement automatique des langues, il faut un peu d’organisation …) ! Et grĂące Ă  l’illustration trouvĂ©e par mon logiciel de veille, je vais pouvoir me relancer rapidement sur le sujet.

Pour les personnes ou les entreprises possĂ©dant une Page Facebook, il est intĂ©ressant de l’optimiser le plus possible pour avoir une image numĂ©rique solide, et pour montrer que vos activitĂ©s Ă©voluent (postez souvent, proposez des Ă©vĂ©nements, attirez les gens, etc.)

Et afin d’optimiser une Page Facebook pour le Graph Search, il y a quelques astuces qui permettent de le faire plus « facilement », comme :

  • Choisir la bonne catĂ©gorie (^^)
  • Bien remplir les coordonnĂ©es de l’entreprise
  • ComplĂ©ter totalement le profil, les descriptions
  • Renseigner l’essentiel des informations (services, gammes de produits, etc.)
  • Mettre des mots-clĂ©s dans les descriptions (qui sont destinĂ©es aux utilisateurs de FB)
  • Obtenir le plus de « Like » possible (c’est un des facteurs de classements de pages … apparemment)
  • Poster rĂ©guliĂšrement des photos, des vidĂ©os, etc.

L’infographie ci-dessous, rĂ©alisĂ©e par RightOn – NoBull, propose quelques astuces trĂšs intĂ©ressantes Ă  prendre en considĂ©ration :

Optimiser sa page Facebook pour le Graph Search - AUTOVEILLE

Parlant d’e-rĂ©putation, je suis actuellement en train de lire et d’analyser une Ă©tude sur l’analyse des sentiments et de son automatisation, et j’avoue que c’est un domaine qui m’intĂ©resse Ă©normĂ©ment. Je m’Ă©tais lancĂ© dans la crĂ©ation d’un petit algorithme pour automatiser la catĂ©gorisation, mais toute seule, c’est assez « difficile », sachant que dĂ©pendant des sujets, on peut avoir des « tonnes » de commentaires Ă  analyser. Mais, c’est une affaire Ă  suivre 😉

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour Ă  tous !

Vous ne trouvez pas qu’il commence Ă  refaire froid ? L’Ă©tĂ© est fini ! Et pour lui dire Ă  l’annĂ©e prochaine, j’ai trouvĂ© une petite infographie sur les stratĂ©gies de communication des marques de glace sur les rĂ©seaux sociaux ! Merci Ă  ma veille automatique et Ă  mon logiciel de veille … je pense que manuellement, je ne serais jamais tombĂ©e sur cette infographie rigolote ! 🙂

C’est parti pour la bataille givrĂ©e !

Ben & Jerry’s semble ĂȘtre le champion en termes de communication sociale / digitale en ligne !

EDIT : Un bon buzz ! Des glaces gratuites offertes par Ben & Jerry’s en mai 2013

Une e-rĂ©putation se construit sur le long terme (le temps de se faire connaĂźtre, de promouvoir services et produits, de les vendre, d’avoir des tĂ©moignages et des avis, etc.)

Cette illustration a été réalisée par TrackMaven

Infographie réseaux sociaux Stratégies communications digitales AUTOVEILLE

Etudier la stratĂ©gie de vos concurrents peut vous aider Ă  comprendre les points Ă  travailler. Augmentez votre visibilitĂ© (et vos ventes) grĂące aux rĂ©seaux sociaux : promotions concrĂštes (il ne faut pas que les internautes aient une impression d’arnaques ou de publicitĂ©s mensongĂšres …), buzz, Ă©vĂ©nements, soirĂ©es, etc.

Bon courage Ă  tous !

VĂ©ronique D. –

Bonjour Ă  tous !

Ce week-end pour changer un peu des veilles automatiques d’infographies avec AUTOVEILLE, mon logiciel de veille, je vous propose de dĂ©couvrir un outil que je suis en train de dĂ©velopper pour identifier automatiquement les auteurs et les sources des articles.

Avec la big data, la curation, les partages sur les divers mĂ©dias sociaux et l’infobĂ©sitĂ©, parfois, on ne sait plus qui est l’auteur original d’un article ou d »une information. J’ai donc dĂ©cidĂ© (et surtout tentĂ©) de dĂ©velopper un nouvel outil pour extraire les auteurs et le maximum de sources pour retrouver le crĂ©ateur de l’article parmi une base de fichiers HTML que j’aurais collectĂ©s au prĂ©alable avec … AUTOVEILLE corpus.

Dans mon algorithme, j’y ai mis plusieurs rĂšgles pour pouvoir extraire un maximum d’Ă©lĂ©ments sur les auteurs. De ce fait, mon outil pourrait Ă©galement ĂȘtre utilisĂ© dans l’extraction des « auteurs-copieurs » d’articles, les plagiats et le duplicate content …

Voici un cas de figure que je suis en train d’Ă©tudier :

Je recherche sur le web si on m’a copiĂ© avec Google. Je copie/colle un extrait d’un de mes articles entre  »  »Â  dans le moteur de recherche.

Ensuite, j’aspire automatiquement toutes les pages qui contiennent cet extrait.

Puis, je télécharge les liens de ces pages sous forme de fichiers .html. Cela me crée une base.

Et au final, je lance mon algorithme d’identification d’auteurs, et je dĂ©couvre qui sont les auteurs qui ont repris mes contenus …

Voici un extrait de mon code source :

Outil extraction d'auteurs automatique big data AUTOVEILLEVoici ce que j’obtiens en rĂ©sultats :

RĂ©sultats extraction automatique d'auteurs AUTOVEILLEJ’ai identifiĂ© une personne qui reprend souvent mes contenus et qui les publient sur son blog. J’ai son nom et son prĂ©nom, son profil Google+, ainsi que les citations qu’il a repris de mes discours (vous reconnaĂźtriez mon style …)

Pour l’instant, mon outil est en cours de dĂ©veloppement. Je pense qu’un outil d’identification d’auteurs, pour trouver les plagiats, les duplicate content, ou tout simplement retrouver l’auteur original d’un article, pourrait ĂȘtre trĂšs utile pour affiner les tris des informations lors d’un processus de veille, par exemple.

Qu’en pensez-vous ? Toute suggestion est la bienvenue en tout cas. Et si vous souhaitez en savoir plus, Ă©crivez-moi !

Bon courage à tous 🙂

VĂ©ronique Duong –

 

Bonjour Ă  tous !

Juste un petit article trĂšs rapide pour vous rappeler que vous pouvez retrouver AUTOVEILLE, outil de veille automatique et d’automatisation sur les mĂ©dias sociaux suivants:

Linkedin: http://www.linkedin.com/in/veroniqueduong

Twitter: https://twitter.com/veroduong

Google+: https://plus.google.com/116862245349529851498/posts

NOUVEAU !! >> Facebook: https://www.facebook.com/pages/AUTOVEILLE/568073609912021

Hellocoton: http://www.hellocoton.fr/mapage/autoveille

Une prĂ©sence professionnelle et sĂ©rieuse sur les rĂ©seaux sociaux est un vrai bonus pour la e-rĂ©putation et la e-apparence d’une entreprise. N’hĂ©sitez pas Ă  modĂ©rer et Ă  gĂ©rer vos profils trĂšs rĂ©guliĂšrement pour Ă©viter qu’il y ait des commentaires nĂ©gatifs (insultes, racistes, hors sujets, etc.) sur vos profils.

Les réseaux sociaux sont des plateformes (pour la plupart) gratuites et pratiques pour faire du marketing, faire la promotion de votre marque, de vos produits, de vos services.

En tout cas, si vous aimez les conseils et/ou les astuces que je donne sur la veille automatique, sur les logiciels de veille, sur le rĂ©fĂ©rencement naturel (SEO), sur la linguistique, ou si vous avez des suggestions, n’hĂ©sitez pas Ă  vous manifester sur l’un de mes mĂ©dias sociaux !

Vous pouvez liker, googleplusser, tweetter, linkedin-er, hellocoton-er !! Au choix 😉

icÎnes des réseaux sociaux

Bon courage !

VĂ©ronique Duong –

 

Bonjour tout le monde !

Aujourd’hui, je vous propose un article avec quelques conseils sur l’optimisation du SEO d’un site. Faire du SEO, c’est bon pour la santĂ© du site, mais faire trop de SEO, c’est mauvais. Comme tout excĂšs me diriez-vous. On appelle cela de la sur-optimisation, et il faut Ă©viter mĂȘme si on est tentĂ© de faire cela pour arriver sur la 1ere SERP.

1) Utilisez les termes et la phrasĂ©ologie de votre client. Cela est trĂšs important pour l’image de la marque. Si votre client veut se positionner sur quelques expressions moins recherchĂ©es mais qui relĂšvent de leurs domaines, il faut les utiliser.

2) Employez systĂ©matiquement les noms des produits ou des services de votre client. Il ne faut pas modifier les appellations car cela peut Ă©galement « altĂ©rer » Ă  l’image de la marque.

3) Ne mettez pas tout le temps le mĂȘme mot-clĂ© dans les pages. Il faut varier, utiliser des synonymes, des expressions plus longues ou plus courtes qui veulent dire la mĂȘme chose. Il faut que le vocabulaire soit le plus riche possible.

4) Ne faites pas de sur-optimisation. Cela ne va pas améliorer votre visibilité, au contraire.

5) Optimisez normalement, en produisant trĂšs souvent du contenu de qualitĂ©, et mettez les pages en ligne par « petit lot ».

6) Evitez de mettre 10000 pages en ligne d’un coup. Les moteurs de recherche vont trouver cela trĂšs suspect.

AprĂšs avoir optimisĂ©, soyez patient. Le SEO, c’est un processus sur le long terme. Il faut laisser le temps aux moteurs de recherche de trouver les pages, de crawler, d’indexer, de classer, etc. De temps en temps, il faut laisser la « magie » des moteurs de recherche agir.

Bon courage !

VĂ©ronique Duong –

Bonjour tout le monde !

Je vous ai prĂ©parĂ© un nouvel article sur les problĂ©matiques d’e-rĂ©putation et de SEO. RĂ©cemment, dans un autre billet, je vous parlais de nettoyage de sa e-rĂ©putation sur le web, et aujourd’hui, je vais plutĂŽt vous parler des premiers rĂ©sultats de recherche Google.

En effet, lorsqu’un internaute tape une marque (qu’il connait plus ou moins), un nom, ou encore un produit dans Google, et s’il tombe sur des remarques, des critiques, des contenus donnant une image nĂ©gative, cela peut rĂ©ellement influencer ce dernier sur ses choix (d’acheter le produit ou le service, par exemple).

J’ai effectuĂ© divers tests de rĂ©fĂ©rencement naturel appliquĂ©s Ă  des problĂ©matiques d’e-rĂ©putation, et il s’avĂšre qu’il faut absolument maintenir Ă  jour son site web ou ses comptes sur les rĂ©seaux sociaux avec des contenus riches et intĂ©ressants pour toujours afficher une image clean (et pro) dans les SERP 🙂

Par exemple, lorsqu’on tape « logiciel veille automatique » ou « outil veille automatique« , AUTOVEILLE occupe toutes les positions au dessus de la ligne de flottaison.

Avec l’expression « logiciel veille automatique« , AUTOVEILLE occupe 9 positions sur 10 sur la 1ere SERP de Google:

logiciel veille automatique

De mĂȘme pour la requĂȘte « outil veille automatique« :

outil veille automatique AUTOVEILLE

En outre, je pense que vous n’en doutez pas, mais lorsqu’on tape ma marque AUTOVEILLE, j’occupe Ă©galement 9 positions sur 10 sur la 1ere SERP Google.

Avec ces exemples, vous pouvez donc constater que le référencement naturel joue un rÎle primordial dans votre maßtrise de la e-réputation. Pensez-y !

Bon courage !

VĂ©ronique Duong –

%d blogueurs aiment cette page :