Bonjour tout le monde !

Baidu a publiĂ© un communiquĂ© pour partager une astuce officielle sur l’accĂ©lĂ©ration de l’indexation de nouvelles pages crĂ©Ă©es. En effet, dans les webmaster tools de Baidu (Zhanzhang Baidu), il existe un outil qui permet de soumettre manuellement des URLs afin de les rendre crawlable et indexable plus rapidement par le moteur de recherche chinois numĂ©ro 1 en Chine.

Je vous mets le communiqué officiel ici :

æ–°ç«™ćŠ ćż«æ”¶ćœ•çš„ć·„ć…·â€”â€”é“ŸæŽ„æäș€äč‹æ‰‹ćŠšæäș€

Dans l’article en chinois, on peut lire que suite Ă  la soumission des liens, dans le mois, les URLs devraient ĂȘtre indexĂ©es : « ç™ŸćșŠäč‹ć‰æŽšć‡șèż‡çœ‘ç«™ç™»é™†ćœ°ć€ïŒˆhttp://www.baidu.com/search/url_submit.htmïŒ‰ćŻä»„æäș€æ–°ç«™ç‚čïŒŒäœ†æ˜Żæäș€æ—¶çœ‹ćˆ°é‚Łć„â€œçŹŠćˆç›žć…łæ ‡ć‡†æ‚šæäș€çš„çœ‘ć€ïŒŒäŒšćœš1äžȘæœˆć†…æŒ‰ç™ŸćșŠæœçŽąćŒ•æ“Žæ”¶ćœ•æ ‡ć‡†èą«ć€„ç†ă€‚Â ç™ŸćșŠäžäżèŻäž€ćźšèƒœæ”¶ćœ•æ‚šæäș€çš„çœ‘ç«™â€èź©äșș有ç‚čæ‹…ćż§ïŒŒäž€äžȘ月ć€ȘæŒ«é•żäș†ă€‚ »

Mais Baidu dit aussi qu’il n’est pas certain de prendre en compte (donc indexer) toutes les URLs soumises manuellement. Certains webmasters trouvent que l’indexation, en 1 mois, est Ă©galement trop longue. Si on compare avec Google, le moteur amĂ©ricain a parfois dĂ©jĂ  indexĂ© tout un site en 3 ou 4 jours ! Donc pour Baidu, c’est effectivement beaucoup plus long.

C’est bien beau tout cela, mais comment fait-on pour soumettre manuellement les liens Ă  Baidu ? TrĂšs simple, en deux Ă©tapes !

  1. Se connecter Ă  Baidu Webmaster tools, et choisir le site pour lequel on veut soumettre les nouvelles pages :

baidu-sitemap-soumission-urls-manuelle-autoveille

2. Choisir la soumission manuelle en suivant ce chemin 铟掄提äș€ > æ‰‹ćŠšæäș€:

baidu-sitemap-soumission-urls-manuelle-autoveille-2

Vous ne pouvez soumettre que 20 nouvelles URLs maximum d’un coup. Il faut laisser le temps Ă  Baidu de les voir, de les indexer.

Si vous avez des questions sur le SEO chinois, comment marche Baidu, les critĂšres SEO chinois, n’hĂ©sitez pas Ă  m’Ă©crire Ă  vduong@rankwell.fr ou autoveille@gmail.com !

Bon courage Ă  tous !

VĂ©ronique Duong – Directrice chez Rankwell Agency

Publicités

Bonjour tout le monde !

Plus les annĂ©es passent, plus je suis convaincue qu’une bonne organisation du temps permet vraiment de tout faire et de rĂ©ussir ! Pour ceux qui me suivent depuis un moment, vous devez sans doute savoir que je suis souvent sur 10 000 projets en mĂȘme temps. Je vous avais fait un article il y a un an environ sur ma vie de SEO, et depuis le temps, cela a bien Ă©voluĂ© ! C’est donc le moment de mettre Ă  jour mon article de Vis ma vie de Consultant SEO !

Depuis que je suis devenue entrepreneure en octobre 2017, ma vie quotidienne a changĂ©. Je suis encore plus occupĂ©e qu’avant 🙂 ben oui ! Mais bizarrement, je me sens aussi tellement plus libre !! Mais tellement plus ! Être sa propre chef, ça change tout (bien sĂ»r !)

Maintenant, j’ai un planning en semaine assez cadrĂ© : je commence le travail vers 10h / 10h30 (oui je dors assez du coup :)), et je termine vers 19h / 19h30. Il m’arrive parfois de travailler encore un peu chez moi, mais ce n’est pas tous les jours. Le sport, c’est toujours dans mon emploi du temps, et j’en fais 1 Ă  2 fois par semaine en mode intensif (les lundis, car ça me permet de bien commencer la semaine !).

planning-seo-veronique-duong-autoveille

Je fais aussi beaucoup plus d’activitĂ©s personnelles maintenant : cours de manga les samedis matins, cours de japonais les mardis soirs, cours de yoga les lundis, etc. Je m’occupe de mes blogs perso les samedis et dimanches matins aussi. J’adore avoir ce rythme !

Tout est noté dans mon agenda afin de ne rien oublier !

Sinon, comme je vous disais auparavant, avec ma nouvelle fonction de Responsable Communication chez l’Association des Jeunes Chinois en France (AJCF), je suis aussi pas mal occupĂ©e les samedis et dimanches aprĂšs-midi par les activitĂ©s de l’asso.

Le SEO Camp, qui fait toujours partie de ma vie actuellement, je m’en occupe pendant la semaine. Le samedi ou dimanche soir, j’envoie toujours un point hebdo qui rĂ©capitule tout ce qui a Ă©tĂ© fait pendant la semaine au Conseil d’Administration (suite Ă  mon call avec Dimitri, notre permanent).

J’aime quand les choses sont cadrĂ©es, organisĂ©es, casĂ©es lol … j’ai l’air trĂšs « control freak » comme ça, mais il n’y a que comme ça que les choses avancent et marchent.

AprĂšs, je sais aussi m’amuser, sortir, rester en famille et je pense que cela reste extrĂȘmement important pour avoir une vie Ă©quilibrĂ©e.

Et vous ? comment ĂȘtes-vous organisĂ©s ? N’hĂ©sitez pas Ă  commenter et Ă  partager votre expĂ©rience !

Bon courage Ă  tous, et profitez bien de votre vie

VĂ©ronique Duong – Directrice associĂ©e @Rankwell

 

Bonjour tout le monde !

Je vous parle depuis un certain d’une fameuse association oĂč j’ai adhĂ©rĂ© depuis dĂ©cembre 2017 / janvier 2018, Ă  savoir l’Association des Jeunes Chinois en France (plus connue sous le nom de l’AJCF) ! Je pense que le nom de l’asso est assez parlant, mais je vous donne tout de mĂȘme la prĂ©sentation et les objectifs de cette derniĂšre :

« CrĂ©Ă©e en 2009, l’Association des jeunes chinois de France (AJCF), est une association Ă  but non lucratif (Loi du 1er juillet 1901) qui a pour objectif de « dĂ©velopper et rĂ©vĂ©ler le potentiel de la population d’origine chinoise de France pour contribuer pleinement Ă  l’enrichissement culturel et social de la France. »

L’histoire de l’AJCF
DerriĂšre ce but ambitieux, l’AJCF est avant tout une histoire, celle d’une jeunesse issue de cette France nouvelle : engagement citoyen, diversitĂ© culturelle, Ă©changes ouverts sur un forum internet, dĂ©bats sur des questions d’actualitĂ©, rencontre des membres convaincus, constitution d’une association.
Sacha LIN (ancien prĂ©sident et membre fondateur) raconte : « nous voulions crĂ©er un outil social pour les jeunes français-chinois, construire un espace indĂ©pendant de discussion et d’expression autour d’un projet associatif. »
Rui WANG (ancien Responsable du PĂŽle Etude et membre fondateur) se souvient : « on voulait crĂ©er un lieu de partage oĂč les jeunes français d’origine chinoise viennent trouver les ressources nĂ©cessaires Ă  leur Ă©panouissement, on voulait encourager les jeunes citoyens Ă  se rendre utile au sein de la sociĂ©tĂ©, le tout en gardant un esprit jeune et dynamique, sans craindre de faire ce qui n’a jamais Ă©tĂ© fait, vouloir agir pour voir ses rĂȘves se concrĂ©tiser ! » »

RĂ©cemment, Daniel Tran, prĂ©sident actuel de l’association et son bureau ont dĂ©cidĂ© de me nommer « Responsable Communication » de l’AJCF, et c’est un rĂ©el honneur pour moi de pouvoir porter la com’ de cette asso. Je me dĂ©cris tout le temps comme Ă©tant bi-culturelle française / asiatique (chinoise / khmer), et en rejoignant l’AJCF, cela ne fait que renforcer ce cĂŽtĂ© « double culture » que je possĂšde depuis la naissance. Je serais impliquĂ©e dans la plupart des projets de l’association. Je vous les prĂ©senterais un par un sur mon blog AUTOVEILLE.

Association des Jeunes Chinois en France - AJCF - AUTOVEILLE

Ah, et dans l’association, on utilise WeChat principalement (et j’ai dĂ©couvert la fonction « Mini Programs » qui est pas mal du tout pour faire tĂ©lĂ©charger un Ă©lĂ©ment ou faire un sondage, un vote) ! Voici un exemple :

Mini programmes dans WeChat SMO - AUTOVEILLE

Il permet d’envoyer le sondage dans le chat sous forme d’images, en voici un exemple :

Mini programmes dans WeChat SMO Chinois - AUTOVEILLE

En tout cas, avec un tel poste dans une association communautaire telle que l’AJCF, je vais devoir Ă©ventuellement travailler avec des mairies, des dĂ©putĂ©s, des journalistes, etc. et cela me donnera une expĂ©rience extrĂȘmement enrichissante. Sachant que je suis aussi prĂ©sidente du SEO Camp, une association professionnelle oĂč on veut faire reconnaĂźtre, donner un cadre et professionnaliser le mĂ©tier de SEO, je me rends compte que les objectifs de chaque association sont assez proches : la reconnaissance d’une profession, d’une communautĂ©, d’un droit.

L’association AJCF va avoir 10 ans en 2019, et je pense que ça va ĂȘtre une date qui marquera l’histoire des jeunes français d’origine chinoise : On existe, mais on est trĂšs peu reprĂ©sentĂ©, et peut ĂȘtre lĂ , enfin, on saura qui nous sommes.

Le texte ci-dessous est repris de la page Facebook de l’AJCF :

« Un lieu de partage privilĂ©giĂ©
Dans ce cadre unique, l’AJCF a progressivement pris forme Ă  travers ses interventions mĂ©diatiques, ses activitĂ©s, ses confĂ©rences et ses partenariats publics et associatifs. En son sein, converge une diversitĂ© d’hommes et de femmes issus de tous horizons et de toutes origines : journalistes, sociologues, historiens, chercheurs, employĂ©s, artisans, entrepreneurs, Ă©tudiants, amoureux de la Chine etc.

Son Ă©volution lui a montrĂ© que ses membres et sympathisants ne se retrouvaient pas Ă  travers un lieu de naissance ou des origines communes, mais Ă  travers des valeurs, des histoires, des aspirations, des vĂ©cues, des dĂ©ceptions ou des succĂšs partagĂ©s dans un cadre ouvert, ayant pour toile de fond une meilleure comprĂ©hension de l’immigration chinoise en France, des activitĂ©s-dĂ©couverte de la culture chinoise et des Ă©changes et interactions avec la Chine contemporaine.

Les défis à venir
L’annĂ©e 2015 – 2016 a Ă©tĂ© marquĂ©e par l’ancrage de l’AJCF en tant qu’interlocuteur privilĂ©giĂ© des questions chinoises en France avec l’accompagnement de la jeune gĂ©nĂ©ration Ă  la participation dans la sociĂ©tĂ© française, l’évolution des activitĂ©s de l’AJCF tel que le soutien scolaire en « mentoring » et le dĂ©veloppement des Ă©vĂ©nements AJCF comme la « Chinese Food Week » oĂč on fait dĂ©couvrir la gastronomie chinoise. »

Je remercie Alexandre Huang de m’avoir donner l’opportunitĂ© de connaĂźtre cette association !

Comme je travaille beaucoup avec la Chine (SEO Baidu, webmarketing chinois, SMO WeChat, Weibo, etc.) et que dans mon quotidien, je suis Ă  fond dans les dramas chinois (hahaha), la musique chinoise (mais pas que, j’Ă©coute de tout provenant d’Asie), je pense que l’AJCF va me permettre d’en apprendre encore plus sur la culture chinoise au fur et Ă  mesure !

Je vous posterais mon activitĂ© ici mĂȘme si je m’Ă©loigne un peu du SEO lĂ , mais ça reste de la communication / marketing en ligne, en plus liĂ© Ă  la Chine ! Donc, ce n’est pas loin du tout … en vrai !

Cela me demandera encore plus d’organisation car entre RANKWELL, AUTOVEILLE, SEO Camp et AJCF, il faut un planning bien cadrĂ©, mais pour le moment j’arrive Ă  tout faire entrer (en plus de mes activitĂ©s perso comme mes cours de japonais et de manga ;p).

Bon courage Ă  tous,

VĂ©ronique Duong – Directrice chez Rankwell … mais vraiment pas que !

Bonjour tout le monde !

Pour la 4e annĂ©e consĂ©cutive, je suis Ă  nouveau Blog Partner avec le SMX France ! Cette annĂ©e, l’évĂ©nement aura lieu les 12 et 13 juin 2018 !

Je suis Blog Partner depuis 2015, et j’ai enchaĂźnĂ© avec 2016, 2017, et maintenant 2018 ! Je remercie le SMX de renouveler leur confiance et leur partenariat avec moi ! En outre, je suis Ă©galement dans le Jury des Semy Awards pour cette troisiĂšme Ă©dition du concours ! Je serais membre du jury en tant que PrĂ©sidente du SEO Camp.

Je suis dĂ©jĂ  allĂ©e Ă  deux Ă©ditions de SMX France (2015 et 2017), et Ă  chaque fois, je fais des rencontres et je dĂ©couvre des confĂ©rences intĂ©ressantes ! En 2015, j’ai discutĂ© avec l’ancien webmaster de Bing, Duane Forrester, et il s’avĂšre qu’il m’a partagĂ©e quelques conseils SEO sur Bing Ă  l’Ă©poque, c’Ă©tait trĂšs sympa ! En 2017, j’ai pu interroger Yandex pour avoir des astuces SEO sur le moteur de recherche russe n°1, et la personne m’avait aussi conseillĂ©e sans souci.

Pour le networking, c’Ă©tait surtout lors des pauses et des repas qu’on pouvait discuter avec les autres, mais cela logique me diriez-vous … car le reste du temps, on Ă©coute les confĂ©rences !

Si vous voulez avoir une promotion sur votre billet, utilisez ce code coupon dĂšs aujourd’hui !! …… AUTO18 ……

Le programme de l’évĂ©nement est Ă  venir sur le site officiel, et je ne manquerai pas de le relayer sur mon blog ci-prĂ©sent Ă©galement !

SMX France 2018 - Blog partner AUTOVEILLE - VĂ©ronique Duong

Si vous avez des questions sur le SEO Google ou Baidu, vous pouvez toujours m’Ă©crire Ă  autoveille@gmail.com !

Bon courage Ă  tous !

VĂ©ronique Duong – Consultante SEO passionnĂ©e (avant tout) et Directrice associĂ©e @Rankwell

Bonjour tout le monde !

SI vous suivez mon blog depuis un moment, vous savez certainement que je suis ingénieure linguiste de formation, et je suis méga sensible aux évolutions dans le monde du traitement automatique des langues !

L’an passĂ©, j’ai fait le HackaTAL sur l’analyse d’opinions, et cela m’a rappelĂ© beaucoup d’Ă©tudes et d’analyses que je faisais en Master 2 ! C’Ă©tait gĂ©nial, j’ai adorĂ© 🙂 Et pour cause, c’Ă©tait mon Ă©quipe, Wild, qui avait gagnĂ© le HackaTAL 2017 !

Cette annĂ©e, le HackaTAL revient sur un sujet qui a Ă©tĂ© d’actualitĂ© : les Fake News !

fake-news-autoveille-veroduong-SEO

Je vous laisse découvrir le programme ci-dessous :

Description

Dans le cadre de la confĂ©rence TALN-RECITAL 2018, sera organisĂ© un hackathon, la troisiĂšme Ă©dition cĂŽtĂ© CORIA (Hack Days) et TALN (HackaTAL) et sera dĂ©diĂ© Ă  des problĂ©matiques liĂ©es Ă  la RI et au TAL. L’objectif est de rĂ©unir ces communautĂ©s autour de dĂ©fis Ă  relever Ă  l’aide de donnĂ©es et briques logicielles, en consacrant ces journĂ©es Ă  modĂ©liser, prototyper, coder, expĂ©rimenter, dĂ©velopper, tester, Ă©valuer, comparer, Ă©changer, etc. – par Ă©quipes et dans une ambiance dĂ©contractĂ©e 🙂

Les tĂąches proposĂ©es cette annĂ©e seront centrĂ©es sur la dĂ©tection et le traitement des fake news (Ă  prĂ©ciser), en interaction avec le monde des mĂ©dias et les journalistes. L’évĂ©nement est ouvert Ă  tous, ne nĂ©cessite pas de prĂ©paration particuliĂšre (sauf d’amener sa machine) et ne requiert pas de compĂ©tences spĂ©cifiques aux tĂąches que nous proposons : tout le monde est bienvenu !
TĂąches

Quelques questions parmi celles évoquées :

peut-on caractériser le langage des fake news point de vue linguistique ?
peut-on évaluer une échelle sur laquelle placer un article quant à sa vérifiabilité ?
peut-on catégoriser des articles, par exemple dans les classes suivantes : fiables / parodiques / orientés / douteux (cf Datapol Science Po) ?
comment assister au mieux un journaliste dans sa tĂąche de debunking ?
est-il possible d’utiliser des sources d’informations telles que twitter (contenu) ou bien le web (graphe des liens) pour repĂ©rer les fake news ?

Pour en savoir plus, je vous invite à aller sur le site du Hackathon : https://hackatal.github.io/2018/

Je pense m’y inscrire pour cette session car j’ai trĂšs envie de me pencher sur le sujet des Fake news aussi !

Bon courage Ă  tous !

VĂ©ronique Duong – Consultante SEO certifiĂ©e CESEO / IngĂ©nieure Linguiste / Directrice associĂ©e @Rankwell

Bonjour tout le monde !

Google a annoncĂ© le 26 janvier 2018 que la vitesse de chargement des pages d’un site dans les rĂ©sultats de recherche sur mobile va devenir un critĂšre de positionnements pour le SEO Ă  partir de juillet 2018 !

C’est vraiment, mais vraiment, le moment de s’y mettre aux sites mobiles : Responsive Design, AMP, Progressive Web Apps, Instant Apps, etc. Pensez Ă  tout cela ! Pour ceux qui n’ont pas encore de sites mobiles, ce n’est pas encore trop tard … il vous reste 6 mois, et vraiment ne tardez plus.

Je crois que je parle du mobile depuis 2013 ou 2014, et au bout de 4 ans, je vois encore tellement de sites non responsive design ! Pourtant c’est une bonne pratique pour l’ergonomie, mĂȘme avant de parler de SEO tout court.

Voici l’annonce officielle de Google, pour rappel :

La vitesse de chargement des pages comme critÚre de positionnement pour les recherches sur mobile 

Et voici le message officiel, important, de Google :

Nous encourageons les dĂ©veloppeurs Ă  rĂ©flĂ©chir aux consĂ©quences de la performance (ressource en anglais) sur l’expĂ©rience des internautes sur leur page et Ă  prendre en compte diffĂ©rentes statistiques sur l’expĂ©rience utilisateur (article en anglais). Bien qu’aucun outil ne puisse indiquer directement si une page est concernĂ©e par ce nouveau facteur de classement, nous mettons Ă  disposition de nombreuses ressources qui peuvent permettre d’Ă©valuer les performances d’une page :

  • Rapport d’expĂ©rience utilisateur Chrome : un ensemble de donnĂ©es publiques regroupant les principales statistiques sur l’expĂ©rience utilisateur pour les destinations les plus populaires sur le Web, telle que les internautes la vivent sur Chrome dans des conditions rĂ©elles (en fonction de leur appareil, de la qualitĂ© de rĂ©ception du signal mobile, etc…).

  • Lighthouse : un outil automatisĂ© qui fait partie des outils pour les dĂ©veloppeurs Chrome, utilisĂ© pour vĂ©rifier la qualitĂ© (performance, accessibilitĂ©, etc.) des pages Web.

  • PageSpeed Insights : un outil qui indique le niveau de performance d’une page dans le rapport d’expĂ©rience utilisateur Chrome et suggĂšre des optimisations des performances.

Vous l’aurez compris, l’expĂ©rience utilisateur et l’ergonomie passent mĂȘme avec le SEO … en fait je dirais que pour avoir un bon rĂ©fĂ©rencement, et avoir des visiteurs qui reviennent sur le site, il faut absolument que le site soit attirant et SEO-friendly, sinon, les internautes et les mobinautes n’auront pas envie de revenir.

vitesse-chargement-critere-positionnement-seo-autoveille-juillet-2018

Si vous avez des questions sur la mise en place de vos sites mobiles, contactez moi vite ! Je peux vous mettre en relation avec Solead Agency, agence de développement de sites web primés AWWWARDS ! Mon mail : vduong@rankwell.fr (ou autoveille@gmail.com)

Bon courage Ă  tous !

VĂ©ronique Duong – Consultante SEO certifiĂ©e CESEO et Directrice @Rankwell

Bonjour Ă  tous !

Je vais vous proposer une petite sĂ©rie d’interviews d’experts en ingĂ©nierie linguistique, qui pour moi, est complĂštement corrĂ©lĂ©e au SEO / rĂ©fĂ©rencement naturel ! J’ai l’honneur de commencer cette sĂ©rie avec Damien Nouvel, maĂźtre de confĂ©rences Ă  l’INALCO, et qui allait devenir mon directeur de thĂšses (mais Ă  la place, j’ai publiĂ© deux bouquins ! car on ne fait pas les choses Ă  moitiĂ© ici ;)) !

C’est parti pour l’interview :

PrĂ©sentation de l’expert TAListe :

Je suis maĂźtre de confĂ©rences Ă  l’Inalco, membre du laboratoire ERTIM. J’y travaille dans le domaine du traitement automatique des langues (TAL), en particulier sur la fouille de donnĂ©es textuelles et le multilinguisme pour une large variĂ©tĂ© de langues (occidentales et orientales) et pour des objectifs variĂ©s (translittĂ©ration, dĂ©sambiguisation lexicale, opinion, analyse textomĂ©trique, etc.). J’ai prĂ©cĂ©demment travaillĂ© au LIMSI-CNRS (extraction d’information), Ă  INRIA Alpage (mots hors-vocabulaire dans les fils de dĂ©pĂȘches). Ma thĂšse, faite dans l’équipe BDTLN du LI de Tours, a portĂ© sur la reconnaissance automatique des entitĂ©s nommĂ©es (disons les noms propres), par d’extraction automatique de motifs sĂ©quentiels (de la fouille de donnĂ©es).

Comment définirais-tu la notion de TF-IDF ?

Le TF-IDF est une mĂ©thode historique, fondĂ©e dans les annĂ©es 80, pour implĂ©menter des outils de recherche d’information. L’exemple typique est le moteur de recherche, qui doit sĂ©lectionner les documents les plus pertinents pour une requĂȘte donnĂ©e. Une simple recherche boolĂ©enne dans les index donne trop de rĂ©sultats, qui ne sont pas ordonnĂ©s. L’algorithme TF-IDF pallie cela en exploitant simultanĂ©ment le nombre d’occurrences des termes (TF) et leur importance sĂ©mantique dans la collection de documents (IDF) pour ordonner les rĂ©sultats, et prĂ©senter en haut de la liste ceux qu’un calcul statistique simple nous indique ĂȘtre les plus pertinents. D’autres algorithmes sont aujourd’hui plus performants, mais celui-ci reste fondateur car il est trĂšs fiable, solide et stable : il peut ĂȘtre implĂ©mentĂ© facilement et constitue un excellent point de dĂ©part.

tfidf-interview-damien-nouvel-autoveille

Et pour le Rappel et la Précision ?

Pour expliquer ces deux mesures de qualitĂ© de rĂ©sultats (par exemple pour un moteur de recherche), il faut faire appel Ă  deux notions complĂ©mentaires : le silence et le bruit. Le rappel indique Ă  quel point un algorithme donne tous les rĂ©sultats attendus, sinon on dit qu’il y a du silence. La prĂ©cision calcul la proportion de rĂ©sultats ramenĂ©s sont pertinents, ceux qui ne le sont pas donnent du bruit. Le dĂ©fi, en particulier en recherche d’information, est de trouver le meilleur compromis possible : il faut Ă  la fois amĂ©liorer la prĂ©cision et le rappel, ou, dit autrement, rĂ©duire le bruit et le silence ! Pour mesurer cela globalement, il existe une troisiĂšme mĂ©trique qui combine le rappel et la prĂ©cision, que l’on appelle la F-mesure, qui est la moyenne (harmonique) des deux prĂ©cĂ©dentes. Ceci dit, dans le domaine de la recherche d’information, si ces mesures restent valables, elles sont aujourd’hui moins utilisĂ©es au profit d’autres mĂ©triques plus adaptĂ©es.

Dans quels cas utilises-tu le TF-IDF ? et pourquoi ?

Le TF-DIF est implĂ©mentĂ© dans de trĂšs nombreux langages sous forme de librairies, il nĂ©cessite trĂšs peu de programmation pour son implĂ©mentation et des ressources limitĂ©es (temps de calcul ou mĂ©moire) lors de son exĂ©cution. Il est robuste et stable. Ainsi, lorsque je travaille sur des projets pour lesquels j’ai besoin de rĂ©sultats rapidement et pour lesquels les exigences ne pas trop fortes en terme de pertinence, le TF-IDF convient trĂšs bien
 si les exigences sont plus fortes, il est possible de s’en servir comme point de rĂ©fĂ©rence avant d’utiliser d’autres modĂšles plus sophistiquĂ©s, comme par exemple le LSA.
Il faut cependant noter que le TF-IDF n’exploite que les textes des documents. Ceci peut-ĂȘtre un avantage pour les bases documentaires, mais un inconvĂ©nient si des liens sont faits entre les documents (sur le web, les hyperliens) : ils apportent une information trĂšs importante, qui ne sera pas prise en compte par TF-IDF.

Aurais-tu un exemple concret liĂ© Ă  l’usage du TF-IDF ?

Une entreprise vous sollicite pour mettre en place un moteur de recherche interne sur ses documents et l’intĂ©grer Ă  son portail. Elle ne sait quel moteur choisir, s’il lui faut une solution gratuite ou payante et quelles technologies sont adĂ©quates. Vous pouvez alors facilement et rapidement lui proposer un dĂ©veloppement prĂ©liminaire : mettre en place un TF-IDF, permettre aux utilisateur de faire leurs premiĂšres requĂȘtes, avant d’analyser les limites de cette premiĂšre approche. Par la suite, selon les retours, il pourra ĂȘtre prioritaire d’amĂ©liorer le moteur, mais peut-ĂȘtre aussi de travailler sur la qualitĂ© des documents, la crĂ©ation de ressources adĂ©quates pour amĂ©liorer les recherche, la mise en place d’autres fonctionnalitĂ©s, etc. !

Comment vois-tu l’avenir du TAL ?

Plusieurs pistes Ă©mergent aujourd’hui. Les derniĂšres avancĂ©es cĂŽtĂ© recherche se sont beaucoup focalisĂ©es sur l’utilisation gĂ©nĂ©ralisĂ©e du Deep Learning, qui a de nombreuses applications et rĂ©duisent les difficultĂ©s Ă  mettre en Ɠuvre certains traitements, en particulier pour la sĂ©mantique. Les progrĂšs en reconnaissance vocale et l’engouement rĂ©cent pour les systĂšmes de dialogues (dont les chatbots / robots) sont Ă©galement trĂšs en vue et vont certainement remodeler en profondeur le paysage du TAL, Ă  l’international comme en France. Nous constatons Ă©galement l’impact, parfois trop peu visible, des systĂšmes de gĂ©nĂ©ration automatique de contenus (dont textuel), autant sur les forums que dans les mĂ©dias et les rĂ©seaux sociaux, il faut ĂȘtre vigilant Ă  cet Ă©gard, ĂȘtre conscient des limites et des risques, les utiliser Ă  bon escient ! En lien avec cela, je me penche ces derniers temps sur la dĂ©tection et la caractĂ©risation des Fake News, qui reprĂ©sente Ă  mes yeux un enjeu scientifique et sociĂ©tal majeur, nous allons d’ailleurs organiser un hackathon sur le sujet en mai.
Sur le fond, et comme je le dis souvent aux Ă©tudiants, il me semble que le TAL doit rester une discipline qui “permette aux humains de manipuler le langage par d’autres moyens et Ă  une autre Ă©chelle”. Il est essentiel Ă  mes yeux que les outils, ressources et technologies que nous dĂ©veloppons restent au service du plus grand nombre !

Merci infiniment Ă  Damien Nouvel d’avoir acceptĂ© de rĂ©pondre Ă  cette interview hyper enrichissante !

J’espĂšre que vous comprenez mieux l’intĂ©rĂȘt du TAL maintenant, et pourquoi je vous rabĂąche avec cela dans le monde du SEO 😉 C’est complĂ©tement liĂ© !

Bon courage Ă  tous,

VĂ©ronique Duong – Directrice associĂ©e chez Rankwell et consultante SEO certifiĂ©e CESEO !

%d blogueurs aiment cette page :