Traitement automatique des langues

Bonjour tout le monde !

EDIT : J’ai commencé un Doctorate in Business Administration (DBA) (ou en français « Doctorat en Administration des Affaires ») en école de commerce (chez l’Institut de Langues et de Commerce International) à Paris depuis le 9 novembre 2020. I can do it!

Nous traversons une période très particulière, et nous devons rester forts et solidaires. Cette période m’a aussi fait réfléchir. Le temps passe très vite, et il faut vivre sans regrets. J’ai donc décidé de reprendre mes démarches pour m’inscrire en doctorat et réaliser une thèse sur un sujet qui me tient à cœur, mais que je ne compte pas dévoiler avant que tout soit fait. En 2014, j’avais déjà un début de réflexion sur une thèse doctorale, mais certains blocages administratifs m’ont empêchée d’avancer, et avec la présidence du SEO Camp, la création de mon entreprise, les projets professionnels, la rédaction de mes ouvrages, il y avait un réel rush.

Il y avait un intérêt pour le sujet de thèse que j’avais, il y a 6 années en arrières :

these-doctorat-cifre-veronique-duong-2014

En 6 ans, voire 7 ans (je commencerai, je l’espère, le doctorat en 2021 si tout va bien), mon sujet s’est affiné, et je sais sur quoi je voudrais faire des recherches qui couplent à la fois traitement automatique des langues, référencement web et multilinguisme. Je pense à mon ancienne université pour faire ce doctorat, mais si l’école doctorale ne matche pas assez avec mon projet, je vais tenter de contacter d’autres écoles doctorales. Mais j’aurais préféré rester avec mon école initiale.

Cette recherche doctorale, je la vois comme un vrai projet de recherche et d’innovation pour les domaines du SEO et du TAL, et non seulement avoir le grade de docteur. Je suis passionnée par ces deux domaines et je souhaite vraiment investir le temps de ma vie professionnelle pour ces dernières. J’ai certes pas mal d’objectifs que j’aimerais atteindre, et ces objectifs ce sont vraiment des rêves aussi.

Pour le financement de ma thèse, on pensait à la CIFRE, mais s’il est possible de la financer moi-même, je tenterai tout pour le faire.

Voici l’explication de la CIFRE en infographie :

thèse CIFRE - Doctorat - Candidate Veronique DUONG - AUTOVEILLE

Source de l’image : ADCIFRESHS

AUTOVEILLE est né de mes recherches en Master 2, et peut être à l’issue de mes travaux en Doctorat, je vais créer un autre projet. L’idée est de créer une société plus tard autour, et donc, de l’emploi à venir.

Maintenant, j’espère juste trouver une école doctorale qui me suivra dans ce sens, et qui me permettra de faire des recherches.

Bon courage à tous, et ne laissez jamais tomber vos idées et vos envies ambitieux.

Véronique DUONG – Experte SEO international – Directrice RANKWELL

Apprentissage du #coréen par challenge, puis par passion … et pour le #SEO

23 septembre 2019

SEO Asie, SEO coréen, SEO Naver, Traitement automatique des langues, Webmarketing Asie

Poster un commentaire

Bonjour tout le monde !

Durant l’été 2019, j’ai appris le coréen en mode intensif, pendant deux semaines, à raison de deux heures par jour ! Je suis super contente d’avoir pris cette initiative et d’avoir investi mon temps et un budget dans cette formation. Je sais maintenant lire et écrire le coréen. Certains sons ressemblent au chinois et au japonais, et cela facilite ma compréhension de la langue. Je parle plusieurs langues asiatiques, et quand je dis que « je parle », c’est vraiment que je peux comprendre le sens de ce qu’on me dit, ou je sais lire et écrire.

Je maîtrise à l’heure actuelle :

Cantonais 粤语
Mandarin 普通话
Teochew 潮州话
Japonais 日文 – 日本語 (Nihongo)
Coréen 韩文 – 한글 (Hangeul)

Par exemple, le Khmer, je ne le compte pas, car je ne sais pas lire, ni écrire, je n’ai que des notions très basiques.

Le coréen, je l’ai appris par curiosité car tout le monde me disait qu’en parlant mandarin, et sachant lire en japonais (pour les sons), cela devrait être simple. Je me suis donc un peu lancer le défi (quand je vous dis que j’aime les challenges ! …). Les cours ont commencé le 19 août et se sont terminés le 30 août. Tous les soirs, après le travail, je faisais 2 heures de coréen. J’adorais, et j’ai commencé à me passionner … au point de vouloir partir à Séoul l’an prochain ! Je veux découvrir la culture coréenne, la langue, les locaux de plus près 🙂

Je travaille sur Naver (SEO coréen) et je ne savais pas encore lire quand j’ai commencé à me spécialiser sur ce moteur. Maintenant que je sais lire, je vais me spécialiser encore un peu plus sur le moteur coréen (et Yahoo! Japan, j’ai lis, écrit et parle plus japonais que coréen pour le moment) !

SEO Naver SEO coréen SEO Asie Véronique DUONG

Naver Datalab, outil pour trouver les tendances de recherche en Corée du Sud

SEO Naver - SEO Corée du Sud - SEO Coréen - Véronique DUONG

Certains mots en coréen ressemblent au chinois, et cela m’aide dans la compréhension. Dans Naver Datalab (équivalent de Google Trends ou Baidu Index), on y trouve des données portant sur un secteur ou un mot-clé spécifique.
Par exemple, ci-dessus, « Duty Free Shop 면세점 (myeonsejeom) » (en chinois 免税店 (mian shui dian)) est recherché entre 90 et 100 fois par jour, principalement par des femmes en Corée du Sud (78%) qui ont entre 20 et 30 ans. Les recherches se font principalement sur appareils mobiles. Analyser les data, c’est la base pour comprendre beaucoup de choses et mieux cibler ses stratégies.

Sinon, si je devais classer par ordre de difficulté, en termes d’écritures, voici mon classement personnel (du plus difficile au plus facile) :

Chinois traditionnel (le must du difficile avec les idéogrammes traditionnels)
Chinois simplifié
Japonais
Coréen

Dans mon apprentissage, j’ai commencé par le plus dur quand j’étais petite entre la primaire et le collège en chinois traditionnel, puis du collège à la fac, j’ai fait du chinois simplifié, et j’ai commencé le japonais il y a 2 ans (déjà !!), et on écrit avec les kanji qui viennent du chinois traditionnel. Si vous avez des enfants, je vous conseille cet ordre pour leur apprentissage. Après je ne sais pas s’ils voudront faire autant de langues que moi ^^’ (je suis une passionnée de langues et de linguistique à la base).

En faisant mettant à jour mon profil Linkedin, je maîtrise actuellement 7 langues. Cela m’a surprise car je ne compte pas tous les jours les langues que je parle. Je parle cantonais et français à un vrai niveau bilingue (langues maternelles) et je peux faire de l’interprétariat à l’improviste sans problème, l’anglais et le mandarin, j’ai un niveau professionnel complet, je le parle et l’écoute couramment, et on peut dire que j’ai aussi un niveau bilingue. Le teochew, je comprends tout car mon père me parle souvent dans cette langue (depuis bébé, donc c’est aussi une langue maternelle en fait), le japonais et le coréen, j’apprends, je découvre, je lis, je m’entraîne 🙂

Je souhaite un jour faire du russe et de l’italien, mais pour le moment, ce n’est pas prévu pour avant les 5 prochaines années à venir !

Bon courage à tous !

Véronique DUONG – Passionnée de l’Asie – Ingénieure linguiste multilingue – Experte SEO certifiée CESEO – Directrice associée RANKWELL

Publier des articles ou des nouvelles pages (ou pas) en août / pendant les vacances d’été ?

5 août 2019

Réferencement naturel (SEO), SEO international, Stratégie Webmarketing, Traitement automatique des langues

Poster un commentaire

Bonjour tout le monde,

Chaque année, arriver au mois d’août, c’est le calme dans les grandes villes (notamment Paris), et il y a une légère baisse des activités. La majorité des personnes sont en vacances, à l’étranger, et avec cette baisse d’audience en ligne comme dans la vie réelle, on peut se demander s’il est intéressant de publier des articles, des news, des nouvelles pages sur son blog ou site.

De mon point de vue, il faut continuer à publier car vous êtes en vacances, mais les algorithmes non ! Googlebot, Baiduspider, YandexBot, etc. sont tous là, et ils continuent à crawler vos sites, à chercher les nouveautés, les contenus récemment publiés, et s’ils n’en trouvent pas chez vous, ils vont aller passer plus de temps avec les sites des autres ! … Donc pensez à publier au moins une petite actualité par semaine, car je suis certaine que vous avez des choses à dire sur votre activité, vos nouveaux services, produits, idées à venir !

seo-articles-vacances-aout-veronique-duong

Source : image gratuite sur Pixabay

J’aime rédiger, et j’ai souvent de l’inspiration, mais cela m’arrive aussi d’avoir un manque d’idées de me dire … mais qu’est ce que je peux leurs raconter cette semaine … mais en réfléchissant 2 minutes, on a souvent pas mal de choses à partager, et ce n’est pas forcément que porter sur des compétences techniques. Je partage de plus en plus de choses sur ma vie professionnelle en tant qu’entrepreneure, auteure, conférencière, formatrice, spécialiste du SEO, etc. Ce sont des éléments tout aussi importants pour mon lectorat afin qu’ils sachent comment j’ai fait pour réussir à tout enchaîner en l’espace de quelques années. Parfois, j’ai aussi envie d’écrire sur certains faits comme les clients de mauvaise foi, les cas compliqués, etc. car la vie n’est jamais tout rose, mais on doit faire le maximum pour qu’elle soit bien.

Tout ça pour dire que pendant que vous êtes au repos, d’autres vont travailler leurs sites, et si vous ne gardez pas un œil sur vos sites, cela peut être impactant pour vous.

Bon courage à tous !

Véronique DUONG – Experte SEO international – Passionnée de SEO et de webmarketing – Directrice chez RANKWELL

Je voulais rédiger une thèse … je publie 3 ouvrages ! Un 4e en préparation – Mes conseils pour vous encourager et ne jamais baisser les bras

22 avril 2019

ingénierie linguistique, Réferencement naturel (SEO), Stratégie Webmarketing, Traitement automatique des langues

1 commentaire

Bonjour tout le monde !

Parfois, dans la vie, on ne sait jamais ce qui peut nous arriver. Si c’est une situation compliquée, sur l’instant, bien évidemment qu’on ne sent pas bien, et qu’on ne voit que les difficultés. Aujourd’hui, avec le recul, j’ai envie de revenir sur ce projet de thèse que je n’ai pas réalisé à cause de blocages administratifs (eh oui !), mais qui a vraiment bien évolué : au lieu de soumettre une thèse de doctorat (je ne suis pas devenue docteure), je suis devenue auteure d’ouvrages dans un domaine incontournable du web (et surtout ma passion) actuellement : le SEO.

La discussion autour d’un sujet de thèse, de trouver une école doctorale, etc. a commencé en octobre 2014, et j’avais à peu près les idées claires pour rédiger sur un sujet (que je ne vais pas dévoiler car on ne sait jamais) et les échanges avec celui qui aurait pu être mon directeur de thèse, Damien Nouvel, se sont poursuivis jusqu’en 2015 quand je vois que cela bloque côté administratif et employeur de l’époque (déjà embauchée plus de 9 mois dans l’entreprise … ça faisait déjà 3 ans que j’y étais, donc bon !).

these-doctorat-seo-veronique-duong

Premier retour sur la thèse 😉

La thèse aurait eu un aspect multilingue et linguistique très poussé, bien évidemment, car c’est l’ERTIM, l’école doctorale de l’INALCO qui l’aurait encadrée. Quand j’ai vu ces blocages administratifs alors que tout le monde avait la bonne volonté d’avancer, j’étais très « bouleversée ». Je me suis dit que je ne pourrais pas partager mes recherches et ma passion dans un manuscrit qui synthétise tout …

Mais c’est là que l’idée d’écrire un livre me vient. J’ai commencé à contacter différents éditeurs, et c’est grâce à mes professeurs (ou collègues ? comme je suis chargée de TD dans la même faculté) que j’ai eu mon éditeur qui a accepté très très rapidement mon projet original sur le SEO Baidu 🙂

La suite, vous la connaissez 🙂 … J’ai mon Knowledge Panel en tant qu’auteure dans Google : *emotions*

veronique-duong-ouvrages-seo

Comme quoi, il ne faut jamais baisser les bras ! Je suis actuellement à mon troisième livre prêt à publier, et un 4e (version anglaise du 3e) est en cours de préparation !

Bon courage à tous,

Véronique Duong – Ingénieure linguiste et experte SEO et webmarketing franco chinois depuis 2010 – Directrice chez Rankwell

Comment faire du SEO sans trop dépenser en outils SEO ? [Débutants]

19 novembre 2018

Mobile Marketing, Réferencement naturel (SEO), Stratégie Webmarketing, Traitement automatique des langues

Poster un commentaire

Bonjour tout le monde !

Lorsqu’on débute en SEO, on n’a pas forcément tous les outils (pour la plupart payants) à disposition, mais cela ne doit pas vous empêcher de vivre de votre passion (ce qui est mon cas !).

Quand j’ai commencé, je n’avais absolument rien, et pas beaucoup de sous à investir dans les outils. De ce fait, je me suis débrouillée avec les outils gratuits du marché, mais aussi (et heureusement) le langage Shell, le langage Perl. Mais je suis bien consciente que tout le monde ne sait pas forcément utiliser des lignes de commandes et la konsole d’Ubuntu ou autre (Linux).

outils-seo-gratuits-veroduong-autoveille

Aller, c’est parti pour ma petite liste d’outils 100% gratuits pour SEO débutants :

Audit SEO :

Google Search Console (santé du site, état d’indexation, etc.)
Xenu (Crawler)
Web developer (un couteau suisse très utile)

Etude de mots-clés :

Google Keyword Planner
Suggestions de mots-clés de Google
Regarder les sites des concurrents

Netlinking :

Backlinkwatch (site peu esthétique, mais qui dépanne assez bien, surtout pour voir les ancres principales)
SEO Backlink tool (app mobile) > J’en parle dans cet article : Outil SEO pour les liens externes ! Présentation de SEO Backlink Tool

Temps de chargement et compatibilité mobile :

Page Speed insights
Web page test
AMP validator

Suivi de positionnements et de trafic SEO :

Google Search Console
Google Analytics
SEO SERP Mojo (app mobile) > J’en parle dans cet article : SERP Mojo : une App mobile pour suivre vos positionnements SEO … partout !
Serposcope (un peu manuel et chronophage car il faut entrer les mots un à un dans l’outil, mais ça vaut le coup) :

serposcope-seo-veroduong-outils-seo-gratuits

Avec tous ces outils, on peut déjà avoir une bonne vue d’ensemble du SEO, et quant à la réalisation du projet. Pour avoir des données plus poussées, il vous faudra passer par les outils payants.

Si vous avez des questions, vous pouvez m’écrire à autoveille@gmail.com

Bon courage à tous !

Véronique Duong – Directrice associée chez Rankwell et Grande Passionnée du SEO

Ingénierie Linguistique x SEO : Mettre en place un crawler sémantique [PROJET]

22 octobre 2018

ingénierie linguistique, J'ai testé ..., Réferencement naturel (SEO), Traitement automatique des langues

1 commentaire

Bonjour tout le monde !

Je m’adresse à tous les content strategist, content specialist, toutes les personnes qui travaillent avec les contenus et qui ont besoin de les rendre SEO-friendly : On a mis en en place une solution automatique pour extraire les contenus des rubriques intéressantes (fiches produits, best sellers, actualités, etc.) d’un site afin qu’ils puissent être optimisés ensuite.

A l’heure actuelle, il n’existe pas vraiment d’outils ou de logiciels génériques (si ce n’est que des scripts sur-mesure) pour crawler les contenus textuels d’un site et qui puissent sortir des données exhaustives sur ces derniers.

Problématiques de Crawler de Contenu :

Est-ce que le site de mon client est optimisé sémantiquement parlant ?
➔ NON > OK, pas de chaîne de traitement à mettre en place
➔ OUI > Pour quels mots-clés ? (On n’a pas de crawler de contenu qui permet de les trouver automatiquement)
➔ Il faut ensuite calculer le poids des mots-clés dans le site au global (mais comment déterminer ce poids ?), et calculer la pertinence des pages par mots-clés (quel poids pour quel critère ? et quels documents parlent de ces mots-clés ?)
➔ Pour les mots-clés, on doit calculer les positions, les volumes de recherche, les poids et pertinence de ces derniers

On aura donc besoin de deux corpus : le corpus de test (le site du client), et un corpus d’apprentissage (les sites des concurrents), par exemple.

Exemple de scraping de contenu de fiches produits (extraction brute) :

crawler-semantique-seo-veroduong

On est à la phase prototype ! Si vous voulez rejoindre ce projet innovant, écrivez-moi vite à autoveille@gmail.com ou vduong@rankwell.fr

Bon courage à tous !

Véronique Duong – TAListe x SEO lover & Directrice @Rankwell

Hackathon CORIA-TALN 2018 : Fake ou pas Fake #fakenews

26 février 2018

Evenements SEO, ingénierie linguistique, Traitement automatique des langues

1 commentaire

Bonjour tout le monde !

SI vous suivez mon blog depuis un moment, vous savez certainement que je suis ingénieure linguiste de formation, et je suis méga sensible aux évolutions dans le monde du traitement automatique des langues !

L’an passé, j’ai fait le HackaTAL sur l’analyse d’opinions, et cela m’a rappelé beaucoup d’études et d’analyses que je faisais en Master 2 ! C’était génial, j’ai adoré 🙂 Et pour cause, c’était mon équipe, Wild, qui avait gagné le HackaTAL 2017 !

Cette année, le HackaTAL revient sur un sujet qui a été d’actualité : les Fake News !

fake-news-autoveille-veroduong-SEO

Je vous laisse découvrir le programme ci-dessous :

Description

Dans le cadre de la conférence TALN-RECITAL 2018, sera organisé un hackathon, la troisième édition côté CORIA (Hack Days) et TALN (HackaTAL) et sera dédié à des problématiques liées à la RI et au TAL. L’objectif est de réunir ces communautés autour de défis à relever à l’aide de données et briques logicielles, en consacrant ces journées à modéliser, prototyper, coder, expérimenter, développer, tester, évaluer, comparer, échanger, etc. – par équipes et dans une ambiance décontractée 🙂

Les tâches proposées cette année seront centrées sur la détection et le traitement des fake news (à préciser), en interaction avec le monde des médias et les journalistes. L’événement est ouvert à tous, ne nécessite pas de préparation particulière (sauf d’amener sa machine) et ne requiert pas de compétences spécifiques aux tâches que nous proposons : tout le monde est bienvenu !
Tâches

Quelques questions parmi celles évoquées :

peut-on caractériser le langage des fake news point de vue linguistique ?
peut-on évaluer une échelle sur laquelle placer un article quant à sa vérifiabilité ?
peut-on catégoriser des articles, par exemple dans les classes suivantes : fiables / parodiques / orientés / douteux (cf Datapol Science Po) ?
comment assister au mieux un journaliste dans sa tâche de debunking ?
est-il possible d’utiliser des sources d’informations telles que twitter (contenu) ou bien le web (graphe des liens) pour repérer les fake news ?

Pour en savoir plus, je vous invite à aller sur le site du Hackathon : https://hackatal.github.io/2018/

Je pense m’y inscrire pour cette session car j’ai très envie de me pencher sur le sujet des Fake news aussi !

Bon courage à tous !

Véronique Duong – Consultante SEO certifiée CESEO / Ingénieure Linguiste / Directrice associée @Rankwell

Les mesures de statistiques textuelles TF-IDF, Rappel, Précision vues par des experts en TAL #Interview n°1 : Damien Nouvel

19 février 2018

ingénierie linguistique, Interview, Réferencement naturel (SEO), Traitement automatique des langues

1 commentaire

Bonjour à tous !

Je vais vous proposer une petite série d’interviews d’experts en ingénierie linguistique, qui pour moi, est complètement corrélée au SEO / référencement naturel ! J’ai l’honneur de commencer cette série avec Damien Nouvel, maître de conférences à l’INALCO, et qui allait devenir mon directeur de thèses (mais à la place, j’ai publié deux bouquins ! car on ne fait pas les choses à moitié ici ;)) !

C’est parti pour l’interview :

Présentation de l’expert TAListe :

Je suis maître de conférences à l’Inalco, membre du laboratoire ERTIM. J’y travaille dans le domaine du traitement automatique des langues (TAL), en particulier sur la fouille de données textuelles et le multilinguisme pour une large variété de langues (occidentales et orientales) et pour des objectifs variés (translittération, désambiguisation lexicale, opinion, analyse textométrique, etc.). J’ai précédemment travaillé au LIMSI-CNRS (extraction d’information), à INRIA Alpage (mots hors-vocabulaire dans les fils de dépêches). Ma thèse, faite dans l’équipe BDTLN du LI de Tours, a porté sur la reconnaissance automatique des entités nommées (disons les noms propres), par d’extraction automatique de motifs séquentiels (de la fouille de données).

Comment définirais-tu la notion de TF-IDF ?

Le TF-IDF est une méthode historique, fondée dans les années 80, pour implémenter des outils de recherche d’information. L’exemple typique est le moteur de recherche, qui doit sélectionner les documents les plus pertinents pour une requête donnée. Une simple recherche booléenne dans les index donne trop de résultats, qui ne sont pas ordonnés. L’algorithme TF-IDF pallie cela en exploitant simultanément le nombre d’occurrences des termes (TF) et leur importance sémantique dans la collection de documents (IDF) pour ordonner les résultats, et présenter en haut de la liste ceux qu’un calcul statistique simple nous indique être les plus pertinents. D’autres algorithmes sont aujourd’hui plus performants, mais celui-ci reste fondateur car il est très fiable, solide et stable : il peut être implémenté facilement et constitue un excellent point de départ.

tfidf-interview-damien-nouvel-autoveille

Et pour le Rappel et la Précision ?

Pour expliquer ces deux mesures de qualité de résultats (par exemple pour un moteur de recherche), il faut faire appel à deux notions complémentaires : le silence et le bruit. Le rappel indique à quel point un algorithme donne tous les résultats attendus, sinon on dit qu’il y a du silence. La précision calcul la proportion de résultats ramenés sont pertinents, ceux qui ne le sont pas donnent du bruit. Le défi, en particulier en recherche d’information, est de trouver le meilleur compromis possible : il faut à la fois améliorer la précision et le rappel, ou, dit autrement, réduire le bruit et le silence ! Pour mesurer cela globalement, il existe une troisième métrique qui combine le rappel et la précision, que l’on appelle la F-mesure, qui est la moyenne (harmonique) des deux précédentes. Ceci dit, dans le domaine de la recherche d’information, si ces mesures restent valables, elles sont aujourd’hui moins utilisées au profit d’autres métriques plus adaptées.

Dans quels cas utilises-tu le TF-IDF ? et pourquoi ?

Le TF-DIF est implémenté dans de très nombreux langages sous forme de librairies, il nécessite très peu de programmation pour son implémentation et des ressources limitées (temps de calcul ou mémoire) lors de son exécution. Il est robuste et stable. Ainsi, lorsque je travaille sur des projets pour lesquels j’ai besoin de résultats rapidement et pour lesquels les exigences ne pas trop fortes en terme de pertinence, le TF-IDF convient très bien… si les exigences sont plus fortes, il est possible de s’en servir comme point de référence avant d’utiliser d’autres modèles plus sophistiqués, comme par exemple le LSA.
Il faut cependant noter que le TF-IDF n’exploite que les textes des documents. Ceci peut-être un avantage pour les bases documentaires, mais un inconvénient si des liens sont faits entre les documents (sur le web, les hyperliens) : ils apportent une information très importante, qui ne sera pas prise en compte par TF-IDF.

Aurais-tu un exemple concret lié à l’usage du TF-IDF ?

Une entreprise vous sollicite pour mettre en place un moteur de recherche interne sur ses documents et l’intégrer à son portail. Elle ne sait quel moteur choisir, s’il lui faut une solution gratuite ou payante et quelles technologies sont adéquates. Vous pouvez alors facilement et rapidement lui proposer un développement préliminaire : mettre en place un TF-IDF, permettre aux utilisateur de faire leurs premières requêtes, avant d’analyser les limites de cette première approche. Par la suite, selon les retours, il pourra être prioritaire d’améliorer le moteur, mais peut-être aussi de travailler sur la qualité des documents, la création de ressources adéquates pour améliorer les recherche, la mise en place d’autres fonctionnalités, etc. !

Comment vois-tu l’avenir du TAL ?

Plusieurs pistes émergent aujourd’hui. Les dernières avancées côté recherche se sont beaucoup focalisées sur l’utilisation généralisée du Deep Learning, qui a de nombreuses applications et réduisent les difficultés à mettre en œuvre certains traitements, en particulier pour la sémantique. Les progrès en reconnaissance vocale et l’engouement récent pour les systèmes de dialogues (dont les chatbots / robots) sont également très en vue et vont certainement remodeler en profondeur le paysage du TAL, à l’international comme en France. Nous constatons également l’impact, parfois trop peu visible, des systèmes de génération automatique de contenus (dont textuel), autant sur les forums que dans les médias et les réseaux sociaux, il faut être vigilant à cet égard, être conscient des limites et des risques, les utiliser à bon escient ! En lien avec cela, je me penche ces derniers temps sur la détection et la caractérisation des Fake News, qui représente à mes yeux un enjeu scientifique et sociétal majeur, nous allons d’ailleurs organiser un hackathon sur le sujet en mai.
Sur le fond, et comme je le dis souvent aux étudiants, il me semble que le TAL doit rester une discipline qui “permette aux humains de manipuler le langage par d’autres moyens et à une autre échelle”. Il est essentiel à mes yeux que les outils, ressources et technologies que nous développons restent au service du plus grand nombre !

Merci infiniment à Damien Nouvel d’avoir accepté de répondre à cette interview hyper enrichissante !

J’espère que vous comprenez mieux l’intérêt du TAL maintenant, et pourquoi je vous rabâche avec cela dans le monde du SEO 😉 C’est complétement lié !

Bon courage à tous,

Véronique Duong – Directrice associée chez Rankwell et consultante SEO certifiée CESEO !

Face à Face avec SEMRush : retour sur mon parcours et ma vision du SEO en 2018

17 janvier 2018

Chine, Evenements SEO, Interview, Mobile Marketing, Réferencement naturel (SEO), Stratégie Webmarketing, Traitement automatique des langues, Webinar

Poster un commentaire

Bonjour tout le monde !

Cela fait un peu plus d’un mois que j’ai donné mon interview / webinar / Face à Face avec SEMRush, et pour ceux qui n’ont pas pu suivre le « Face to Face« , je vous mets les questions de SEMRush auxquelles j’ai répondues, avec mes réponses pour chacune d’entre elles.

Le webinar a duré 1h, et c’était très intéressant de partager mon parcours professionnel et ma vision du SEO Google et Baidu pour 2018.

🎥 Interview : Face à Face avec @veroduong 🙌 sur les tendances #SEO 2018 !
Nous vous donnons rendez-vous Mardi 12 Décembre à 11:00
Inscription gratuite ➡️ https://t.co/cEljLNPGXf #WebMarketing #MarketingDigital #Interview #Webinar pic.twitter.com/EtwKwnb5WB

— Semrush France (@semrush_fr) December 10, 2017

Voici les questions posées par SEMRush (je ne mets pas toutes mes réponses dans l’article, mais voici à peu près mes réponses importantes) :

Face à Face avec Véronique Duong

Tu es relativement connue au sein de la communauté SEO francophone mais pour les gens qui ne te connaissent pas, parle nous un peu de toi ?
Pourquoi le SEO ? Comment tu t’es lancée dans ce domaine d’activité ? Qu’est-ce qui t’intéresse le plus en SEO ? Véro : Les tests techniques, et de voir quand ils fonctionnent !
En environ 5-6 ans tu as réussi à t’imposer dans le milieu du SEO français mais également en Asie, tu es l’une des stars montantes du SEO, explique-nous cette fulgurante ascension.
Actuellement, tu es gérante/directrice des opérations chez Rankwell, rédactrice de contenu sur ton blog Autoveille, formatrice SEO à l’INALCO (institut des langues) et présidente du SEO Camp ! Comment gères-tu tes journées ? Véro : J’en parle parfois dans mes articles concernant ma vie de consultante SEO, et j’ai une vraie organisation assez tenace pour tout faire entrer dans mon planning ! Les week-ends, je suis sur mon blog AUTOVEILLE, la semaine je suis à fond sur RANKWELL, et le SEO Camp, et je donnais des cours de SEO à des Master 2 tous les vendredis matins pendant le printemps 2017. Je pense renouveler l’expérience si le temps me le permet.
Être présidente du SEO Camp, que cela signifie pour toi ? Beaucoup de choses, mais surtout que je suis capable d’endosser une telle responsabilité, et que les SEO souhaitent aussi la différence : une femme, d’origine asiatique, jeune, et qui est à la fois spécialisée sur le SEO occidental et le SEO asiatique.
Tu es experte en SEO sur Baidu, pour notre audience, est-ce que tu peux nous donner quelques astuces importantes pour améliorer son référencement sur Baidu ?
Peux-tu nous citer les outils que tu utilises ou bien que tu conseilles à tes clients pour élaborer une campagne SEO ?
Le référencement naturel est en constante évolution, par quels moyens tu te tiens au courant de l’actualité, des dernières informations… ?
Quelles sont selon toi, les tendances pour le SEO en 2018 ? Sur quoi concentrer sa stratégie SEO pour 2018 ?

Vidéo Marketing :

Il est vrai que le contenu vidéo est en plein essor, (plus d’1 milliard d’utilisateur sur YouTube), mais comment se démarquer de toutes ces vidéos ?
Quelle type de contenu vidéo faut-il créer ? Y-a-t-il des règles à respecter ? Comment optimiser une vidéo ? Existe-t-il des outils ? Je pense qu’il n’y a pas de règles toutes définies, mais des contenus informatifs, éducatifs, sont à priser. Par exemple, je pense me mettre à vloguer sur les sujets liés au marketing, au webmarketing que ça soit en Europe ou en Asie ! Si je m’adresse au public de Hong Kong, je parlerai cantonais pour leur présenter les systèmes européens, et vice versa 😉 J’espère que cela intéressera du monde haha !

Optimisation de contenu :

D’après notre étude sur les RF, un contenu plus long est plus souvent présent dans les top résultats Google, donc faudra-t-il continué à privilégier ce genre de contenu en 2018 ? Oui, clairement ! Une page contenant plus de 1200 mots a plus de chance d’être crawlée par Google (donc d’être ré-indexée, et d’être classée par la suite).
A ton avis, est-il mieux de créer du contenu viral sans optimisation SEO ou créer un article de qualité moyenne avec un bon référencement ? Je dirais qu’il faut les deux : du contenu chaud, limite buzz pour dynamiser la marque ou le nom, et des contenus froids dans le but de maintenir le SEO du site avec de nouvelles landing pages à chaque fois.

Recherche Vocale (Voice Search) :

La recherche vocale devient-elle de plus en plus importante pour le référencement naturel ? Et quelles conséquences sur le SEO ?
Quelles optimisation SEO pour la recherche vocale ? Google veut des questions, et qu’on réponde aux questions 🙂
Faut-il craindre les appareils Google Home/ Amazon Echo pour sa vie privée ? Non, pas vraiment, et d’ailleurs j’en voudrais un !

Mobile (index mobile first, AMP, instant apps) :

Tu as affirmé dans l’un de tes articles qu’en Chine, les volumes de recherche sur mobile explosent par rapport à ceux qui proviennent des PC ! Tu peux nous expliquer pourquoi ce n’est pas encore le cas en France, en Europe et même aux US ? Je pense que les usages sont encore assez différents en Europe vs US vs Asie. En Asie, le mobile a explosé avec l’arrivée de WeChat qui est une app permettant de tout faire ! En Occident, on n’a pas encore l’habitude d’utiliser une seule et même app qui agrège tout. On a une app pour chaque chose : commander de la nourriture, un taxi, trouver un resto, etc. Alors que WeChat fait tout ! Même outil de communication B2B !
Que faire pour être considéré comme Index Mobile First ? Et que se passe-t-il si mon site n’est pas à jour ?
Quelles sont les points indispensables pour maintenir la présence de recherche mobile sur mon site ?
A partir de Février 2018, il sera obligatoire d’afficher le même contenu sur une page web classique et sa version AMP, sous peine de non prise en compte de cette dernière par Google ! Qu’en penses-tu ? (Source abondance). Je ne pense pas que Google soit si radical que ça, mais effectivement, l’AMP devient juste indispensable, et ne pas s’y mettre, c’est un peu « ne pas se mettre à jour » et « suivre la tendance actuelle ». Même pour la Chine, le MIP devient un must-have !

Réseaux sociaux :

Les réseaux sociaux un facteur important pour le SEO ? Pourquoi ? (Petite réponse rapide de ma part pour cet article : Les signaux des réseaux sociaux (abonnés, likes, partages, interactions générales sont très importants pour le SEO sur Baidu).
Faut-il créer un compte social en fonction des différents pays ou notre société est implémenté ? Je dirais qu’il faut vraiment s’adapter à la culture locale, et être là où sont les habitants locaux 🙂 Exemple : être sur VKontakte pour la Russie, être sur Café Naver, pour Naver en Corée, être sur WeChat en Chine !

Linkbuilding :

Quels sont tes conseils pour faire du Netlinking à la meilleure façon. Comment trouver les liens ?
Comment tu trouves tes ressources ? Partage ton expérience comment bien organiser ta stratégie d’information ?
Comment tu combats les liens de mauvaise qualité ? Et les liens toxiques ?
As-tu d’autres choses à rajouter ?

Voilà à peu près les questions que j’ai eues ^^

Voici le lien de la vidéo du live que vous pouvez voir et revoir !

Face à face avec Véronique Duong

Testez SEMRush sans plus attendre :

semrush-test-gratuit-veronique-duong

Bon courage à tous !

Véronique Duong – Spécialiste SEO passionnée

Taxinomie et ontologie en linguistique, quelle différence ? Et comment les utiliser en SEO ? Je vous explique

10 janvier 2018

Réferencement naturel (SEO), Stratégie Webmarketing, Traitement automatique des langues

Poster un commentaire

Bonjour tout le monde !

Dans un autre article, je vous expliquais que j’utilisais des ontologies sémantiques pour créer des relations sémantiques entre les pages d’un site (surtout depuis le menu), et aujourd’hui, je vais vous parler d’une autre notion en linguistique, la taxinomie 🙂

Déjà, qu’est ce que c’est que la taxinomie en linguistique ? Voici une définition scientifique du terme : « Classification d’éléments, de suites d’éléments formant des listes qui permettront, par leurs règles de combinaison, de rendre compte des phrases d’une langue (d’apr. Ling. 1972). » Source : http://www.cnrtl.fr/lexicographie/taxinomie

Il ne faut pas confondre la taxinomie et la taxonomie. C’est effectivement deux choses différentes : La taxinomie concerne plus spécialement les questions de classification, tandis que la taxonomie se rapporte strictement aux questions de nomenclature, de liste.

On rencontre très souvent des taxinomies en biologie et dans le monde scientifique.

Voici un exemple de taxinomie des bactéries :

classification-taxonomie-des-bacteries-autoveille

Source : http://andryrasamindrakotroka.e-monsite.com/medias/album/classification-taxonomie-des-bacteries-5.jpg

Comme pour les ontologies, on part du plus générique au plus spécifique. Mais vous allez vous demander ce qu’est la différence entre ontologies et taxinomies. Voici les définitions des deux termes :

L’ontologie est faite pour décrire le monde tel qu’il est. L’ontologie cherche à décrire de façon formelle un domaine de connaissance, en identifiant les types d’objets de ce domaine, leurs propriétés et leurs relations. En SEO, c’est plutôt les ontologies qu’on utilise car on est dans un mode de « relations » (et plus exactement de « relations sémantiques »).

Exemple d’ontologie où on voit les liens sémantiques :

ontologie-liens-semantiques-SEO-vduong

Source : upload.wikimedia.org/wikipedia/commons/b/b1/Mason-ontology.png

La taxinomie est fait pour classer des ressources dans des dossiers, des catégories. En d’autres termes, elle désigne la « science de la classification » et par extension tout système de classification/catégorisation. Donc, en SEO, les taxinomies peuvent nous aider bien structurer un site par exemple, en classant les différentes pages, à différents niveaux.

Ce sont vraiment deux concepts différents en linguistique qui peuvent être très intéressants à appliquer en SEO comme vous pouvez le constater là.

Si cela vous intéresse, je vous ferais aussi un petit article sur les mesures de Rappel et Précision que j’ai adorées utiliser en Master pour faire des statistiques textuelles !

Bon courage à tous !

Véronique Duong – Consultante SEO certifiée et passionnée

—📈 AUTOVEILLE par Véronique DUONG | Expert SEO international | Référencement multilingue

archive

Traitement automatique des langues

Accomplir un de mes objectifs : le Doctorat

Apprentissage du #coréen par challenge, puis par passion … et pour le #SEO

Publier des articles ou des nouvelles pages (ou pas) en août / pendant les vacances d’été ?

Je voulais rédiger une thèse … je publie 3 ouvrages ! Un 4e en préparation – Mes conseils pour vous encourager et ne jamais baisser les bras

Comment faire du SEO sans trop dépenser en outils SEO ? [Débutants]

Ingénierie Linguistique x SEO : Mettre en place un crawler sémantique [PROJET]

Hackathon CORIA-TALN 2018 : Fake ou pas Fake #fakenews

Les mesures de statistiques textuelles TF-IDF, Rappel, Précision vues par des experts en TAL #Interview n°1 : Damien Nouvel

Face à Face avec SEMRush : retour sur mon parcours et ma vision du SEO en 2018

Taxinomie et ontologie en linguistique, quelle différence ? Et comment les utiliser en SEO ? Je vous explique

Partagez sur:

Partagez sur:

Partagez sur:

Partagez sur:

Partagez sur:

Partagez sur:

Partagez sur:

Partagez sur:

Partagez sur:

Partagez sur: