archive

Traitement automatique des langues

Bonjour tout le monde !

A travers ma veille stratĂ©gique du jour, mon logiciel de veille m’a rapatriĂ© une autre illustration trĂšs intĂ©ressante : comment optimiser le rĂ©fĂ©rencement d’un site en Parallaxe (= un site constituĂ© uniquement d’une seule page web Ă  faire dĂ©filer en longueur).

Comme je trouve beaucoup d’informations et d’infographies sur les problĂšmes liĂ©s au SEO et au webdesign, j’ai dĂ©cidĂ© de partager celle-ci sur le Parallaxe avec vous Ă©galement. Pour ceux qui ne savent pas ce qu’est le Parallaxe, voici deux exemples simples avec mon CV ou la chronologie d’Ă©volution d’AUTOVEILLE.

L’idĂ©e est donc d’optimiser au mieux l’unique Title, l’unique Meta Description, l’unique H1 qu’on a sur cette page / ce site. Le positionnement d’une seule et mĂȘme page web sur plusieurs mots-clĂ©s est trĂšs difficile (dĂ©jĂ  qu’avec plusieurs, c’est dur, alors qu’avec une, je vous laisse imaginer !). Sinon, il faut bien Ă©videmment mettre des mots-clĂ©s populaires Ă  ces endroits, mais Ă©galement mettre un minimum de contenu textuel au tout dĂ©but de la page en Parallaxe.

Comme une image vaut mille mots, voici l’infographie que j’ai reconstituĂ©e (les visuels ont Ă©tĂ© rĂ©alisĂ©s par Keneth Von Rauch de AWWWARDS) :

Infographie SEO : Comment optimiser une page en Parallaxe ?

 

L’astuce principale pour optimiser une page en Parallaxe, c’est d’externaliser tous les contenus (images, vidĂ©os, textes, etc.) dans des pages externes (fichiers HTML qu’on va appeler avec du JavaScript ou Jquery) ! Pas mal l’astuce je trouve !

Qu’en pensez-vous ? Avez-vous dĂ©jĂ  testĂ© cette technique ? A t-elle marchĂ© ?

Votre avis m’intĂ©resse, et n’hĂ©sitez pas Ă  commenter ou repartager l’article !

Bon courage Ă  tous,

Véronique Duong

Bonjour tout le monde !

Nous sommes un jour fĂ©riĂ©, mais rien ne m’empĂȘche de travailler pour mes sites ! Si vous avez veillĂ© rĂ©guliĂšrement sur les informations stratĂ©giques en SEO, vous avez dĂ» voir qu’il existe une nouvelle limitation des caractĂšres pour la balise title.

J’ai réécrit toutes les balises qui dĂ©passaient les 58 caractĂšres. Je suis mĂȘme restĂ©e un peu en dessous pour ĂȘtre sĂ»r que mes titres s’affichent complĂštement. Quand je venais de crĂ©er mon site, la limite Ă©tait fixĂ©e Ă  environ 70 caractĂšres, et cela me permettait de mettre plusieurs mots-clĂ©s dans le titre des pages web. Et je pense que tous les SEO faisaient plus ou moins cela 😉

NĂ©anmoins, certaines ont Ă©tĂ© réécrites par Google car le moteur de recherche a certainement trouvĂ© que mes titres Ă©taient parfois … trop optimisĂ©s. En me relisant, c’est vrai que quelques unes de mes anciennes pages comportaient trop de mots-clĂ©s populaires Ă  cet endroit stratĂ©gique …

Voici trois exemples oĂč mes titres ont Ă©tĂ© retravaillĂ©s par Google (certains des mots-clĂ©s populaires ont disparu, et le mot « Free » est mĂȘme apparu !) :

Titres AUTOVEILLE réécrits par Google

De plus, Ă  l’origine, ces titles Ă©taient trĂšs longs. Ils faisaient environ 68 caractĂšres. Avec le nouvel design, ils ne passent pas et s’affichent trĂšs mal. Je les ai donc réécris en restant autour de 55 – 56 caractĂšres (en dessous de 58). Avec cette nouvelle limitation, on est aussi beaucoup plus restreint au niveau de la crĂ©ativitĂ© et de l’ajout de mots-clĂ©s populaires. De ce fait, elle devrait bien empĂȘcher le Keyword Stuffing !

Si ce n’est pas encore fait pour vous, je vous conseille de revoir vos titles au plus vite pour avoir quelque chose de rĂ©optimiser proprement 🙂

Cela montre aussi que vous vous prĂ©occupez de votre site auprĂšs des internautes et des consommateurs en ligne. Surveillez et veillez trĂšs rĂ©guliĂšrement sur l’Ă©volution de vos pages web dans Google (et les autres moteurs bien sĂ»r !).

Bon courage Ă  tous !

VĂ©ronique Duong –

 

Bonjour tout le monde,

Hier, en effectuant ma veille stratĂ©gique d’informations SEO avec AUTOVEILLE Monitoring, mon logiciel de veille automatique, je suis tombĂ©e sur un article invitĂ© d’Alexandra Martin concernant l’utilisation des outils de Mind Mapping afin de structurer thĂšmes et idĂ©es pour de la rĂ©daction web. Ce type de logiciels peut ĂȘtre multi-usage : organisation d’idĂ©es, structuration d’un plan, dĂ©finition d’une stratĂ©gie, etc. C’est vraiment fait pour crĂ©er des cartographies mentales rapidement et efficacement.

La premiĂšre personne qui m’a parlĂ© de ces outils de Mind Mapping, est mon meilleur ami qui travaille avec moi sur ASVD.

FreeMind est le logiciel de cartographie que nous utilisons souvent. Pour des projets ou audits en e-rĂ©putation, il est souvent nĂ©cessaire de crĂ©er des graphes et des schĂ©mas pour illustrer les grands sujets et thĂšmes des diverses conversations en ligne. D’aprĂšs WikipĂ©dia, FreeMind est :

Un logiciel libre qui permet de crĂ©er des cartes heuristiques (ou Mind Map), des diagrammes reprĂ©sentant les connexions sĂ©mantiques entre diffĂ©rentes idĂ©es. Il est Ă©crit en langage Java. Il est disponible sous licence GNU GPL. FreeMind peut notamment aider Ă  l’organisation d’idĂ©es ou Ă  la gestion de projets.

Les fonctionnalitĂ©s sont donc trĂšs variĂ©es. Pour ma part, j’ai dĂ©cidĂ© de partager avec vous une (grande) cartographie que j’ai faite sur l’organisation d’un projet SEO / SMO. Ces deux domaines fonctionnent ensemble.

Cliquez sur l’image pour l’agrandir :

Organisation SEO / SMO - Cartographie FreeMind - AUTOVEILLE

 

 

Dans ma cartographie, j’ai mis :

  • les audits SEO (technique et sĂ©mantique)
  • les optimisations
  • les intĂ©grations
  • les suivis
  • les veilles stratĂ©giques (pour la partie SMO surtout)
  • l’e-rĂ©putation Ă  surveiller
  • l’animation des rĂ©seaux sociaux (Community Management)
  • + Quelques outils Ă  connaĂźtre absolument (Talkwalker, Google Alerts, Hootsuite, etc.)

Je l’ai faite rapidement (en 15-20 minutes …) et il manque surement des Ă©tapes Ă  dĂ©tailler. Si vous avez envie de m’aider Ă  la complĂ©ter, n’hĂ©sitez pas Ă  me laisser un commentaire et Ă  me dire ce que vous voulez ajouter (et Ă  quel nƓud !).

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour à tous 🙂

Ce matin, en effectuant nos veilles stratĂ©giques sur les informations SEO, des collĂšgues m’ont demandĂ© qu’est ce qu’Ă©tait « Sogou« .

Logo Sogou - AUTOVEILLE

Je me suis alors dit qu’il serait intĂ©ressant pour la communautĂ© SEO française de connaĂźtre ce moteur de recherche qui dĂ©tient prĂšs de 10,35% des parts de marchĂ©s en Chine !

AprÚs Baidu et 360 .cn, Sogou est le 3e moteur de recherche le plus utilisé dans le Pays du Milieu.

RĂ©partition parts de marchĂ© moteurs de recherche chinois en aoĂ»t 2013 - AUTOVEILLELes donnĂ©es ci-dessus datent d’aoĂ»t 2013. La part de marchĂ© de Sogou a progressĂ© de 2,35% depuis 2012. Elle est passĂ©e de 8% Ă  plus de 10%.

Sogou prĂ©sente des services trĂšs similaires Ă  ceux de Baidu … voire ceux de Google ! Sogou Images, Sogou News, Sogou Music, Sogou Videos, etc. tout y est pratiquement :

Services de Sogou - AUTOVEILLE

Sogou commence Ă  « copier » sur Baidu et Google en mettant en place aussi le Knowledge Graph ! Par exemple, lorsqu’on cherche Huawei dans le moteur, on a ce rĂ©sultat de recherche naturel (SEO) :

Résultats de recherche SEO - Sogou - AUTOVEILLE

 

Pour ce qui est des rĂ©sultats de recherche SEA sur Sogou, on a une image dans le snippet, les petits liens annexes (site-links) en plus en bas de l’annonce (comme on peut l’avoir avec Google) et le mĂȘme fond gris que Baidu avec la mention « æŽšćčż » pour qu’on sache que c’est une annone.

Sogou SEA - AUTOVEILLE

 

Sogou continue a gagnĂ© en parts de marchĂ© en Chine, et personnellement, je trouve que son interface est plus agrĂ©able Ă  utiliser que 360 .cn. Parfois, je trouve que Baidu est trop « surchargĂ© » alors que Sogou prĂ©sente des pages plus agrĂ©ables Ă  lire.

N’hĂ©sitez pas Ă  le rendre visite ! Ah et pour ceux qui veulent le savoir … « Sogou » veut littĂ©ralement dire « chercher » + « chien ». « Baidu » est un nom qui vient d’une poĂ©sie par contre (cependant, on retrouve le trait sĂ©mantique de l’animal du chien dans le logo de Baidu …) :

Logos Sogou VS Baidu - AUTOVEILLE

 

Les deux moteurs de recherche sont assez similaires, mais Baidu reste largement en tĂȘte pour le moment en termes d’utilisation.

Si le SEO est bien fait pour Baidu, il sera également bénéfique pour les autres moteurs de recherche chinois normalement.

Bon courage Ă  tous !

VĂ©ronique Duong –

 

Bonjour Ă  tous !

Pendant ce week-end, en effectuant ma veille stratĂ©gique d’informations avec mon logiciel de veille AUTOVEILLE, je suis tombĂ©e sur une infographie / mĂ©mento SEO qui donne en un aperçu tous les Ă©lĂ©ments sĂ©mantiques qui doivent ĂȘtre optimisĂ©s en mots-clĂ©s.

On n’y apprend pas vraiment quelque chose de nouveau, mais elle permet de nous rappeler que, par exemple, les attributs alt doivent ĂȘtre systĂ©matiquement optimisĂ©s mĂȘme s’ils n’ont pas un poids trĂšs important. Le SEO, ce sont les actions menĂ©es ensemble qui permettent d’obtenir de bons rĂ©sultats (ou pas !).

En revanche, je ne suis pas tout Ă  fait d’accord avec l’ordre de prioritĂ© de chaque Ă©lĂ©ment. Je ne pense pas que le nom de fichier des images soit si important … en revanche, le contenu d’une page web est tout de mĂȘme un critĂšre de poids !

Voici l’infographie en question (rĂ©alisĂ©e par Salesforce Pardot) :

Conseils référencement : infographie SEO sémantique - Mémento AUTOVEILLE

Pour moi, l’ordre des Ă©lĂ©ments Ă  optimiser en rĂ©fĂ©rencement naturel serait plutĂŽt :

  • la balise TITLE
  • le contenu de la page
  • la mĂ©ta description (elle n’a pas d’impact sur le classement des pages web)
  • l’URL de la page
  • la densitĂ© de mots-clĂ©s
  • les attributs ALT des images (en anglais, « tag » … veut plutĂŽt dire « balise », du coup pour les attributs alt, il faudrait plutĂŽt mettre « alt attributes » au lieu de « alt tags »)
  • les noms de fichier des images

Aprùs chacun optimise les choses comme il le sent 🙂

Qu’en pensez-vous ? Accordez-vous de l’importance Ă  l’ensemble de ces Ă©lĂ©ments aussi ?

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour tout le monde !

Ce matin, en effectuant ma veille stratĂ©gique d’informations avec mon logiciel de veille AUTOVEILLE Monitoring, je suis tombĂ©e sur un outil SEO qui pourrait intĂ©resser les personnes qui travaillent dans le rĂ©fĂ©rencement : un dĂ©tecteur de Duplicate Content pour les pages d’un mĂȘme site > Siteliner !

Pour le test de cet outil, j’ai utilisĂ© mon prĂ©sent blog AUTOVEILLE qui tourne sous wordpress .com … et qui est une mine Ă  Duplicate Content Ă  cause des « tags » et des « catĂ©gories ». Siteliner indique que 67% de mon blog est dupliquĂ© … (l’horreur !) et je ne peux pas y faire grand chose car je ne peux pas accĂ©der aux codes sources de wordpress .com (si j’Ă©tais sous .org, j’aurais pu).

Outil SEO Duplicate Content - AUTOVEILLE

 

La « solution » que j’ai trouvĂ©e, est de mettre moins de tags et moins de catĂ©gories … j’avais dĂ©jĂ  Ă©voquĂ© ce problĂšme de pages dupliquĂ©es sous wordpress .com dans mes anciens articles.

Sinon, je trouve que cet outil est vraiment pratique ! Il existe des versions payantes pour avoir les résultats complets, et je pense que je vais investir dans cet outil SEO. Utile !

Testez-le et dites-moi ce que vous en pensez 🙂

Bon courage Ă  tous,

VĂ©ronique Duong –

Bonjour tout le monde !

Les premiĂšres choses que je fais, en arrivant au bureau, ce sont :

1) vérifier et lire mes mails

2) lancer mes outils de suivi de positionnements SEO 🙂

3) commencer ma veille stratĂ©gique d’informations

Et en effectuant ma veille d’articles avec mon logiciel de veille, je suis tombĂ©e sur un nouvel outil de suivi de positionnements SEO : Rankaware. Il peut ĂȘtre tĂ©lĂ©chargĂ© gratuitement et directement aprĂšs le tutoriel ci-joint : Comment utiliser Rankaware (article en anglais)

Il est hyper simple à utiliser. Voici les étapes :

1) Téléchargez le petit outil de suivi SEO :

Outil Rankaware - AUTOVEILLE

2) Entrez directement votre site web dans l’interface (agrandir l’image en cliquant dessus) :

Site AUTOVEILLE - Rankaware

3) Entrez ensuite une liste de mots-clés :

liste mots clés AUTOVEILLE - Rankaware

4) Sélectionnez le moteur de recherche que vous voulez :

Choix moteurs de recherche Rankaware - AUTOVEILLE

5) Validez le tout et vous obtenez les résultats !

Suivi de positionnements SEO - Rankaware - AUTOVEILLE

6) GĂ©nĂ©rez un rapport PDF ou CSV trĂšs facilement aussi (ici, c’est un PDF) :

PDF Rankaware pour AUTOVEILLE

Mon avis personnel : La version gratuite a bien évidemment moins de fonctionnalités que les versions professionnelles et / ou premium.

Mais rien qu’avec ce petit test, je pense que cet outil est vraiment trĂšs simple. Il ne nous donne que les positionnements, et rien d’autre. Cela peut tout de mĂȘme ĂȘtre intĂ©ressant pour faire rapidement des vĂ©rifications de positionnements sans perdre trop de temps (par exemple, Advanced Web Ranking donne beaucoup plus de donnĂ©es, mais met beaucoup plus longtemps Ă  tourner ! 😉 … on ne peut pas tout avoir).

Voilà, pour vous faire votre propre idée, testez-le et laissez-moi un commentaire pour partager votre avis !

Bon courage à tous 🙂

Véronique

Bonjour tout le monde !

Aujourd’hui, je reviens avec un article SEO sur Baidu et ses rĂ©sultats de recherche. Les sites chinois aiment surcharger leurs pages web (il suffit de voir une page d’accueil d’un site chinois pour le comprendre), et Baidu commence Ă  surcharger ses SERP avec … des images gĂ©nĂ©rĂ©es par les micro donnĂ©es.

Par exemple, la page d’accueil du MinistĂšre de l’Environnement (beaucoup de liens, d’images). (Cliquez sur l’image pour la zoomer) :

Page d'accueil du site du ministĂšre de l'environnement - AUTOVEILLE

Baidu affiche Ă©galement les rich snippets gĂ©nĂ©rĂ©s par les microdonnĂ©es (microdata en anglais). On peut voir les Ă©toiles pour les avis, les Ă©vĂ©nements, les fils d’Ariane, etc. Actuellement, avec la nouvelle mise Ă  jour du moteur de recherche, on peut souvent constater qu’une image est affichĂ©e Ă  cĂŽtĂ© du snippet :

SERP avec images en rich snippets - SEO Baidu - AUTOVEILLE

 

Sur 10 rĂ©sultats de recherche, la moitiĂ© contient une petite image. Pendant que Google rĂ©duit l’Authorship et les photos des auteurs, Baidu augmente les visuels de son cĂŽtĂ©. Il n’existe pas encore un rĂ©seau social propre Ă  Baidu, mais je pense que je ne serais pas Ă©tonnĂ©e de voir un « Baidu+ » ( 🙂 ) prochainement !

Pour que les moteurs de recherche gĂ©nĂšrent une image dans le snippet, il faut implĂ©menter un bout de code HTML avec les mĂ©ta Open Graph ou les modĂšles de code proposĂ©s par Schema .org (mais il n’est pas garanti Ă  100% que les moteurs l’affichent).

Cependant, il se peut que Baidu affiche aléatoirement une image à la place de celle qui est spécifiée dans le code HTML.

En revanche, je ne suis pas sĂ»r que cela ait un impact direct sur le classement de la page web. Un snippet plus riche permet surtout d’attirer les internautes Ă  cliquer sur le site.

Qu’en pensez-vous ?

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour tout le monde !

Aujourd’hui, je vous propose un article sur une technique SEO concernant l’attribut rel=canonical de la balise link. En ce moment, je travaille pas mal dessus, et je vois des publications sur cet Ă©lĂ©ment passĂ©es lors de ma veille stratĂ©gique. Je me suis alors dit qu’il Ă©tait intĂ©ressant d’en faire un article.

Rappel : La balise Link avec l’attribut rel=canonical ressemble Ă  cela

Balise link attribut canonical - AUTOVEILLE SEO

Le Canonical tag, créé en 2009 par Google, peut ĂȘtre utilisĂ© dans quelques cas :

  • les pages similaires sur un site (rubrique Contact pour les diffĂ©rentes versions linguistiques)
  • la duplication de pages produits (les dĂ©clinaisons, par exemple)
  • les articles d’actualitĂ©s repris et similaires

 

Pour Google, l’utilisation du Canonical tag n’a pas de gros impacts nĂ©gatifs sur le site, mais je pense qu’il ne faut pas en abuser (comme pour tout en SEO, sinon, on peut voir ça comme de la sur-optimisation).

En revanche, pour Baidu, il est bien prĂ©ciser que le moteur ne pourrait pas prendre en compte la totalitĂ© des Canonical tag placĂ©s sur le site. Pour maximiser les chances qu’ils soient vus par Baidu, il faut en mettre 1 seul Canonical tag maximum par page web. Pour ceux qui savent lire le chinois, vous pouvez vous rendre sur la source officielle de Baidu Webmaster Tools.

Voici une petite illustration sur le fonctionnement du Canonical tag (réalisée par Dynamical Biz) :

Infographie Canonical tag - AUTOVEILLE SEO

 

Le Canonical tag est un Ă©lĂ©ment pratique Ă  utiliser pour empĂȘcher le duplicate content. Mais il existe aussi d’autres solutions comme les redirections 301. Mais cela fera l’objet d’un autre article !

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour tout le monde !

J’ai finalement trouvĂ© le temps de rĂ©diger cet article : mon logiciel de veille AUTOVEILLE Monitoring permet de sauvegarder toutes les alertes de Talkwalker. Tout d’abord, pour ceux qui ne connaissent pas, Talkwalker est un outil de veille similaire Ă  Google Alerts. GrĂące Ă  des mots-clĂ©s saisis dans le champs de la crĂ©ation d’alertes, l’outil de surveillance va aller chercher sur le web les pages qui contiennent les mots-clĂ©s dĂ©finis, et vous les envoyer par mail.

Créer alertes avec Talkwalker - AUTOVEILLE

 

Je trouve cet outil trĂšs pratique mĂȘme s’il ramĂšne parfois du bruit ( = informations non pertinentes) lors de certaines collectes. Comme je souhaite sauvegarder les donnĂ©es rĂ©cupĂ©rĂ©es par Talkwalker pour une prochaine utilisation (constitution de corpus, etc.), j’ai implĂ©mentĂ© un petit processus avec AUTOVEILLE Monitoring pour rapatrier les alertes directement dans un XML pouvant ĂȘtre converti en Excel.

Voici un aperçu du flux RSS de Talkwalker (dans l’exemple ci-dessous, je souhaite surveiller toutes les informations concernant « l’analyse de sentiments ») :

Flux RSS de Talkwalker - AUTOVEILLE

 

Je récupÚre ce flux, et je le place ensuite dans mon logiciel de veille / agrégateur de flux RSS AUTOVEILLE (le code source est un script Perl) :

Logiciel de veille AUTOVEILLE - Flux RSS

 

Le code ci-dessus n’est qu’un extrait de mon script. Pour l’automatisation, je fais appel Ă  un processus complĂ©mentaire qui restera confidentiel 😉

AprÚs avoir implémenté tout cela, je récupÚre en sortie un fichier XML avec toutes les alertes. Je le convertis ensuite en Excel pour pouvoir lire et stocker plus facilement les données.

XML généré à partir de flux RSS Talkwalker - AUTOVEILLE

Cliquez sur la capture d’Ă©cran ci-dessous pour l’agrandir :

Informations stockées - flux RSS - AUTOVEILLE

Avec cette technique de stockage, je mets en sécurité les données récupérées.

Je travaille beaucoup avec Perl, XML et Excel car ce sont des langages et des solutions faciles et efficaces Ă  manipuler.

N’hĂ©sitez pas Ă  me contacter si vous avez des questions ! Je tenterais de vous rĂ©pondre au plus vite 🙂

Bon courage Ă  tous !

VĂ©ronique Duong –