archive

Traitement automatique des langues

Bonjour tout le monde !

A travers ma veille stratégique du jour, mon logiciel de veille m’a rapatrié une autre illustration très intéressante : comment optimiser le référencement d’un site en Parallaxe (= un site constitué uniquement d’une seule page web à faire défiler en longueur).

Comme je trouve beaucoup d’informations et d’infographies sur les problèmes liés au SEO et au webdesign, j’ai décidé de partager celle-ci sur le Parallaxe avec vous également. Pour ceux qui ne savent pas ce qu’est le Parallaxe, voici deux exemples simples avec mon CV ou la chronologie d’évolution d’AUTOVEILLE.

L’idée est donc d’optimiser au mieux l’unique Title, l’unique Meta Description, l’unique H1 qu’on a sur cette page / ce site. Le positionnement d’une seule et même page web sur plusieurs mots-clés est très difficile (déjà qu’avec plusieurs, c’est dur, alors qu’avec une, je vous laisse imaginer !). Sinon, il faut bien évidemment mettre des mots-clés populaires à ces endroits, mais également mettre un minimum de contenu textuel au tout début de la page en Parallaxe.

Comme une image vaut mille mots, voici l’infographie que j’ai reconstituée (les visuels ont été réalisés par Keneth Von Rauch de AWWWARDS) :

Infographie SEO : Comment optimiser une page en Parallaxe ?

 

L’astuce principale pour optimiser une page en Parallaxe, c’est d’externaliser tous les contenus (images, vidéos, textes, etc.) dans des pages externes (fichiers HTML qu’on va appeler avec du JavaScript ou Jquery) ! Pas mal l’astuce je trouve !

Qu’en pensez-vous ? Avez-vous déjà testé cette technique ? A t-elle marché ?

Votre avis m’intéresse, et n’hésitez pas à commenter ou repartager l’article !

Bon courage à tous,

Véronique Duong

Bonjour tout le monde !

Nous sommes un jour férié, mais rien ne m’empêche de travailler pour mes sites ! Si vous avez veillé régulièrement sur les informations stratégiques en SEO, vous avez dû voir qu’il existe une nouvelle limitation des caractères pour la balise title.

J’ai réécrit toutes les balises qui dépassaient les 58 caractères. Je suis même restée un peu en dessous pour être sûr que mes titres s’affichent complètement. Quand je venais de créer mon site, la limite était fixée à environ 70 caractères, et cela me permettait de mettre plusieurs mots-clés dans le titre des pages web. Et je pense que tous les SEO faisaient plus ou moins cela 😉

Néanmoins, certaines ont été réécrites par Google car le moteur de recherche a certainement trouvé que mes titres étaient parfois … trop optimisés. En me relisant, c’est vrai que quelques unes de mes anciennes pages comportaient trop de mots-clés populaires à cet endroit stratégique …

Voici trois exemples où mes titres ont été retravaillés par Google (certains des mots-clés populaires ont disparu, et le mot « Free » est même apparu !) :

Titres AUTOVEILLE réécrits par Google

De plus, à l’origine, ces titles étaient très longs. Ils faisaient environ 68 caractères. Avec le nouvel design, ils ne passent pas et s’affichent très mal. Je les ai donc réécris en restant autour de 55 – 56 caractères (en dessous de 58). Avec cette nouvelle limitation, on est aussi beaucoup plus restreint au niveau de la créativité et de l’ajout de mots-clés populaires. De ce fait, elle devrait bien empêcher le Keyword Stuffing !

Si ce n’est pas encore fait pour vous, je vous conseille de revoir vos titles au plus vite pour avoir quelque chose de réoptimiser proprement 🙂

Cela montre aussi que vous vous préoccupez de votre site auprès des internautes et des consommateurs en ligne. Surveillez et veillez très régulièrement sur l’évolution de vos pages web dans Google (et les autres moteurs bien sûr !).

Bon courage à tous !

Véronique Duong –

 

Bonjour tout le monde,

Hier, en effectuant ma veille stratégique d’informations SEO avec AUTOVEILLE Monitoring, mon logiciel de veille automatique, je suis tombée sur un article invité d’Alexandra Martin concernant l’utilisation des outils de Mind Mapping afin de structurer thèmes et idées pour de la rédaction web. Ce type de logiciels peut être multi-usage : organisation d’idées, structuration d’un plan, définition d’une stratégie, etc. C’est vraiment fait pour créer des cartographies mentales rapidement et efficacement.

La première personne qui m’a parlé de ces outils de Mind Mapping, est mon meilleur ami qui travaille avec moi sur ASVD.

FreeMind est le logiciel de cartographie que nous utilisons souvent. Pour des projets ou audits en e-réputation, il est souvent nécessaire de créer des graphes et des schémas pour illustrer les grands sujets et thèmes des diverses conversations en ligne. D’après Wikipédia, FreeMind est :

Un logiciel libre qui permet de créer des cartes heuristiques (ou Mind Map), des diagrammes représentant les connexions sémantiques entre différentes idées. Il est écrit en langage Java. Il est disponible sous licence GNU GPL. FreeMind peut notamment aider à l’organisation d’idées ou à la gestion de projets.

Les fonctionnalités sont donc très variées. Pour ma part, j’ai décidé de partager avec vous une (grande) cartographie que j’ai faite sur l’organisation d’un projet SEO / SMO. Ces deux domaines fonctionnent ensemble.

Cliquez sur l’image pour l’agrandir :

Organisation SEO / SMO - Cartographie FreeMind - AUTOVEILLE

 

 

Dans ma cartographie, j’ai mis :

  • les audits SEO (technique et sémantique)
  • les optimisations
  • les intégrations
  • les suivis
  • les veilles stratégiques (pour la partie SMO surtout)
  • l’e-réputation à surveiller
  • l’animation des réseaux sociaux (Community Management)
  • + Quelques outils à connaître absolument (Talkwalker, Google Alerts, Hootsuite, etc.)

Je l’ai faite rapidement (en 15-20 minutes …) et il manque surement des étapes à détailler. Si vous avez envie de m’aider à la compléter, n’hésitez pas à me laisser un commentaire et à me dire ce que vous voulez ajouter (et à quel nœud !).

Bon courage à tous !

Véronique Duong –

Bonjour à tous 🙂

Ce matin, en effectuant nos veilles stratégiques sur les informations SEO, des collègues m’ont demandé qu’est ce qu’était « Sogou« .

Logo Sogou - AUTOVEILLE

Je me suis alors dit qu’il serait intéressant pour la communauté SEO française de connaître ce moteur de recherche qui détient près de 10,35% des parts de marchés en Chine !

Après Baidu et 360 .cn, Sogou est le 3e moteur de recherche le plus utilisé dans le Pays du Milieu.

Répartition parts de marché moteurs de recherche chinois en août 2013 - AUTOVEILLELes données ci-dessus datent d’août 2013. La part de marché de Sogou a progressé de 2,35% depuis 2012. Elle est passée de 8% à plus de 10%.

Sogou présente des services très similaires à ceux de Baidu … voire ceux de Google ! Sogou Images, Sogou News, Sogou Music, Sogou Videos, etc. tout y est pratiquement :

Services de Sogou - AUTOVEILLE

Sogou commence à « copier » sur Baidu et Google en mettant en place aussi le Knowledge Graph ! Par exemple, lorsqu’on cherche Huawei dans le moteur, on a ce résultat de recherche naturel (SEO) :

Résultats de recherche SEO - Sogou - AUTOVEILLE

 

Pour ce qui est des résultats de recherche SEA sur Sogou, on a une image dans le snippet, les petits liens annexes (site-links) en plus en bas de l’annonce (comme on peut l’avoir avec Google) et le même fond gris que Baidu avec la mention « 推广 » pour qu’on sache que c’est une annone.

Sogou SEA - AUTOVEILLE

 

Sogou continue a gagné en parts de marché en Chine, et personnellement, je trouve que son interface est plus agréable à utiliser que 360 .cn. Parfois, je trouve que Baidu est trop « surchargé » alors que Sogou présente des pages plus agréables à lire.

N’hésitez pas à le rendre visite ! Ah et pour ceux qui veulent le savoir … « Sogou » veut littéralement dire « chercher » + « chien ». « Baidu » est un nom qui vient d’une poésie par contre (cependant, on retrouve le trait sémantique de l’animal du chien dans le logo de Baidu …) :

Logos Sogou VS Baidu - AUTOVEILLE

 

Les deux moteurs de recherche sont assez similaires, mais Baidu reste largement en tête pour le moment en termes d’utilisation.

Si le SEO est bien fait pour Baidu, il sera également bénéfique pour les autres moteurs de recherche chinois normalement.

Bon courage à tous !

Véronique Duong –

 

Bonjour à tous !

Pendant ce week-end, en effectuant ma veille stratégique d’informations avec mon logiciel de veille AUTOVEILLE, je suis tombée sur une infographie / mémento SEO qui donne en un aperçu tous les éléments sémantiques qui doivent être optimisés en mots-clés.

On n’y apprend pas vraiment quelque chose de nouveau, mais elle permet de nous rappeler que, par exemple, les attributs alt doivent être systématiquement optimisés même s’ils n’ont pas un poids très important. Le SEO, ce sont les actions menées ensemble qui permettent d’obtenir de bons résultats (ou pas !).

En revanche, je ne suis pas tout à fait d’accord avec l’ordre de priorité de chaque élément. Je ne pense pas que le nom de fichier des images soit si important … en revanche, le contenu d’une page web est tout de même un critère de poids !

Voici l’infographie en question (réalisée par Salesforce Pardot) :

Conseils référencement : infographie SEO sémantique - Mémento AUTOVEILLE

Pour moi, l’ordre des éléments à optimiser en référencement naturel serait plutôt :

  • la balise TITLE
  • le contenu de la page
  • la méta description (elle n’a pas d’impact sur le classement des pages web)
  • l’URL de la page
  • la densité de mots-clés
  • les attributs ALT des images (en anglais, « tag » … veut plutôt dire « balise », du coup pour les attributs alt, il faudrait plutôt mettre « alt attributes » au lieu de « alt tags »)
  • les noms de fichier des images

Après chacun optimise les choses comme il le sent 🙂

Qu’en pensez-vous ? Accordez-vous de l’importance à l’ensemble de ces éléments aussi ?

Bon courage à tous !

Véronique Duong –

Bonjour tout le monde !

Ce matin, en effectuant ma veille stratégique d’informations avec mon logiciel de veille AUTOVEILLE Monitoring, je suis tombée sur un outil SEO qui pourrait intéresser les personnes qui travaillent dans le référencement : un détecteur de Duplicate Content pour les pages d’un même site > Siteliner !

Pour le test de cet outil, j’ai utilisé mon présent blog AUTOVEILLE qui tourne sous wordpress .com … et qui est une mine à Duplicate Content à cause des « tags » et des « catégories ». Siteliner indique que 67% de mon blog est dupliqué … (l’horreur !) et je ne peux pas y faire grand chose car je ne peux pas accéder aux codes sources de wordpress .com (si j’étais sous .org, j’aurais pu).

Outil SEO Duplicate Content - AUTOVEILLE

 

La « solution » que j’ai trouvée, est de mettre moins de tags et moins de catégories … j’avais déjà évoqué ce problème de pages dupliquées sous wordpress .com dans mes anciens articles.

Sinon, je trouve que cet outil est vraiment pratique ! Il existe des versions payantes pour avoir les résultats complets, et je pense que je vais investir dans cet outil SEO. Utile !

Testez-le et dites-moi ce que vous en pensez 🙂

Bon courage à tous,

Véronique Duong –

Bonjour tout le monde !

Les premières choses que je fais, en arrivant au bureau, ce sont :

1) vérifier et lire mes mails

2) lancer mes outils de suivi de positionnements SEO 🙂

3) commencer ma veille stratégique d’informations

Et en effectuant ma veille d’articles avec mon logiciel de veille, je suis tombée sur un nouvel outil de suivi de positionnements SEO : Rankaware. Il peut être téléchargé gratuitement et directement après le tutoriel ci-joint : Comment utiliser Rankaware (article en anglais)

Il est hyper simple à utiliser. Voici les étapes :

1) Téléchargez le petit outil de suivi SEO :

Outil Rankaware - AUTOVEILLE

2) Entrez directement votre site web dans l’interface (agrandir l’image en cliquant dessus) :

Site AUTOVEILLE - Rankaware

3) Entrez ensuite une liste de mots-clés :

liste mots clés AUTOVEILLE - Rankaware

4) Sélectionnez le moteur de recherche que vous voulez :

Choix moteurs de recherche Rankaware - AUTOVEILLE

5) Validez le tout et vous obtenez les résultats !

Suivi de positionnements SEO - Rankaware - AUTOVEILLE

6) Générez un rapport PDF ou CSV très facilement aussi (ici, c’est un PDF) :

PDF Rankaware pour AUTOVEILLE

Mon avis personnel : La version gratuite a bien évidemment moins de fonctionnalités que les versions professionnelles et / ou premium.

Mais rien qu’avec ce petit test, je pense que cet outil est vraiment très simple. Il ne nous donne que les positionnements, et rien d’autre. Cela peut tout de même être intéressant pour faire rapidement des vérifications de positionnements sans perdre trop de temps (par exemple, Advanced Web Ranking donne beaucoup plus de données, mais met beaucoup plus longtemps à tourner ! 😉 … on ne peut pas tout avoir).

Voilà, pour vous faire votre propre idée, testez-le et laissez-moi un commentaire pour partager votre avis !

Bon courage à tous 🙂

Véronique

Bonjour tout le monde !

Aujourd’hui, je reviens avec un article SEO sur Baidu et ses résultats de recherche. Les sites chinois aiment surcharger leurs pages web (il suffit de voir une page d’accueil d’un site chinois pour le comprendre), et Baidu commence à surcharger ses SERP avec … des images générées par les micro données.

Par exemple, la page d’accueil du Ministère de l’Environnement (beaucoup de liens, d’images). (Cliquez sur l’image pour la zoomer) :

Page d'accueil du site du ministère de l'environnement - AUTOVEILLE

Baidu affiche également les rich snippets générés par les microdonnées (microdata en anglais). On peut voir les étoiles pour les avis, les événements, les fils d’Ariane, etc. Actuellement, avec la nouvelle mise à jour du moteur de recherche, on peut souvent constater qu’une image est affichée à côté du snippet :

SERP avec images en rich snippets - SEO Baidu - AUTOVEILLE

 

Sur 10 résultats de recherche, la moitié contient une petite image. Pendant que Google réduit l’Authorship et les photos des auteurs, Baidu augmente les visuels de son côté. Il n’existe pas encore un réseau social propre à Baidu, mais je pense que je ne serais pas étonnée de voir un « Baidu+ » ( 🙂 ) prochainement !

Pour que les moteurs de recherche génèrent une image dans le snippet, il faut implémenter un bout de code HTML avec les méta Open Graph ou les modèles de code proposés par Schema .org (mais il n’est pas garanti à 100% que les moteurs l’affichent).

Cependant, il se peut que Baidu affiche aléatoirement une image à la place de celle qui est spécifiée dans le code HTML.

En revanche, je ne suis pas sûr que cela ait un impact direct sur le classement de la page web. Un snippet plus riche permet surtout d’attirer les internautes à cliquer sur le site.

Qu’en pensez-vous ?

Bon courage à tous !

Véronique Duong –

Bonjour tout le monde !

Aujourd’hui, je vous propose un article sur une technique SEO concernant l’attribut rel=canonical de la balise link. En ce moment, je travaille pas mal dessus, et je vois des publications sur cet élément passées lors de ma veille stratégique. Je me suis alors dit qu’il était intéressant d’en faire un article.

Rappel : La balise Link avec l’attribut rel=canonical ressemble à cela

Balise link attribut canonical - AUTOVEILLE SEO

Le Canonical tag, créé en 2009 par Google, peut être utilisé dans quelques cas :

  • les pages similaires sur un site (rubrique Contact pour les différentes versions linguistiques)
  • la duplication de pages produits (les déclinaisons, par exemple)
  • les articles d’actualités repris et similaires

 

Pour Google, l’utilisation du Canonical tag n’a pas de gros impacts négatifs sur le site, mais je pense qu’il ne faut pas en abuser (comme pour tout en SEO, sinon, on peut voir ça comme de la sur-optimisation).

En revanche, pour Baidu, il est bien préciser que le moteur ne pourrait pas prendre en compte la totalité des Canonical tag placés sur le site. Pour maximiser les chances qu’ils soient vus par Baidu, il faut en mettre 1 seul Canonical tag maximum par page web. Pour ceux qui savent lire le chinois, vous pouvez vous rendre sur la source officielle de Baidu Webmaster Tools.

Voici une petite illustration sur le fonctionnement du Canonical tag (réalisée par Dynamical Biz) :

Infographie Canonical tag - AUTOVEILLE SEO

 

Le Canonical tag est un élément pratique à utiliser pour empêcher le duplicate content. Mais il existe aussi d’autres solutions comme les redirections 301. Mais cela fera l’objet d’un autre article !

Bon courage à tous !

Véronique Duong –

Bonjour tout le monde !

J’ai finalement trouvé le temps de rédiger cet article : mon logiciel de veille AUTOVEILLE Monitoring permet de sauvegarder toutes les alertes de Talkwalker. Tout d’abord, pour ceux qui ne connaissent pas, Talkwalker est un outil de veille similaire à Google Alerts. Grâce à des mots-clés saisis dans le champs de la création d’alertes, l’outil de surveillance va aller chercher sur le web les pages qui contiennent les mots-clés définis, et vous les envoyer par mail.

Créer alertes avec Talkwalker - AUTOVEILLE

 

Je trouve cet outil très pratique même s’il ramène parfois du bruit ( = informations non pertinentes) lors de certaines collectes. Comme je souhaite sauvegarder les données récupérées par Talkwalker pour une prochaine utilisation (constitution de corpus, etc.), j’ai implémenté un petit processus avec AUTOVEILLE Monitoring pour rapatrier les alertes directement dans un XML pouvant être converti en Excel.

Voici un aperçu du flux RSS de Talkwalker (dans l’exemple ci-dessous, je souhaite surveiller toutes les informations concernant « l’analyse de sentiments ») :

Flux RSS de Talkwalker - AUTOVEILLE

 

Je récupère ce flux, et je le place ensuite dans mon logiciel de veille / agrégateur de flux RSS AUTOVEILLE (le code source est un script Perl) :

Logiciel de veille AUTOVEILLE - Flux RSS

 

Le code ci-dessus n’est qu’un extrait de mon script. Pour l’automatisation, je fais appel à un processus complémentaire qui restera confidentiel 😉

Après avoir implémenté tout cela, je récupère en sortie un fichier XML avec toutes les alertes. Je le convertis ensuite en Excel pour pouvoir lire et stocker plus facilement les données.

XML généré à partir de flux RSS Talkwalker - AUTOVEILLE

Cliquez sur la capture d’écran ci-dessous pour l’agrandir :

Informations stockées - flux RSS - AUTOVEILLE

Avec cette technique de stockage, je mets en sécurité les données récupérées.

Je travaille beaucoup avec Perl, XML et Excel car ce sont des langages et des solutions faciles et efficaces à manipuler.

N’hésitez pas à me contacter si vous avez des questions ! Je tenterais de vous répondre au plus vite 🙂

Bon courage à tous !

Véronique Duong –