archive

Archives d’Auteur: VĂ©ronique Duong

Bonjour tout le monde !

Dans ce nouvel article, je ne pense pas vous apprendre quelque chose de trÚs nouveau, mais ce serait plutÎt un ensemble de piqûres de rappel sur le robots.txt. Il doit se trouver à la racine du site.

Ce fichier .txt est un « outil SEO »  trĂšs utile qui vous permet d’indiquer aux crawlers des moteurs de recherche d’indexer ou d’exclure certaines pages, certains rĂ©pertoires de votre site. Il peut Ă©galement servir Ă  dĂ©sindexer un site en entier … si vous ne souhaitez pas que les internautes vous trouvent (… ça me fait penser au nettoyage de la e-rĂ©putation, oui, cela pourrait aussi ĂȘtre utile dans ce cadre, mais c’est un autre sujet :)).

Vu qu’il peut dĂ©sindexer un site complet, le robots.txt doit donc ĂȘtre manipulĂ© avec prĂ©cautions. De plus, il ne faut pas mettre de lignes vides entre chaque ligne de restriction.

Il est essentiellement composé de trois éléments :

  • User-agent (Crawlers)
  • Allow (Permettre)
  • Disallow (Interdire)

Les deux Ă©lĂ©ments qu’on utilise surtout sont :

  • User-agent (Crawlers)
  • Disallow (Interdire)

Le robots.txt permet surtout de dire ce qu’on ne veut pas que les crawlers indexent, d’oĂč l’utilisation plus frĂ©quente du Disallow que du Allow. Voici quelques exemples (je mets des numĂ©ros, mais il n’y en a pas Ă©videmment) :

1) Cas de figure 1

  1. User-Agent: *
  2. Disallow: /

Ces deux lignes veulent dire qu’on demande Ă  tous les crawlers de ne pas indexer le site !

2) Cas de figure 2

  1. User-Agent: *
  2. Disallow: /pdf

Ces deux lignes veulent dire qu’on demande Ă  tous les crawlers de ne pas indexer le dossier ou le rĂ©pertoire pdf !

3) Cas de figure 3

  1. User-Agent: Googlebot
  2. Disallow: /admin/login.html
  3. User-Agent: Baiduspider
  4. Disallow: /repertoire-1

Ces 4 lignes indiquent les choses suivantes : on dit Ă  Googlebot (crawler de Google) de ne pas indexer la page web /admin/login.html, et parallĂšlement, on dit Ă  Baiduspider (crawler de Baidu) de ne pas indexer le dossier /repertoire-1.

Voici une petite infographie en guise de mémento (créée par http://www.elliance.com en 2008) :

Infographie simple du robots.txt | AUTOVEILLE

Bonne restriction !

VĂ©ronique Duong –

Bonjour tout le monde !

Comme prĂ©vu, je vous ai prĂ©parĂ© un article sur un nouvel outil SEO que je suis en train de prĂ©parer sur le content spinning. Ce que je vais vous montrer dans cette publication, n’est qu’un mini test. Je prĂ©cise Ă©galement que ce genre de techniques pourrait ĂȘtre pĂ©nalisĂ© par les moteurs de recherche, et que je n’utilise pas ces derniĂšres pour mes propres sites et mes sites clients car je prĂ©fĂšre rĂ©diger les textes Ă  la main.

Cependant, comme j’ai eu pas mal de demandes ces derniers temps sur les processus d’automatisation dont la réécriture automatique de contenu, j’accepte de vous faire une petite dĂ©monstration.

Pour ce test, j’ai extrait un morceau de textes (l’introduction) depuis l’article de WikipĂ©dia sur les chiens, et je l’ai retravaillĂ© automatiquement avec des synonymes.

L’extrait que j’ai rĂ©cupĂ©rĂ© est trĂšs court :

Content Spinning : Méthode SEO par AUTOVEILLE

 

J’ai dĂ©veloppĂ© un script Perl et Ă©laborĂ© un petit dictionnaire de synonymes pour faire ce test. En le lançant dans ma Konsole, j’obtiens tout d’abord un rĂ©sultat brut sans redirection vers un autre fichier .txt :

Content Spinning - Konsole : Méthode par AUTOVEILLE

 

Voici le résultat en sortie fichier .txt :

Content Spinning : Méthode Simple par AUTOVEILLE

 

Les mots encadrĂ©s en vert et en orange sont les synonymes utilisĂ©s pour ce petit texte. J’ai fait exprĂšs de ne pas tout changer dans le texte pour vous montrer comment cela marche, et surtout montrer que les substituts pourraient provoquer des non sens importants.

Dans cet exemple, les phrases font encore sens parce qu’il n’est pas trĂšs compliquĂ©, mais dans un texte plus spĂ©cialisĂ©, plus technique, cela devient n’importe quoi. Je vous conseille de rĂ©diger Ă  la main une fois de plus. Content is king, certes, mais Good Quality is God ! je dirais 😉

Des textes bien écrits par des experts donnent une meilleure image à votre site et à votre marque ! (E-réputation time ;))

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour tout le monde !

Je reviens sur un problĂšme que j’ai rencontrĂ© il y a quelques temps (aux mois de mai – juin) avec mon blog AUTOVEILLE (oui, celui que vous ĂȘtes en train de lire). Une de mes pages web a Ă©tĂ© piratĂ©, et lorsqu’on cliquait sur le lien, une page « alerte logiciel malveillant » apparaissait … La page que je voyais ressemblait Ă  ça :

Page web et logiciel malveillant | Image AUTOVEILLE

 

Ce n’est pas drĂŽle du tout de tomber sur une page comme celle-ci, surtout si cela concerne une page importante de votre site. Heureusement, que dans mon cas, ce n’Ă©tait qu’une page de « tags » de WordPress. Et voici les messages que Google Webmaster Tools m’indiquait :

Logiciel malveillant détecté par Google Webmaster Tools | Image AUTOVEILLE

 

Google me prĂ©vient Ă©galement qu’il va afficher un message d’avertissement aux internautes qui verront ma page web affichĂ©e dans les SERP (ça, c’est vraiment l’horreur ! qui oserait cliquer sur une page web avec un message « Ce site risque d’endommager votre ordinateur ») :

Message d'avertissement de logiciel malveillant | Image AUTOVEILLE

 

Dans les SERP, une page web attaquée (ou voire un site attaqué) par des logiciels malveillants aura une petite ligne en plus dans son snippet :

Message du site attaqué par un logiciel malveillant | AUTOVEILLE

 

Ce que j’ai fait pour soigner ma page web attaquĂ©e a Ă©tĂ© assez radical. Je l’ai supprimĂ©, car ce n’Ă©tait qu’une page de tags WordPress, et elle n’Ă©tait pas trĂšs importante.

Si vous avez été attaqué par des logiciels malveillants pour des pages web importantes, suivez les conseils de Google pour réparer les dégùts : Assistance aux webmasters pour les sites piratés

Google Webmaster Tools vient de créer une nouvelle rubrique pour ce genre de situations : ProblÚmes de Sécurité

ProblÚmes de sécurité | AUTOVEILLE

 

Environ 8 semaines plus tard, mon site a Ă©tĂ© soignĂ©, et le message d’avertissement a disparu ! 🙂

Bon courage Ă  tous,

VĂ©ronique Duong –

Bonjour tout le monde !

Aujourd’hui, je vous ai prĂ©parĂ© un article qui va toucher deux disciplines qui sont Ă©troitement corrĂ©lĂ©es, Ă  savoir le traitement automatique des langues (ou ingĂ©nierie linguistique) et le rĂ©fĂ©rencement naturel (ou SEO).

Ce que vous allez lire par la suite ne sont que des hypothĂšses car je ne connais pas l’algorithme de Google, mais aprĂšs de nombreux tests, je trouve qu’il y a de (fortes) similitudes qui existent entre la mĂ©thode que j’utilise pour retrouver des pages web ou des fichiers dans mon systĂšme et celle du moteur de Google.

En effet, j’utilise souvent l’aspiration de sites web pour stocker les pages web qui m’intĂ©ressent, et pour en retrouver certaines, j’utilise des mots-clĂ©s … comme des requĂȘtes que les internautes taperaient sur Google !

Voici l’exemple de mon propre site ci-dessous. Comme vous pouvez le voir, les pages web / HTML, les images, les autres fichiers sont tous crawlĂ©s par mon logiciel de crawling (qui n’est autre que mon logiciel de veille dĂ©tournĂ© en outil de crawl) :

base de données AUTOVEILLE |Logiciel de veille

 

Ensuite, pour trier les pages HTML que j’ai dans ma base ci-dessus, je lance une requĂȘte (encadrĂ©e en vert) de ce genre dans ma Konsole :

résultats de recherche egrep AUTOVEILLE

 

Je pense que Google possĂ©derait une base de donnĂ©es gigantesque au vu du nombre de pages web qui existent, et des milliers de corpus thĂ©matiques / catĂ©goriques. A chaque requĂȘte tapĂ©e, Google essayerait de fournir la meilleure rĂ©ponse Ă  l’utilisateur parmi ses trilliards de pages HTML 🙂

Je prĂ©cise Ă©galement que mon outil de crawl / de veille ne lit et ne crawl pas les images, le JavaScript. En tout cas, il y a des choses extrĂȘmement corrĂ©lĂ©es entre le TAL et le SEO, et je m’Ă©clate en faisant des recherches, des tests dans ces deux domaines ! 🙂

TrĂšs prochainement, je vous montrerai comment faire du content spinning propre !

Bon courage Ă  tous,

VĂ©ronique Duong –

Hello tout le monde !

Un petit article pour vous parler de deux choses : la crĂ©ation de mon badge Google+ pour l’Authorship (rel=publisher) et la mise Ă  jour de mes rankings SEO.

Alors pour crĂ©er un badge Google+, cela est assez simple ! Il suffit d’avoir une page Google+ et de se rendre sur Google Developers

Ensuite, rĂ©cupĂ©rez le code HTML qui est gĂ©nĂ©rĂ© via la page Google Developpers, et insĂ©rez le dans le code HTML de votre site (lĂ  oĂč vous souhaitez qu’il apparaisse) :

Code HTML rel=publisher | AUTOVEILLE

Voici le badge que j’ai pour ma page AUTOVEILLE :

Badge Google+ AUTOVEILLE

Cela vous permet de lier votre page Google+ Ă  votre site, et d’augmenter la visibilitĂ© des deux (page et site). J’aime beaucoup les petits widgets de Google.

Par ailleurs, en faisant ma veille technologique (ou veille SEO), je constate que mes rankings commencent Ă  aller mieux. En effet, j’ai passĂ© quelques jours Ă  « dĂ©s-optimiser » ce que j’avais sur-optimisĂ© pour le test : SEO Penguin et les pĂ©nalitĂ©s que j’aurais eues.

Une de mes pages web avait pas mal chuté, mais actuellement, les choses seraient revenues à la normale :

SEO rankings d'AUTOVEILLE 28/10/2013

Bon courage Ă  tous ! GO !

VĂ©ronique Duong –

Bonjour tout le monde !

Hier soir, en faisant ma veille SEO et des vĂ©rifications de mes pages web dans Google, j’ai dĂ©couvert que le moteur de recherche affichait des titles diffĂ©rents en fonction de mes requĂȘtes !

En tapant « news autoveille« , j’avais un title « News – AUTOVEILLE – Free » qui s’affichait, alors que quand je tapais « actualitĂ©s autoveille« , j’avais le title dans mon code source qui m’Ă©tait renvoyĂ© en rĂ©ponse Ă  l’Ă©cran.

Une petite illustration pour vous permettre de mieux comprendre :

Web sĂ©mantique et SEO : affichage de title et requĂȘtes internautes

 

Cela serait plus ou moins dĂ» aux algorithmes de web sĂ©mantique que Google est en train de mettre en place dans son moteur. Google voudrait donner la meilleure rĂ©ponse possible Ă  l’internaute en lui affichant la page web la plus pertinente corrĂ©lĂ©e Ă  sa requĂȘte.

L’algorithme Hummingbird (Colibri) serait dĂ©jĂ  bel et bien mise en place dans ce cas.

Cela me fait penser Ă  une chose : les mots-clĂ©s auraient perdu beaucoup de leurs poids car dorĂ©navant de plus en plus de choses se feront en fonction de la requĂȘte de l’internaute. C’est pour cela aussi que je disais souvent qu’il ne faudrait pas se focaliser uniquement sur une dizaine de mots-clĂ©s, mais vraiment varier son champ lexical pour maximiser sa visibilitĂ© dans les SERP.

Colibri SEO - AUTOVEILLE

 

 

Source : maxisciences.com

Le web sĂ©mantique serait l’avenir du web, le web 3.0 ! Soyons prĂȘts 🙂

Bon courage !

VĂ©ronique Duong –

Hello tout le monde !

AprĂšs avoir observĂ© des variations dans mes rankings SEO, j’estime que Google Penguin est bien passĂ© par lĂ  ces derniers temps. Je me suis Ă©galement « faite attaquer » sur l’un de mes mots-clĂ©s prĂ©fĂ©rĂ©s aussi ! Ce que je vais Ă©crire par la suite concerne uniquement ma propre expĂ©rience et mes tests, car d’un site Ă  un autre, beaucoup de choses changent, et mes conseils ne seraient pas forcĂ©ment adaptĂ©s.

NĂ©anmoins, il y a des choses gĂ©nĂ©rales ou plutĂŽt « universelles » que je pense avoir plus ou moins confirmation aprĂšs ces 2 mois de tests. En effet, pendant deux Ă  trois mois, je mettais toujours la mĂȘme URL sur un mĂȘme mot-clĂ© en ancre de texte dans la plupart de mes rĂ©dactions car je voulais voir l’effet que cela ferait. Et en rĂ©alitĂ©, c’est vu comme de la sur-optimisation par Google.

L’algorithme Penguin a deux objectifs :

  • PĂ©naliser ceux qui insistent trop sur un mĂȘme mot-clĂ© on-page (mon test ci-dessus …)
  • PĂ©naliser ceux qui utilisent trop de mots-clĂ©s et ancres de liens vers leurs sites

Les conseils SEO que je pourrais vous donner :

  • Ne mettez pas tout le temps la mĂȘme URL sur un mĂȘme mot-clĂ©
  • N’exagĂ©rez pas en mettant des ancres de textes partout
  • Faites attention Ă  vos backlinks qui proviennent de sites « spam » ou « douteux » (ils sont facilement reconnaissables)

Une petite infographie pour rĂ©sumer le tout (merci Ă  froggomarketing.co.uk pour l’avoir créée) :

Infographie pénalités Pengouin AUTOVEILLE SEO

 

De mon cĂŽtĂ©, je sais ce qu’il me reste Ă  faire ! Heureusement que je n’ai testĂ© que sur un mot-clĂ© et sur une seule page web. Je n’imagine pas comment cela peut ĂȘtre dur pour les sites qui font ça sur pratiquement toutes leurs pages !

Bon courage Ă  tous,

VĂ©ronique Duong –

Hello tout le monde !

Eh oui, il arrive que Mlle V.D. ait de petits coups de blues SEO aussi. En ce moment, je commence Ă  stagner sur certains mots-clĂ©s (comme logiciel de veille, logiciel veille, entre autres), et je ne vous cache pas que cela me frustre un peu, et c’est plutĂŽt normal.

Qui d’entre nous n’a pas dĂ©jĂ  ressenti cette sensation de pression, de frustration parce que nous avons vu que notre site a perdu 2 ou 3 positions ?? Je pense que tous les SEO ressentent cela, en tout cas plus ou moins.

On se dit qu’on fait constamment des efforts, et qu’il suffirait qu’un algorithme qui passe, et tout pourrait changer (ou pas ! ^^). Pour l’instant, j’essaye de remonter sur mes requĂȘtes ciblĂ©es (logiciel de veille, logiciel veille, etc.). En SEO, rien n’est facile en fait, vu qu’on « dĂ©fie » quelque chose que l’on ne connait mĂȘme pas (algorithmes secrets).

NĂ©anmoins, j’essaye de ne pas me focaliser uniquement sur certains mots-clĂ©s, parce que si ça se trouve, les internautes ne les taperaient mĂȘme pas, mais c’est pour moi un moyen de tester mes hypothĂšses.

En effet, hier, je me suis « amusĂ©e » Ă  taper des requĂȘtes trĂšs variĂ©es plus ou moins liĂ©es Ă  mes sites AUTOVEILLE, et je vois qu’ils sont en premiĂšre page sur des mots-clĂ©s auxquels je n’y pensais jamais :

AUTOVEILLE requĂȘtes gĂ©nĂ©riques

ou encore pour le site web

AUTOVEILLE site : requĂȘtes gĂ©nĂ©riques

Le rĂ©fĂ©rencement naturel est l’une des activitĂ©s que j’aime par dessus tout, mais Ă©galement une activitĂ© qui me donne le plus de hauts et de bas (haha ;)), mais de temps en temps, je fais une pause, et je me concentre sur mon autre activitĂ© … qui est la veille d’informations stratĂ©giques ! Ou encore le dĂ©veloppement d’outils en Perl, en Shell. Je voudrais dire que le SEO sur Google ne devrait pas devenir un Ă©lĂ©ment qui occupe toutes vos pensĂ©es … d’oĂč le titre de mon article aussi.

Je pense qu’il faut rester cool, et continuer Ă  faire des efforts ! C’est connu, en SEO, il faut ĂȘtre trĂšs patient, et ĂȘtre trĂšs persĂ©vĂ©rant.

Et puis, tant mieux que Google met souvent Ă  jour ses services et ses algorithmes, ainsi, les SEO pourraient toujours s’amĂ©liorer, s’adapter, et auraient toujours quelque chose Ă  optimiser :p !

Bon courage Ă  tous ! Stay Strong !

VĂ©ronique Duong –

Bonjour tout le monde !

AUTOVEILLE monitoring, mon logiciel d’automatisation de veille vient de me rapatrier une super infographie qui nous apprend Ă  gĂ©rer nos profils sur les rĂ©seaux sociaux en 30 minutes (seulement !)

Personnellement, je passe beaucoup de temps sur les rĂ©seaux sociaux et les blogs. NĂ©anmoins, j’ai une bonne raison … car je fais beaucoup de veilles. Certes, je veille automatiquement, mais je partage manuellement tout ce que je vois passer d’intĂ©ressant et de qualitĂ© sur Twitter, sur G+, etc., c’est pourquoi, je passe autant de temps devant mes PC !

Voici une petite liste de mes horaires SMO (non exhaustifs) :

  • pour Twitter : je passe environ 12h (oui, je veille un peu trop / trĂšs rĂ©guliĂšrement …)
  • pour Google+ : je passe environ 30 min Ă  50 min par jour
  • pour Pinterest : environ 20 min par jour
  • pour Facebook : je passe moins de temps, juste peut ĂȘtre 10 min tous les deux jours. Je ne suis pas fan de ce rĂ©seau social, mais il est intĂ©ressant pour ĂȘtre visible, je ne dirais pas le contraire.

Sinon, le reste comme Linkedin, Scoop.it, etc. je dois passer 5 Ă  10 minutes tous les deux jours.

Voici ce que l’infographie, rĂ©alisĂ©e par Pardot.com qui se base sur la semi-automatisation, en dit … c’est parti ! Top Chrono !! :

Infographie SMO : ĂȘtre prĂ©sent sur les rĂ©seaux sociaux en 30 minutes ! Top chrono

  • Twitter : 10 minutes pour rĂ©pondre, partager et programmer les tweets

Mon avis : c’est trop court ! Ă  moins que vous ne veillez pas du tout via Twitter … ou alors vous jetez un oeil Ă  votre compte pendant 1 minute toutes les heures (ce qui ferait 10h en tout).

  • Facebook : 06 minutes pour rĂ©pondre, liker et commenter

Mon avis : ça me paraüt jouable 😉

  • Linkedin : 06 minutes pour promouvoir, partager et poser des questions

Mon avis : ça me paraßt correct aussi !

  • Pinterest : 04 minutes pour Ă©pingler et s’engager avec les pinners

Mon avis : ça me paraĂźt un peu court … le temps de regarder les photos, ça prend dĂ©jĂ  au moins 05 minutes, non ??

  • Google+ : 02 minutes pour partager et poser des questions

Mon avis : c’est – trop – court ! 02 minutes !!? Je pense qu’il faut passer un peu plus de temps sur ce rĂ©seau, et optimiser son profil … surtout qu’il serait bon pour le SEO …,

  • Instagram : 02 minutes pour promouvoir et citer (?)

Mon avis : je n’ai pas Instagram … mais 02 minutes, c’est assez court.

Au final, pensez Ă  votre e-rĂ©putation ! N’automatisez pas tout, sinon la qualitĂ© peut se faire ressentir 😉

Bon courage,

VĂ©ronique Duong –

Bonjour tout le monde !

Je regardais ce que mon logiciel de veille me rapatriait pour aujourd’hui, et j’ai dĂ©couvert une infographie trĂšs rigolote sur le rĂ©fĂ©rencement naturel … avec un dĂ©cor pour Halloween ! Originale 🙂

Cette illustration prĂ©sente les 8 pratiques / outils SEO indispensables que chacun devrait avoir pour l’Ă©vĂ©nement d’Halloween : audits de site web, recherches de mots-clĂ©s, optimisations de contenus, analyses des liens, analytics, etc.

La difficulté de chaque action SEO et son impact sur le classement de la page web sont notés par des citrouilles.

De ce fait, j’ai dĂ©cidĂ© de la partager avec vous ici ^^. Je remercie referenceur.be pour l’avoir postĂ© sur son blog, et merci Ă  Advanced Web Ranking pour l’avoir créée !

Outils SEO | Infographie SEO : les pratiques indispensables

Personnellement, je trouve qu’il n’y a rien de trĂšs nouveau au niveau des recommandations, mais il est toujours bon d’avoir des petites piqĂ»res de rappels (surtout dans le domaine du SEO … vu le nombre d’actions qui existent), et celle-ci le fait trĂšs bien !

Happy Halloween !!

VĂ©ronique Duong –