archive

Archives de Tag: SEO

Bonjour tout le monde !

Dans un autre article, je vous expliquais que j’utilisais des ontologies sémantiques pour créer des relations sémantiques entre les pages d’un site (surtout depuis le menu), et aujourd’hui, je vais vous parler d’une autre notion en linguistique, la taxinomie 🙂

Déjà, qu’est ce que c’est que la taxinomie en linguistique ? Voici une définition scientifique du terme : « Classification d’éléments, de suites d’éléments formant des listes qui permettront, par leurs règles de combinaison, de rendre compte des phrases d’une langue (d’apr. Ling. 1972). » Source : http://www.cnrtl.fr/lexicographie/taxinomie

Il ne faut pas confondre la taxinomie et la taxonomie. C’est effectivement deux choses différentes : La taxinomie concerne plus spécialement les questions de classification, tandis que la taxonomie se rapporte strictement aux questions de nomenclature, de liste.

On rencontre très souvent des taxinomies en biologie et dans le monde scientifique.

Voici un exemple de taxinomie des bactéries :

classification-taxonomie-des-bacteries-autoveille

Source : http://andryrasamindrakotroka.e-monsite.com/medias/album/classification-taxonomie-des-bacteries-5.jpg

Comme pour les ontologies, on part du plus générique au plus spécifique. Mais vous allez vous demander ce qu’est la différence entre ontologies et taxinomies. Voici les définitions des deux termes :

L’ontologie est faite pour décrire le monde tel qu’il est. L’ontologie cherche à décrire de façon formelle un domaine de connaissance, en identifiant les types d’objets de ce domaine, leurs propriétés et leurs relations. En SEO, c’est plutôt les ontologies qu’on utilise car on est dans un mode de « relations » (et plus exactement de « relations sémantiques »).

Exemple d’ontologie où on voit les liens sémantiques :

ontologie-liens-semantiques-SEO-vduong

Source : upload.wikimedia.org/wikipedia/commons/b/b1/Mason-ontology.png

La taxinomie est fait pour classer des ressources dans des dossiers, des catégories. En d’autres termes, elle désigne la « science de la classification » et par extension tout système de classification/catégorisation. Donc, en SEO, les taxinomies peuvent nous aider bien structurer un site par exemple, en classant les différentes pages, à différents niveaux.

Ce sont vraiment deux concepts différents en linguistique qui peuvent être très intéressants à appliquer en SEO comme vous pouvez le constater là.

Si cela vous intéresse, je vous ferais aussi un petit article sur les mesures de Rappel et Précision que j’ai adorées utiliser en Master pour faire des statistiques textuelles !

Bon courage à tous !

Véronique Duong – Consultante SEO certifiée et passionnée

Publicité

Bonjour tout le monde !

Je vous propose ce nouvel article suite à la découverte d’une infographie super intéressante lors de  ma veille stratégique d’informations SEO / SMO / SEM. Mon logiciel de veille a en effet récupéré une illustration expliquant comment fonctionnerait Google (crawl, indexation, l’envoi d’une requête des internautes dans sa base de données, matching (= correspondance), etc.).

Elle est très complète à mon avis, et les étapes sont très détaillées. Elle a été réalisée par PPC Blog. L’auteur parle du crawl, de l’indexation, tout en passant par les filtres (déployés en fonction des mots-clés, requêtes, synonymes, etc.) probablement utilisés par le moteur de recherche américain.

Il y a quelques temps, j’avais émis des hypothèses sur le fonctionnement possible des moteurs de recherche, et je pense que cette infographie complète ma recherche. Le moteur crawl et indexe des milliers de pages web, et selon les mots-clés saisis par les internautes qui ont été passé dans les différents filtres (cela me rappelle beaucoup la partie avec egrep dans mon étude), il affiche les résultats dans ses SERP.

Voici l’infographie, zoomez au maximum pour qu’elle soit lisible :

Comment fonctionne Google ? - par AUTOVEILLE

Gardez cette infographie quelque part car je pense qu’elle pourrait être très utile pour illustrer certaines études.

Qu’en pensez-vous de cette infographie ? N’hésitez pas à laisser vos avis et vos points de vue.

Bon courage à tous !

Véronique Duong –

Bonjour tout le monde !

Ok, mon article commence par un titre relevant du jargon du traitement automatique des langues et de la fouille de textes. Vous devez vous dire « euh ok, et c’est quoi le TF-IDF ? », « qu’est ce que ça à voir avec le SEO ? » … Eh bien, je vais essayer de définir le TF-IDF en deux lignes avec des termes vulgarisés pour que vous comprenez :

Le TF-IDF (qui est le sigle de Term Frequency-Inverse Document Frequency) est une mesure statistique qui permet d’évaluer l’importance d’un terme contenu dans un document ou dans un ensemble de textes. Il varie en fonction de la fréquence d’apparition du mot-clé dans le corpus.

Des variantes de la formule originale sont souvent utilisées dans des moteurs de recherche pour apprécier la pertinence d’un document en fonction des critères de recherche de l’utilisateur. (Source : Wikipédia)

Voici la formule de calcul (ça semble assez abstrait … je sais) :

Formule calcul du TF-IDF

En gros, plus un mot-clé est présent dans un document ou dans un corpus ( = base de données de textes), plus le TF-IDF sera élevé pour ce mot. Baidu utiliserait cette technologie pour faire la correspondance entre les mots-clés d’une requête d’un internaute et les documents dans sa base (dans son moteur). Ainsi, il afficherait les pages HTML qui auraient le plus de pertinence par rapport aux mots-clés de la recherche. (Source de l’article TF-IDF框架与SEO衍生)

Nuage de mots-clés AUTOVEILLE

Apparemment, Google et Yahoo! utiliseraient aussi la formule du TF-IDF pour afficher les résultats de recherche selon les requêtes des utilisateurs. Donc, il ne faudrait plus se contenter d’optimiser certaines parties (ex : juste les méta tags) d’une page, mais vraiment toute la page web (des méta tags au contenu textuel) en pensant à la notion de la densité de mots-clés.

Personnellement, j’utilise un script Perl pour faire le calcul du TF-IDF.

Voici une exemple plus concret de calcul de TF-IDF pour plus de clarté (tiré directement de Wikipédia) :

Calcul TF-IDF pour le SEO - AUTOVEILLE

Bon courage à tous,

Véronique Duong –

Bonjour à tous !

En faisant mon suivi de positionnements, je pense que c’est le moment de poster un article sur les positions d’AUTOVEILLE sur Google. Mon site sur mon logiciel de veille et agrégateur de flux RSS automatique continue à grimper et commence à se stabiliser sur les requêtes que je voulais.

Avec le temps, je me rends compte que j’ai énormément appris en SEO grâce à mon site sur la veille automatique. J’ai créé mon site AUTOVEILLE dans le seul objectif de faire connaître le traitement automatique des langues, mes outils d’automatisation développés en Perl et l’ingénierie linguistique. Peu à peu, en optimisant mon propre site, le SEO est devenu une passion ! C’est comme des petits défis à relever tous les jours : tests, études, analyses, etc.

Si j’ai un conseil à donner à tous ceux qui font du SEO, c’est d’optimiser votre site tous les jours. Il faut dynamiser le site encore et encore … sans tomber dans la suroptimisation.

Un rapide aperçu de quelques rankings actuels d’AUTOVEILLE (le 19/07/13) :

Logiciel de veille: positionnements d'AUTOVEILLE sur GooglePour maintenir des positionnements au dessus de la ligne de flottaison (je ne vise pas forcément à être 1ère car pour moi, être dans le top 4/5, c’est très bien), il faut être prêt à y consacrer du temps, beaucoup de temps. Il ne faut pas croire que le SEO, c’est juste modifier des méta tags, écrire du texte … c’est bien plus (ce n’est pas pour rien que c’est un métier à plein temps qui demande de la disponibilité).

Actuellement, je me spécialise un peu plus sur le SEO chinois, car il y a de plus en plus de problématiques sur le sujet, et c’est un marché à découvrir !

Bon courage à tous !

Véronique Duong –

Bonjour à tous !

En ce moment, je suis en train de mettre à jour ma stratégie de veille automatique, et donc mes logiciels de veille, c’est pour cela que je vous donne moins de nouvelles sur mes outils Perl pour les automatisations, mais c’est parce que je vous prépare un article pour vous annoncer les nouvelles mises à jour.

En revanche, au niveau du SEO, j’ai de quoi m’occuper ! Tous les critères SEO sur les méta tags, attributs alt, rédaction web, netlinking, partenariats … à gogo et à prendre en compte lors de mes optimisations/ Et ce n’est pas pour me déplaire. Je commence également à apprendre à former des équipes de ma boîte au référencement naturel ( » … apprendre à former ? » … un « pléonasme » comme dirait un de mes amis (vive les linguistes) !, mais c’est bien le cas, je n’ai jamais été dans la peau d’un professeur).

Et pour ne jamais oublier ce que je dois faire, je me suis mise aux infographies (comme vous l’aurez remarqué en ce moment). C’est très visuel, et si c’est bien fait, c’est encore mieux qu’un texte ! On comprend vite le schéma et on le retient plus facilement. J’imprime certaines d’entre elles, et je les colle sur un mur (bientôt, je vais inventer le SEO wall !!)

Aujourd’hui, j’ai trouvé une jolie infographie reprennant 8 points principaux du SEO pour mettre en place une bonne stratégie. Elle s’applique aussi à ceux qui ont un blog WordPress:

 

Infographie SEO: Astuces référencement naturel

En tout cas, si vous voulez avoir quelques astuces SEO, de veille, ou autres sujets geeks au quotidien, vous pouvez me suivre sur Twitter ou suivre le blog directement 🙂

Bon courage !

Véronique Duong –

Bonjour tout le monde !

Aujourd’hui, je vous propose un article avec quelques conseils sur l’optimisation du SEO d’un site. Faire du SEO, c’est bon pour la santé du site, mais faire trop de SEO, c’est mauvais. Comme tout excès me diriez-vous. On appelle cela de la sur-optimisation, et il faut éviter même si on est tenté de faire cela pour arriver sur la 1ere SERP.

1) Utilisez les termes et la phraséologie de votre client. Cela est très important pour l’image de la marque. Si votre client veut se positionner sur quelques expressions moins recherchées mais qui relèvent de leurs domaines, il faut les utiliser.

2) Employez systématiquement les noms des produits ou des services de votre client. Il ne faut pas modifier les appellations car cela peut également « altérer » à l’image de la marque.

3) Ne mettez pas tout le temps le même mot-clé dans les pages. Il faut varier, utiliser des synonymes, des expressions plus longues ou plus courtes qui veulent dire la même chose. Il faut que le vocabulaire soit le plus riche possible.

4) Ne faites pas de sur-optimisation. Cela ne va pas améliorer votre visibilité, au contraire.

5) Optimisez normalement, en produisant très souvent du contenu de qualité, et mettez les pages en ligne par « petit lot ».

6) Evitez de mettre 10000 pages en ligne d’un coup. Les moteurs de recherche vont trouver cela très suspect.

Après avoir optimisé, soyez patient. Le SEO, c’est un processus sur le long terme. Il faut laisser le temps aux moteurs de recherche de trouver les pages, de crawler, d’indexer, de classer, etc. De temps en temps, il faut laisser la « magie » des moteurs de recherche agir.

Bon courage !

Véronique Duong –

Bonjour tout le monde !

Je reviens avec un article sur l’outil de générateur de mots-clés chinois, Baidu Paid Search. J’avais déjà fait un article (Baidu « Keywords Generator » 百度推广) sur cet outil SEO, mais je n’étais pas allée dans les détails. C’était juste une rapide introduction à Baidu Paid Search.

Si vous avez lu mon premier article, vous avez déjà vu à quoi ressemble l’interface. Je vais tout de même vous faire un article détaillé cette fois, et vous montrer étape par étape Baidu Paid Search.

Je vous invite à utiliser le navigateur Internet Explorer (pour plus de stabilité). Veuillez cliquer sur les images pour les agrandir.

1) En vous connectant, vous tombez sur l’interface ci-dessous. Pour accéder au générateur de mots-clés de Baidu, il faut cliquer sur le 2e onglet (pour ceux qui ne savent pas lire le chinois, j’ai mis une petite flèche rouge pour vous guider :))

baidu keyword generator SEO

2) Ensuite, après avoir cliqué sur le deuxième onglet, on tombe sur cette page (à chaque fois que vous cliquez sur une rubrique, Baidu l’ouvre dans un nouvel onglet de votre navigateur … la plupart des sites chinois font cela … ils mettent des _blank partout :p). Pour accèder au générateur de mots-clés Baidu, il faut cliquer sur la dernière rubrique (encadré orange)

Baidu SEM interface Baidu Paid Search

3) Après avoir cliqué sur cette rubrique, vous trouverez toutes les annonces en cours, et toutes les données qui vont avec (CPC, CTR, QS, etc.). Mais ce qui nous intéresse ici, c’est le SEO, et le sujet du jour … c’est accèder à Baidu « Keyword Generator ». Cliquer sur l’onglet encadré en rouge:

Générateur de mots-clés Baidu Paid Search

4) Et voilà, nous sommes (enfin !) arrivés dans le générateur de mots-clés de Baidu. Il n’y a pas la fonction « export CSV » sur Baidu, donc pour récupérer les mots-clés, cliquez sur ceux qui vous intéressent, et copier / coller les dans un Excel.

Baidu Keyword Generator interface

Si vous vous concentrez uniquement sur la Chine continentale, je vous conseille d’utiliser Baidu pour faire vos études de mots-clés. Par contre, si vous travaillez également sur Hong Kong ou Taïwan, je vous conseille d’utiliser Adwords.

Si vous avez des questions, n’hésitez pas à me les poser par mail ou dans les commentaires 🙂

Bon courage !

Véronique Duong –

PS: Je viens de finir une conf call en cantonais avec Hong Kong sur le SEO de la Chine continentale … très intéressant de parler de référencement naturel avec un autre pays ! Les logiques restent les mêmes.

Bonjour à tous 🙂

Un petit article pour vous montrer comment écrire automatiquement la balise SEO title avec du Perl ! Cette technique peut vous sembler un peu black hat, mais si on utilise bien l’automatisation, il n’y a rien de bien méchant, voire cela pourrait être un petit coup de pouce si jamais on a beaucoup de pages à travailler. Comme vous l’auriez constater, j’adore coupler SEO et traitement automatique des langues quand il est possible (bien sûr !).

Voici un petit exemple (que j’ai repris de ma page AUTOVEILLE des outils SEO) pour automatiser l’écriture de la balise title:

 

automatiser l'écriture des balises title

On constate que les balises title en sortie sont bien structurées et propres, et elles ont été écrites en quelques secondes ! Si vous souhaitez d’autres exemples, faites moi signe ! 🙂

L’écriture des méta descriptions peut également être automatisée.

N’hésitez pas à vous rendre sur le site officiel d’AUTOVEILLE de temps en temps pour vous tenir au courant des nouveaux services que je mets en place.

Bon courage !

Véronique Duong –

Hello tout le monde !

Me revoilà avec un nouvel article 100% geek ! Je vais vous montrer comment extraire automatiquement les liens internes d’une page web. Ce n’est pas bien compliqué si vous maîtrisez la programmation Perl, les lignes de commandes Shell, et le Terminal de Linux.

Pour pouvoir implémenter ce test, il faut installer le module WWW::Mechanize que l’on peut trouver sur CPAN.

Le script Perl pour le crawl ressemble à cela:

script Perl WWW::MechanizeIl est très très court comme vous pouvez le constater, mais assez robuste pour extraire automatiquement toutes les URL d’une page web. Si vous souhaitez extraire toutes les URL de toutes les pages d’un site, il faudra adapter le code (ce qui peut se faire assez facilement).

Voici les liens extraits de ma page d’accueil d’AUTOVEILLE (capture d’écran de ma konsole Linux):

extraction de liens d'une page web

Si vous n’êtes pas du tout programmation, je peux vous proposer l’outil LinkExtractor qui fait à peu près le même boulot.

Cependant, avec un outil comme LinkExtractor, vous ne pouvez pas le personnaliser, le modifier, vous n’avez pas la main dessus pour l’adapter à vos besoins pro ou perso.

Si vous avez des questions ou un avis, n’hésitez pas à me les poser par mail ou à me laisser un mot dans les commentaires. Je serai contente de vous lire et / ou de vous répondre ! 🙂

Merci et bon courage !

Véronique Duong

%d blogueurs aiment cette page :