archive

Web

Hello tout le monde !

Je viens de mettre la dernière news sur mon logiciel de veille en ligne, et j’ai eu envie de vous parler de … Yandex ! Oui, pour continuer à faire dans la diversité, j’ai décidé de vous présenter rapidement le générateur de mots-clés russe de Yandex !

Moteur de recherche russe : YandexBon, je vous rassure tout de suite, je ne lis et parle pas russe en plus (lol).

Yandex est un moteur de recherche qui a été créé en 1997à Moscou. Il me semble plus « transparent » que Baidu, et propose des versions anglaises de ses outils. Il se tournerait donc vers un public plutôt international qu’uniquement un public russe.

Voici l’interface qui se trouve sur la page d’accueil de Yandex Keyword Tool :

Générateur de mots-clés russe de Yandex | AUTOVEILLEIl suffit de saisir un mot-clé dans le champs prévu à cet effet, et de cliquer sur « Submit » pour obtenir les idées de mots-clés et leurs volumes de recherche par mois :

Idées de mots-clés et leurs volumes de recherche par mois sur YandexPour mieux cibler son public, on peut également faire une recherche de mots-clés selon la ville ou la province que l’on veut en Russie. Dans l’exemple ci-dessous, on voit qu’à Moscou, il y a environ 170 impressions par mois pour le mot-clé « russian food » :

Idées de mots-clés ciblées en Russie par Yandex | AUTOVEILLEOn peut également regarder les volumes de recherche et la popularité du mot-clé « russian food » sur l’ensemble des territoires dans le monde (les gens ont bien évidemment effectués leurs recherches sur le moteur Yandex) :

Idées de mots-clés et volumes de recherche à l'international sur Yandex | AUTOVEILLEDe tous les générateurs que j’ai utilisés, je trouve que celui de Yandex a le moins de fonctionnalités. Le plus complet, c’est bien celui de Google ! Bing a encore du boulot à faire (son générateur est en version beta). Celui de Baidu est assez complet, mais les statistiques sont comptées par jour, et non par mois, de ce fait, la logique de choix est différente.

Yandex reste intéressant à utliser, et je pense que je vais continuer à l’étudier, mais pas forcément à me spécialiser dessus comme je le ferai pour Baidu.

N’hésitez pas à le tester 😉

Bon courage à tous !

Véronique Duong –

Bonjour tout le monde !

Cela fait longtemps que je n’ai pas posté d’infographies ! Ce matin, en laissant ma veille automatisée avec mon logiciel de veille, il a rapatrié une nouvelle infographie SEO qui liste le top 10 des facteurs de positionnements de Google !

Pour résumer, l’algorithme de classements de Google dans la partie recherche naturelle / résultats naturels prendrait en compte :

– Les scores de Page MozRank (popularité = quantité de visites), MozTrust (confiance = qualité)

– Les liens externes (backlinks) avec ancres de textes (mots-clés)

– Les scores d’autorité de la page (plus une page est vieille, mieux serait-elle classée)

– Les métriques sur les backlinks (nombre total de backlinks, et selon le type : ancres de textes, liens externes, etc.)

– Les statistiques de popularité sur les réseaux sociaux comme :

  • les partages, les commentaires et les Like sur Facebook
  • les Tweets et Retweets sur Twitter
  • les +1 pour Google+ (même si on nous dit qu’ils ne valent pas grand chose …)
  • les partages sur Linkedin

– Le nombre de caractères dans les URL (éviter des URL trop longues !)

– La correspondance plus ou moins exacte des mots-clés dans le nom de domaine et les URL avec ceux de la requête de l’internaute

Voici l’infographie SEO, réalisée par Netmark.com (il y a une deuxième partie de l’infographie qui sera publiée en octobre) :

top 10 des facteurs de classement SEO de Google | AUTOVEILLE

 

Personne ne connait exactement ce que fait l’algorithme de classements de Google. Nous avons ici des hypothèses testées par de nombreux référenceurs, et qui donnent de bons résultats.

Mais aujourd’hui, concentrez-vous sur la qualité de vos contenus. Vos lecteurs doivent apprendre quelque chose de nouveau et d’intéressant sur chacune de vos pages web. Et, mettez souvent à jour vos contenus 🙂

Bon courage à tous,

Véronique Duong –

Bonjour à tous,

Pour faire suite à la publication de mon article précédent sur mon nouvel outil SEO (sur l’extraction automatique de balises title), j’ai effectué un test sur un site chinois qui est apparu parmi les premiers résultats dans la première SERP de Baidu.

Je voulais voir quels sites web apparaîtraient dans la première page de résultats naturels de Baidu avec un mot-clé ultra générique comme « 皮包 » (sac en cuir).

Baidu priorise bien évidemment ses propres services … bien plus que Google comme vous pourriez le constater. Je différencie donc les résultats provenant du nom de domaine baidu.com des autres sites web  :

Détails d'une SERP de Baidu | AUTOVEILLE

Celui qui m’a intéressé parmi les trois sites encadrés en vert, et le résultat http://www.bag86.com. (La date qui suit, est la date du dernier crawl de Baiduspider).

Pourquoi ? Le nom de domaine de http://www.bag86.com ne contient aucun mot chinois en pinyin, mais juste un mot anglais ultra, méga générique, « bag » suivi de « 86« , et il est très bien classé avec « 皮包 » (sac en cuir) sur Baidu. C’est la page d’accueil qui est très bien placée ici.

J’ai donc voulu en savoir plus en lançant quelques petites analyses sur cette page d’accueil et les title du site bag86.com.

Baidu m’indique que la page d’accueil de bag86.com n’est pas tout à fait optimisée … il y a une bonne moitié des éléments qui ne sont pas « valides » pour le moteur de recherche chinois (cliquez sur l’image pour agrandir) :

Elements qui devraient être optimisés par bag86 pour Baidu | AUTOVEILLE

Cependant, ces éléments auraient une importance plus minime car ils concernent essentiellement les attributs ALT, le CSS, le JavaScript, les images, qui ralentissent surtout le temps de chargement du site.

Baidu accorde une grande importance dans ces « recommandations » sur le JavaScript et le Flash car il ne les indexe pas du tout (contrairement à Google qui commencerait à indexer des contenus Flash).

En revanche, bag86.com a bien optimisé le reste (pas de Flash, etc.), ses meta tags, et surtout ses balises title selon Baidu :

Éléments bien optimisés sur la page d'accueil de bag86 | AUTOVEILLE

Les méta tags de http://www.bag86.com restent conformes aux règles des moteurs de recherche chinois car elles ne dépassent pas la limite de caractères et comportent des mots-clés :

Méta tags de bag86 de Baidu | AUTOVEILLE

La dernière fois que ces méta ont été mis à jour date du 10 juillet 2012.

Pour bien comprendre comment la page d’accueil peut être si bien positionnée … j’ai finalement procédé à l’extraction automatique de toutes les balises title du site. J’ai lancé un simple Ctrl+F pour vous montrer le nombre de fois que le mot-clé « 皮包 » est répété :

mot clé répété dans les balises title Baidu | AUTOVEILLEPour chaque title, le mot-clé est au moins répété 2 fois (en moyenne). Il est également répété dans les balises méta keywords et méta description. Pour Google, ça serait de la sur-optimisation absolue !!

Baidu prend également en compte le Page Rank. La page d’accueil bag86.com est très populaire (PR 4), et cela permettrait de comprendre pourquoi il est aussi bien classé dans la première SERP de Baidu.

Voilà, j’espère que cette analyse vous aurait appris quelque chose de plus sur Baidu ! 🙂

Bon courage à tous,

Véronique Duong –

Bonjour à tous !

J’ai récemment développé une nouvelle petite technique pour extraire toutes les balises title d’un site web en quelques secondes ! Cette nouvelle fonctionnalité va également rejoindre le package d’outils SEO d’AUTOVEILLE.

Pour faire cette extraction, j’ai eu besoin de « détourner » AUTOVEILLE Monitoring (le logiciel de veille) en tant qu’outil de crawl pour collecter toutes les pages du site web. A la suite de la récupération automatique des pages web du site, je lance ma règle d’extraction sur cette collecte pour n’extraire que les informations dont j’ai besoin : ici, les balises title.

J’ai pris le site d’Oliver Duffez pour faire le test :

1) Voici la première extraction brute, sans nettoyage

extraction automatique de balises title par AUTOVEILLE

 

2) Après quelques lignes de commandes lancées dans la Konsole de Kubuntu pour le nettoyage :

balises title wri extraites par AUTOVEILLE

 

En tout, l’extraction a duré moins de 2 secondes … mais dépendant de la taille du site, le temps d’extraction pourrait varier. On peut utiliser cette extraction de balises title pour vérifier la longueur de ces dernières, les mots-clés, etc. Très pratique dans l’ensemble.

 

Peu à peu, j’utilise de moins en moins Xenu ou autres outils de ce type pour faire les crawls, car je trouve qu’ils sont moins souples et personnalisables par rapport à AUTOVEILLE qui est composé d’outils codés essentiellement en Perl (mais pas que !).

En tout cas, si vous voulez tester la fonctionnalité d’extraction complète d’URL de site web (crawl) et/ou l’extraction de balises title, contactez-moi ! 🙂 Il se peut que j’ouvre une nouvelle session de tests, très bientôt, pour le SEO aussi. Les tests sont fait pour vous faire découvrir l’ingénierie linguistique / le traitement automatique des langues (ou des données plutôt), et ils ne sont pas payants.

Bon courage à tous !

Véronique Duong –

Bonjour à tous !

En effectuant ma veille automatisée de la matinée, mon logiciel de veille a rapatrié une infographie très intéressante ! Comment gérer une crise d’e-réputation sur les réseaux sociaux ? Et surtout comment répondre aux personnes qui vous critiquent sur la toile ? Sur le coup, on peut être extrêmement « furax », mais il ne faut surtout pas s’énerver et poster n’importe quoi (surtout des grossièretés) sur vos (ou pas) timelines.

En écrivant ces quelques lignes, l’histoire du restaurant Amy Bakery Company m’est revenue en tête. Il faut justement ne pas faire comme eux … Regardez un peu les messages qu’ils ont postés sur Facebook … c’est inadmissible (insultes envers les clients / les fans), et ils ont complètement détruit leur image en quelques heures :

Gérer une crise d'identité numérique sur les réseaux sociaux

 

Gérer une cyber-crise n’est pas facile, surtout quand on est sous l’émotion. On quitte l’écran du PC le temps de se remettre, on réfléchit, et on revient répondre calmement aux gens.

Voici quelques bons petits conseils à prendre dans l’infographie, réalisée par 360PR, ci-dessous :

Gestion de crise d'e-réputation sur les réseaux sociaux | AUTOVEILLE

 

Pour résumer :

  • Mettez en place un système de community management
  • Faites de la veille d’e-réputation, de la modération sur ce qui est dit sur vous (!!)
  • Restez « cool » et calme
  • Essayez de comprendre pourquoi on vous « attaque »
  • Au mieux, détournez une conversation à tonalité négative en positive

Bon courage à tous !

Véronique Duong –

Hello tout le monde !

Voici une information SEO express ! Ce matin, en effectuant une recherche de news en anglais, je suis tombée sur un résultat intéressant de The New York Times. J’ai apperçu une petite « nouveauté » au niveau de son affichage dans les SERP. Il est maintenant possible de mettre directement la barre de recherche interne d’un site dans les résultats de recherche :

Barre recherche interne intégrée aux SERP | AUTOVEILLE

Au tout début, je me suis demandée si c’était lié aux extensions d’annonces car The NYT a des annonces payantes. Et non; car c’est bel et bien un résultat de recherche naturel, c’est donc du SEO, et NON du SEA / SEM !) :

Extension d'annonces Adwords

Le code source de The New York Times qui implémente la barre de recherche interne sur le site :

Barre de recherche interne : code html pour créer la barre

Mais ce ne serait pas ce code HTML pour l’affichage de la barre dans les SERP, et je n’ai pas vu la trace d’une microdata dans la source non plus. Je suis allée vérifier sur Schema.org, et je n’ai pas trouvé l’implémentation d’une barre de recherche interne.

Si vous avez déjà vu d’autres cas de ce type, et que vous auriez une idée sur la provenance d’une barre de recherche interne intégrée dans les résultats naturels, pourriez-vous me contacter ? ou me laisser un commentaire ?

>>> EDIT : J’ai compris d’où cette barre vient !! Regardez le message de la capture d’écran ci-dessous (Google Webmaster Tools > Apparence de recherche) :

Barre de recherche interne dans les SERP automatiquement déclenchée

Elle est, en fait, déclenchée automatiquement par Google en fonction d’un de ses algorithmes et de la demande de l’internaute.

Bon courage à tous,

Véronique Duong –

Bonjour à tous !

Suite à la publication de mon article Tests de mon logiciel de veille AUTOVEILLE (datant du 9 août 2013),  l’agence Adecco m’a contactée pour tester mon outil de veille ! 🙂

J’ai lancé la veille automatique avec mon agrégateur de flux RSS (« fait maison ») sur l’un des flux surveillés par l’agence le 16 août 2013 et j’ai terminé la collecte automatique le 26 août 2013. La veille automatisée aura duré 10 jours. A la fin du test, le fichier Excel qui a stocké toutes les informations a été envoyé à Adecco.

adecco

Lors de ce test, je n’ai pas rencontré de problèmes particuliers au niveau du crawl ou de la conversion du XML en Excel. Cependant, un nettoyage semi-automatique au niveau des résumés ou des descriptions était nécessaire car des balises ont également été rapatriées.

Voici un extrait du fichier Excel final envoyé à Adecco après le nettoyage des balises dans les descriptions des informations :

Logiciel de veille : test de l'outil pour Adecco | AUTOVEILLE

A ce jour (04/09/2013), mon logiciel de veille a continué à tourner sur les éléments testés pour la veille de l’agence leader en offre d’emploi intérimaire. Une nouvelle a été rapatriée datant du 26 août 2013.

Je proposerais une nouvelle phase de tests dans 1 ou 2 mois (gratuit), si vous êtes intéressés, contactez-moi. Je ne peux prendre que 1 ou 2 personnes pu entreprises pour chaque session en raison d’un planning très chargé.

Grâce à vous, mon outil de veille s’améliore de plus en plus, et je vous en remercie ! 🙂

Bon courage à tous !

Véronique Duong –

Bonjour à tous !

Suite à la rédaction de mon article sur l’outil d’optimisation du SEO chinois sur Baidu, j’ai eu envie d’écrire un article plus complet en récapitulant toutes mes connaissances sur le référencement chinois.

Cet article est écrit, et il est en ligne sur Veille Digitale.com 🙂 : Optimiser le SEO chinois pour Baidu

Je vous invite à le lire pour avoir une première idée du référencement naturel en Chine. Beaucoup de choses similaires avec les techniques occidentales, mais également de nombreuses différences aux niveaux de la perception culturelle, de la censure, etc.

Je me spécialise de plus en plus sur Baidu car je ne vous cache pas que Google, avec l’annonce de la suppression définitive du Adwords Keyword Tool, m’a un peu déçue. J’ai peu à peu découvert les outils de Baidu, et je les trouve très performants ! 🙂 Après, il est certain que la barrière de la langue ne peut pas permettre à tout le monde de comprendre Baidu.

Je vous recommande à tous de faire une veille stratégique très régulièrement sur le SEO, surtout si vous êtes un spécialiste du domaine. Les choses évoluent très vite. Si je n’étais pas assistée de mes veilles automatisées avec mon logiciel de veille, je pense que je ne serais pas passée à Baidu en quelques mois.

Seo Chinois Baidu sur Veille DigitaleBon courage à tous !

Véronique Duong –

Bonjour à tous !

C’est la rentrée ! Nous sommes en Septembre ! Et pour bien commencer, je vous propose de faire un petit rappel sur ce qu’est le Big Data … ou plutôt quels sont les éléments principaux qui le constituent.

En effectuant ma veille automatisée avec mon logiciel de veille, je suis tombée sur une infographie qui démontre, de façon plus ou moins vulgarisée, les 4 principaux pilliers du Big Data.

Le Big Data se définirait par la règle des 4V : Volume, Variété, Véracité et Vélocité (Vitesse)

Je profite également de cet article pour donner une définition complète et détaillée du Big Data (une définition provenant du site d’IBM) :

Le Big Data se présente sous la forme de données structurées ou non structurées (texte, données de capteurs, son, vidéo, données sur le parcours, fichiers journaux, etc.). De nouvelles connaissances sont issues de l’analyse collective de ces données.

Les entreprises sont submergées de volumes de données croissants de tous types, qui se comptent en téraoctets, voire en pétaoctets. Le Big Data va bien au-delà de la seule notion de volume : il constitue une opportunité d’obtenir des connaissances sur des types de données et de contenus nouveaux, afin de rendre votre entreprise plus agile et de trouver enfin une réponse aux questions laissées en suspens.

D’après cette définition, le Big Data équivaut à tout ce que l’on trouve sur le web. En tout cas, c’est ma vision des choses. Chaque information, chaque vidéo, constitue une petite partie du Big Data. En veillant de façon régulière sur cette masse de données, les particuliers et les entreprises peuvent en apprendre de plus sur leurs domaines et affiner leurs stratégies. C’est pourquoi, il faut absolument gérer, classer, analyser ces données, ces informations.

Voici l’infographie sur les 4 pilliers du Big Data, réalisée par IBM :

Les 4 pilliers de la Big Data | AUTOVEILLEActuellement, aucun logiciel n’est encore capable de gérer toutes ces données sur le web. En plus de cela, il faut encore prendre en compte les données « cachées » dans le web profond ou le web invisible qui pourraient être encore plus difficile à récupérer. Les problématiques du Big Data font partie de notre quotidien, et il faudrait des solutions de plus en plus avancées pour gérer la masse de données qui ne cesse d’augmenter.

Bon courage à tous !

Véronique Duong –

Bonjour tout le monde !

Cela fait un moment que je voulais vous parler d’un outil SEO très intéressant proposé par Baidu. Il est très pratique pour repérer les problèmes techniques et sémantiques des pages web d’un site. Cet outil se trouve dans l’interface de Baidu Webmaster Tools, il se nomme « 页面优化建议 » soit littéralement « Conseils pour optimisation de pages« .

Il n’est pas nécessaire d’avoir un compte pour utiliser cet outil ! 🙂 N’hésitez pas à le tester (même si tout est en chinois … Baidu et / ou Google translation pourraient vous aider.

Quand vous vous connectez à Baidu Webmaster Tools, vous tombez sur cette page :

Page d'accueil de Baidu Webmaster Tools

Choisissez ensuite l’onglet 网站分析 (1) puis 页面优化建议 (2) :

Conseils d'optimisation de pages web par Baidu

Entrez l’URL de la page web à analyser dans le champs indiqué dans ma capture :

Analyse SEO par Baidu Webmaster Tools

Observez vos résultats 🙂 : AUTOVEILLE s’en sort plutôt bien avec 5 étoiles ! *****

Analyse SEO chinois Baidu pour AUTOVEILLE

La vitesse de chargement de ma page est de 1,09 seconde, soit plus rapide que 89% des autres sites en Chine.

Cependant, pour Baidu, j’ai quand même des éléments à optimiser :

Analyse SEO chinois Baidu pour AUTOVEILLE

Baidu me conseille de :

  • Réduire images et codes CSS (j’en ai très peu … donc je pense que c’est une recommandation générale)
  • Utiliser Gzip pour la compression des fichiers (c’est également une recommandation générale car je n’ai pas de fichiers téléchargeables sur mon site, juste un PDF sur ma page veille automatique)
  • Placer les codes JavaScript à la fin de la page HTML pour optimiser la vitesse de chargement (recommandation générale)

Pour le reste (meta tags, URL, mots-clés, etc.), Baidu estime que j’ai … tout bon 🙂 :

Analyse SEO Baidu pour AUTOVEILLE

J’adore cet outil ! C’est un peu un résumé des SEO best practises sur Baidu. Je n’ai pas (encore ?) trouvé cette fonctionnalité dans Google Webmaster Tools. C’est dommage ! Un équivalent serait le bienvenu en tout cas … #crossfingers.

Si vous voulez en savoir plus sur le SEO chinois, vous pouvez m’écrire ou me laisser un commentaire avec votre mail … j’essaye de répondre à tout le monde, même si je ne le fais pas tout de suite … dans l’heure qui suit 😉

Bon courage à tous,

Véronique Duong –