archive

Web

Bonjour Ă  tous,

Pour faire suite Ă  la publication de mon article prĂ©cĂ©dent sur mon nouvel outil SEO (sur l’extraction automatique de balises title), j’ai effectuĂ© un test sur un site chinois qui est apparu parmi les premiers rĂ©sultats dans la premiĂšre SERP de Baidu.

Je voulais voir quels sites web apparaĂźtraient dans la premiĂšre page de rĂ©sultats naturels de Baidu avec un mot-clĂ© ultra gĂ©nĂ©rique comme « çšźćŒ… » (sac en cuir).

Baidu priorise bien Ă©videmment ses propres services … bien plus que Google comme vous pourriez le constater. Je diffĂ©rencie donc les rĂ©sultats provenant du nom de domaine baidu.com des autres sites web  :

Détails d'une SERP de Baidu | AUTOVEILLE

Celui qui m’a intĂ©ressĂ© parmi les trois sites encadrĂ©s en vert, et le rĂ©sultat http://www.bag86.com. (La date qui suit, est la date du dernier crawl de Baiduspider).

Pourquoi ? Le nom de domaine de http://www.bag86.com ne contient aucun mot chinois en pinyin, mais juste un mot anglais ultra, mĂ©ga gĂ©nĂ©rique, « bag » suivi de « 86« , et il est trĂšs bien classĂ© avec « çšźćŒ… » (sac en cuir) sur Baidu. C’est la page d’accueil qui est trĂšs bien placĂ©e ici.

J’ai donc voulu en savoir plus en lançant quelques petites analyses sur cette page d’accueil et les title du site bag86.com.

Baidu m’indique que la page d’accueil de bag86.com n’est pas tout Ă  fait optimisĂ©e … il y a une bonne moitiĂ© des Ă©lĂ©ments qui ne sont pas « valides » pour le moteur de recherche chinois (cliquez sur l’image pour agrandir) :

Elements qui devraient ĂȘtre optimisĂ©s par bag86 pour Baidu | AUTOVEILLE

Cependant, ces éléments auraient une importance plus minime car ils concernent essentiellement les attributs ALT, le CSS, le JavaScript, les images, qui ralentissent surtout le temps de chargement du site.

Baidu accorde une grande importance dans ces « recommandations » sur le JavaScript et le Flash car il ne les indexe pas du tout (contrairement Ă  Google qui commencerait Ă  indexer des contenus Flash).

En revanche, bag86.com a bien optimisé le reste (pas de Flash, etc.), ses meta tags, et surtout ses balises title selon Baidu :

ÉlĂ©ments bien optimisĂ©s sur la page d'accueil de bag86 | AUTOVEILLE

Les méta tags de http://www.bag86.com restent conformes aux rÚgles des moteurs de recherche chinois car elles ne dépassent pas la limite de caractÚres et comportent des mots-clés :

Méta tags de bag86 de Baidu | AUTOVEILLE

La derniÚre fois que ces méta ont été mis à jour date du 10 juillet 2012.

Pour bien comprendre comment la page d’accueil peut ĂȘtre si bien positionnĂ©e … j’ai finalement procĂ©dĂ© Ă  l’extraction automatique de toutes les balises title du site. J’ai lancĂ© un simple Ctrl+F pour vous montrer le nombre de fois que le mot-clĂ© « çšźćŒ… » est rĂ©pĂ©tĂ© :

mot clé répété dans les balises title Baidu | AUTOVEILLEPour chaque title, le mot-clé est au moins répété 2 fois (en moyenne). Il est également répété dans les balises méta keywords et méta description. Pour Google, ça serait de la sur-optimisation absolue !!

Baidu prend Ă©galement en compte le Page Rank. La page d’accueil bag86.com est trĂšs populaire (PR 4), et cela permettrait de comprendre pourquoi il est aussi bien classĂ© dans la premiĂšre SERP de Baidu.

VoilĂ , j’espĂšre que cette analyse vous aurait appris quelque chose de plus sur Baidu ! 🙂

Bon courage Ă  tous,

VĂ©ronique Duong –

Bonjour Ă  tous !

J’ai rĂ©cemment dĂ©veloppĂ© une nouvelle petite technique pour extraire toutes les balises title d’un site web en quelques secondes ! Cette nouvelle fonctionnalitĂ© va Ă©galement rejoindre le package d’outils SEO d’AUTOVEILLE.

Pour faire cette extraction, j’ai eu besoin de « dĂ©tourner » AUTOVEILLE Monitoring (le logiciel de veille) en tant qu’outil de crawl pour collecter toutes les pages du site web. A la suite de la rĂ©cupĂ©ration automatique des pages web du site, je lance ma rĂšgle d’extraction sur cette collecte pour n’extraire que les informations dont j’ai besoin : ici, les balises title.

J’ai pris le site d’Oliver Duffez pour faire le test :

1) Voici la premiĂšre extraction brute, sans nettoyage

extraction automatique de balises title par AUTOVEILLE

 

2) AprÚs quelques lignes de commandes lancées dans la Konsole de Kubuntu pour le nettoyage :

balises title wri extraites par AUTOVEILLE

 

En tout, l’extraction a durĂ© moins de 2 secondes … mais dĂ©pendant de la taille du site, le temps d’extraction pourrait varier. On peut utiliser cette extraction de balises title pour vĂ©rifier la longueur de ces derniĂšres, les mots-clĂ©s, etc. TrĂšs pratique dans l’ensemble.

 

Peu Ă  peu, j’utilise de moins en moins Xenu ou autres outils de ce type pour faire les crawls, car je trouve qu’ils sont moins souples et personnalisables par rapport Ă  AUTOVEILLE qui est composĂ© d’outils codĂ©s essentiellement en Perl (mais pas que !).

En tout cas, si vous voulez tester la fonctionnalitĂ© d’extraction complĂšte d’URL de site web (crawl) et/ou l’extraction de balises title, contactez-moi ! 🙂 Il se peut que j’ouvre une nouvelle session de tests, trĂšs bientĂŽt, pour le SEO aussi. Les tests sont fait pour vous faire dĂ©couvrir l’ingĂ©nierie linguistique / le traitement automatique des langues (ou des donnĂ©es plutĂŽt), et ils ne sont pas payants.

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour Ă  tous !

En effectuant ma veille automatisĂ©e de la matinĂ©e, mon logiciel de veille a rapatriĂ© une infographie trĂšs intĂ©ressante ! Comment gĂ©rer une crise d’e-rĂ©putation sur les rĂ©seaux sociaux ? Et surtout comment rĂ©pondre aux personnes qui vous critiquent sur la toile ? Sur le coup, on peut ĂȘtre extrĂȘmement « furax », mais il ne faut surtout pas s’Ă©nerver et poster n’importe quoi (surtout des grossiĂšretĂ©s) sur vos (ou pas) timelines.

En Ă©crivant ces quelques lignes, l’histoire du restaurant Amy Bakery Company m’est revenue en tĂȘte. Il faut justement ne pas faire comme eux … Regardez un peu les messages qu’ils ont postĂ©s sur Facebook … c’est inadmissible (insultes envers les clients / les fans), et ils ont complĂštement dĂ©truit leur image en quelques heures :

Gérer une crise d'identité numérique sur les réseaux sociaux

 

GĂ©rer une cyber-crise n’est pas facile, surtout quand on est sous l’Ă©motion. On quitte l’Ă©cran du PC le temps de se remettre, on rĂ©flĂ©chit, et on revient rĂ©pondre calmement aux gens.

Voici quelques bons petits conseils Ă  prendre dans l’infographie, rĂ©alisĂ©e par 360PR, ci-dessous :

Gestion de crise d'e-réputation sur les réseaux sociaux | AUTOVEILLE

 

Pour résumer :

  • Mettez en place un systĂšme de community management
  • Faites de la veille d’e-rĂ©putation, de la modĂ©ration sur ce qui est dit sur vous (!!)
  • Restez « cool » et calme
  • Essayez de comprendre pourquoi on vous « attaque »
  • Au mieux, dĂ©tournez une conversation Ă  tonalitĂ© nĂ©gative en positive

Bon courage Ă  tous !

VĂ©ronique Duong –

Hello tout le monde !

Voici une information SEO express ! Ce matin, en effectuant une recherche de news en anglais, je suis tombĂ©e sur un rĂ©sultat intĂ©ressant de The New York Times. J’ai apperçu une petite « nouveautĂ© » au niveau de son affichage dans les SERP. Il est maintenant possible de mettre directement la barre de recherche interne d’un site dans les rĂ©sultats de recherche :

Barre recherche interne intégrée aux SERP | AUTOVEILLE

Au tout dĂ©but, je me suis demandĂ©e si c’Ă©tait liĂ© aux extensions d’annonces car The NYT a des annonces payantes. Et non; car c’est bel et bien un rĂ©sultat de recherche naturel, c’est donc du SEO, et NON du SEA / SEM !) :

Extension d'annonces Adwords

Le code source de The New York Times qui implémente la barre de recherche interne sur le site :

Barre de recherche interne : code html pour créer la barre

Mais ce ne serait pas ce code HTML pour l’affichage de la barre dans les SERP, et je n’ai pas vu la trace d’une microdata dans la source non plus. Je suis allĂ©e vĂ©rifier sur Schema.org, et je n’ai pas trouvĂ© l’implĂ©mentation d’une barre de recherche interne.

Si vous avez dĂ©jĂ  vu d’autres cas de ce type, et que vous auriez une idĂ©e sur la provenance d’une barre de recherche interne intĂ©grĂ©e dans les rĂ©sultats naturels, pourriez-vous me contacter ? ou me laisser un commentaire ?

>>> EDIT : J’ai compris d’oĂč cette barre vient !! Regardez le message de la capture d’Ă©cran ci-dessous (Google Webmaster Tools > Apparence de recherche) :

Barre de recherche interne dans les SERP automatiquement déclenchée

Elle est, en fait, dĂ©clenchĂ©e automatiquement par Google en fonction d’un de ses algorithmes et de la demande de l’internaute.

Bon courage Ă  tous,

VĂ©ronique Duong –

Bonjour Ă  tous !

Suite Ă  la publication de mon article Tests de mon logiciel de veille AUTOVEILLE (datant du 9 aoĂ»t 2013),  l’agence Adecco m’a contactĂ©e pour tester mon outil de veille ! 🙂

J’ai lancĂ© la veille automatique avec mon agrĂ©gateur de flux RSS (« fait maison ») sur l’un des flux surveillĂ©s par l’agence le 16 aoĂ»t 2013 et j’ai terminĂ© la collecte automatique le 26 aoĂ»t 2013. La veille automatisĂ©e aura durĂ© 10 jours. A la fin du test, le fichier Excel qui a stockĂ© toutes les informations a Ă©tĂ© envoyĂ© Ă  Adecco.

adecco

Lors de ce test, je n’ai pas rencontrĂ© de problĂšmes particuliers au niveau du crawl ou de la conversion du XML en Excel. Cependant, un nettoyage semi-automatique au niveau des rĂ©sumĂ©s ou des descriptions Ă©tait nĂ©cessaire car des balises ont Ă©galement Ă©tĂ© rapatriĂ©es.

Voici un extrait du fichier Excel final envoyé à Adecco aprÚs le nettoyage des balises dans les descriptions des informations :

Logiciel de veille : test de l'outil pour Adecco | AUTOVEILLE

A ce jour (04/09/2013), mon logiciel de veille a continuĂ© Ă  tourner sur les Ă©lĂ©ments testĂ©s pour la veille de l’agence leader en offre d’emploi intĂ©rimaire. Une nouvelle a Ă©tĂ© rapatriĂ©e datant du 26 aoĂ»t 2013.

Je proposerais une nouvelle phase de tests dans 1 ou 2 mois (gratuit), si vous ĂȘtes intĂ©ressĂ©s, contactez-moi. Je ne peux prendre que 1 ou 2 personnes pu entreprises pour chaque session en raison d’un planning trĂšs chargĂ©.

GrĂące Ă  vous, mon outil de veille s’amĂ©liore de plus en plus, et je vous en remercie ! 🙂

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour Ă  tous !

Suite Ă  la rĂ©daction de mon article sur l’outil d’optimisation du SEO chinois sur Baidu, j’ai eu envie d’Ă©crire un article plus complet en rĂ©capitulant toutes mes connaissances sur le rĂ©fĂ©rencement chinois.

Cet article est Ă©crit, et il est en ligne sur Veille Digitale.com 🙂 : Optimiser le SEO chinois pour Baidu

Je vous invite à le lire pour avoir une premiÚre idée du référencement naturel en Chine. Beaucoup de choses similaires avec les techniques occidentales, mais également de nombreuses différences aux niveaux de la perception culturelle, de la censure, etc.

Je me spĂ©cialise de plus en plus sur Baidu car je ne vous cache pas que Google, avec l’annonce de la suppression dĂ©finitive du Adwords Keyword Tool, m’a un peu déçue. J’ai peu Ă  peu dĂ©couvert les outils de Baidu, et je les trouve trĂšs performants ! 🙂 AprĂšs, il est certain que la barriĂšre de la langue ne peut pas permettre Ă  tout le monde de comprendre Baidu.

Je vous recommande Ă  tous de faire une veille stratĂ©gique trĂšs rĂ©guliĂšrement sur le SEO, surtout si vous ĂȘtes un spĂ©cialiste du domaine. Les choses Ă©voluent trĂšs vite. Si je n’Ă©tais pas assistĂ©e de mes veilles automatisĂ©es avec mon logiciel de veille, je pense que je ne serais pas passĂ©e Ă  Baidu en quelques mois.

Seo Chinois Baidu sur Veille DigitaleBon courage Ă  tous !

VĂ©ronique Duong –

Bonjour Ă  tous !

C’est la rentrĂ©e ! Nous sommes en Septembre ! Et pour bien commencer, je vous propose de faire un petit rappel sur ce qu’est le Big Data … ou plutĂŽt quels sont les Ă©lĂ©ments principaux qui le constituent.

En effectuant ma veille automatisée avec mon logiciel de veille, je suis tombée sur une infographie qui démontre, de façon plus ou moins vulgarisée, les 4 principaux pilliers du Big Data.

Le Big Data se définirait par la rÚgle des 4V : Volume, Variété, Véracité et Vélocité (Vitesse)

Je profite Ă©galement de cet article pour donner une dĂ©finition complĂšte et dĂ©taillĂ©e du Big Data (une dĂ©finition provenant du site d’IBM) :

Le Big Data se prĂ©sente sous la forme de donnĂ©es structurĂ©es ou non structurĂ©es (texte, donnĂ©es de capteurs, son, vidĂ©o, donnĂ©es sur le parcours, fichiers journaux, etc.). De nouvelles connaissances sont issues de l’analyse collective de ces donnĂ©es.

Les entreprises sont submergĂ©es de volumes de donnĂ©es croissants de tous types, qui se comptent en tĂ©raoctets, voire en pĂ©taoctets. Le Big Data va bien au-delĂ  de la seule notion de volume : il constitue une opportunitĂ© d’obtenir des connaissances sur des types de donnĂ©es et de contenus nouveaux, afin de rendre votre entreprise plus agile et de trouver enfin une rĂ©ponse aux questions laissĂ©es en suspens.

D’aprĂšs cette dĂ©finition, le Big Data Ă©quivaut Ă  tout ce que l’on trouve sur le web. En tout cas, c’est ma vision des choses. Chaque information, chaque vidĂ©o, constitue une petite partie du Big Data. En veillant de façon rĂ©guliĂšre sur cette masse de donnĂ©es, les particuliers et les entreprises peuvent en apprendre de plus sur leurs domaines et affiner leurs stratĂ©gies. C’est pourquoi, il faut absolument gĂ©rer, classer, analyser ces donnĂ©es, ces informations.

Voici l’infographie sur les 4 pilliers du Big Data, rĂ©alisĂ©e par IBM :

Les 4 pilliers de la Big Data | AUTOVEILLEActuellement, aucun logiciel n’est encore capable de gĂ©rer toutes ces donnĂ©es sur le web. En plus de cela, il faut encore prendre en compte les donnĂ©es « cachĂ©es » dans le web profond ou le web invisible qui pourraient ĂȘtre encore plus difficile Ă  rĂ©cupĂ©rer. Les problĂ©matiques du Big Data font partie de notre quotidien, et il faudrait des solutions de plus en plus avancĂ©es pour gĂ©rer la masse de donnĂ©es qui ne cesse d’augmenter.

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour tout le monde !

Cela fait un moment que je voulais vous parler d’un outil SEO trĂšs intĂ©ressant proposĂ© par Baidu. Il est trĂšs pratique pour repĂ©rer les problĂšmes techniques et sĂ©mantiques des pages web d’un site. Cet outil se trouve dans l’interface de Baidu Webmaster Tools, il se nomme « éĄ”éąäŒ˜ćŒ–ć»șèźź » soit littĂ©ralement « Conseils pour optimisation de pages« .

Il n’est pas nĂ©cessaire d’avoir un compte pour utiliser cet outil ! 🙂 N’hĂ©sitez pas Ă  le tester (mĂȘme si tout est en chinois … Baidu et / ou Google translation pourraient vous aider.

Quand vous vous connectez Ă  Baidu Webmaster Tools, vous tombez sur cette page :

Page d'accueil de Baidu Webmaster Tools

Choisissez ensuite l’onglet çœ‘ç«™ćˆ†æž (1) puisÂ éĄ”éąäŒ˜ćŒ–ć»șèźź (2) :

Conseils d'optimisation de pages web par Baidu

Entrez l’URL de la page web Ă  analyser dans le champs indiquĂ© dans ma capture :

Analyse SEO par Baidu Webmaster Tools

Observez vos rĂ©sultats 🙂 : AUTOVEILLE s’en sort plutĂŽt bien avec 5 Ă©toiles ! *****

Analyse SEO chinois Baidu pour AUTOVEILLE

La vitesse de chargement de ma page est de 1,09 seconde, soit plus rapide que 89% des autres sites en Chine.

Cependant, pour Baidu, j’ai quand mĂȘme des Ă©lĂ©ments Ă  optimiser :

Analyse SEO chinois Baidu pour AUTOVEILLE

Baidu me conseille de :

  • RĂ©duire images et codes CSS (j’en ai trĂšs peu … donc je pense que c’est une recommandation gĂ©nĂ©rale)
  • Utiliser Gzip pour la compression des fichiers (c’est Ă©galement une recommandation gĂ©nĂ©rale car je n’ai pas de fichiers tĂ©lĂ©chargeables sur mon site, juste un PDF sur ma page veille automatique)
  • Placer les codes JavaScript Ă  la fin de la page HTML pour optimiser la vitesse de chargement (recommandation gĂ©nĂ©rale)

Pour le reste (meta tags, URL, mots-clĂ©s, etc.), Baidu estime que j’ai … tout bon 🙂 :

Analyse SEO Baidu pour AUTOVEILLE

J’adore cet outil ! C’est un peu un rĂ©sumĂ© des SEO best practises sur Baidu. Je n’ai pas (encore ?) trouvĂ© cette fonctionnalitĂ© dans Google Webmaster Tools. C’est dommage ! Un Ă©quivalent serait le bienvenu en tout cas … #crossfingers.

Si vous voulez en savoir plus sur le SEO chinois, vous pouvez m’Ă©crire ou me laisser un commentaire avec votre mail … j’essaye de rĂ©pondre Ă  tout le monde, mĂȘme si je ne le fais pas tout de suite … dans l’heure qui suit 😉

Bon courage Ă  tous,

VĂ©ronique Duong –

Bonjour tout le monde 🙂

Ce matin, en voulant dĂ©velopper une nouvelle fonctionnalitĂ© pour rĂ©cupĂ©rer des images via mon logiciel de veille, j’ai fait une petite recherche de visuels dans le moteur Google.com (version amĂ©ricaine). Et … je suis tombĂ©e sur un slideshow d’images rangĂ©es par catĂ©gories !

Ce slideshow se trouve au dessus des rĂ©sultats d’images :

Google change l'affichage des résultats d'images : un slideshow en plus !

 

Personnellement, j’aime beaucoup le nouvel affichage des visuels. Il met vraiment en valeur ces derniĂšres et leurs donne une apparence trĂšs propre et professionnelle. Cela serait bien que ça se dĂ©ploie en France. Si les images sont trĂšs belles et attirantes, les internautes iraient cliquer dessus.

1) Pensez donc Ă  bien optimiser vos images pour le SEO en les nommant bien (on Ă©vite de laisser IMG001.jpg qui n’est pas pertinent),

2) Donnez systĂ©matiquement une description des images dans l’attribut alt

3) Choisissez des images de bonne qualité et non trop volumineuse

4) Entourez Ă©galement votre image dans un contexte textuel pertinent, car les moteurs ne lisent pas les images en elles-mĂȘme, mais se basent aussi sur leurs environnements sĂ©mantiques

De plus, en fournissant un beau design, de beaux visuels sur votre site, cela vous donne une image numĂ©rique trĂšs professionnelle, et ce n’est pas plus mal 😉

VoilĂ  pour ces quelques conseils rapides ! Et vous, qu’en pensez-vous de ce nouvel affichage ?

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour bonjour,

Les gens reviennent de vacances, et les activités reprennent !

Mon logiciel de veille me rapatrie de plus en plus de donnĂ©es tous les jours ! Et grĂące Ă  la collecte automatique d’aujourd’hui, je suis tombĂ©e sur une infographie assez intĂ©ressante de Twitter : Les gens qui vous suivent sur Twitter seraient des acheteurs potentiels de vos produits et de vos services.

Cela me paraĂźt assez logique. Si un follower humain (on ne compte pas les followers spam et robots bien sĂ»r) vous suit, c’est qu’il est certainement intĂ©ressĂ© par ce que vous faites ou proposez.

Les statistiques de l’infographie, rĂ©alisĂ©e par @TwitterSmallBiz, ci-dessous, montrent qu’il y a environ:

  • 86% des followers qui visiteraient le site d’une PME si elle a Ă©tĂ© recommandĂ©e par un ami
  • 85% des followers qui se sentiraient plus « proches » et « connectĂ©s » des PME (que des grosses boĂźtes)
  • 72% des followers qui achĂšteraient plus facilement auprĂšs des PME
  • 61% des followers qui iraient interagir rĂ©guliĂšrement avec les PME

Les chiffres sont assez importants (voire Ă©norme) je trouve … bien plus de la moitiĂ© des followers seraient des acheteurs potentiels ! Est-ce votre cas ? Avez-vous des conversions provenant de Twitter ?

Je vous laisse découvrir cette infographie de Twitter pour les PME :

Twitter pour le business des PME | AUTOVEILLE

 

Bon courage Ă  tous !

VĂ©ronique Duong –