Bonjour tout le monde !
En effectuant ma veille informationnelle habituelle avec mon outil de veille automatisĂ©e, je suis tombĂ©e sur un article provenant du blog de Baidu Webmaster Tools. La publication porte sur pourquoi Baidu n’arrive pas Ă indexer certaines pages web çŸćșŠäžæ¶ćœćć ćæââspideræćçŻ
Voici les raisons officielles de Baidu ci-dessous :
Votre site est interdit aux crawlers (meta robots noindex, robots.txt avec un Disallow pour Baiduspider) …
Une volumĂ©trie de pages web faible dans votre site. Depuis que Baiduspider a sorti sa version 3.0, les sites web ayant peu de pages web ont vu leur taux d’indexation baissĂ© de 62% !
Le crawl a Ă©tĂ© dĂ©fectueux sur votre site. Le serveur de votre site est tombĂ© en panne provoquant un empĂȘchement au niveau du crawl de ce dernier par Baiduspider.
L’augmentation soudaine des pages dans le site (duplication de contenu Ă cause du CMS, etc.) : cela peut impacter l’indexation du site, et Baidu recommande vivement d’avoir un site stable qui ne soit pas « bouleversĂ© » par divers changements. En plus de la stabilitĂ©, il faut que le site soit suffisamment sĂ©curisĂ© pour Ă©viter que le site soit piratĂ© par les hackers.
Baidu a donnĂ© ces quatre raisons officielles sur son site, et on constate que les sites doivent ĂȘtre rĂ©ellement bien stables pour Ă©viter qu’ils rencontrent des problĂšmes lors de l’indexation.
Il y a quelques temps, j’ai rĂ©digĂ© un autre article sur la diffĂ©rence entre le crawl et l’indexation chez Baidu, et vous pouvez retrouver cet article ici : Comprendre la diffĂ©rence entre Crawl et Indexation sur Baidu
Si vous avez des questions sur le SEO en Chine, sur Baidu, écrivez moi à autoveille@gmail.com
Bon courage Ă tous !
VĂ©ronique Duong – Consultante SEO certifiĂ©e CESEO