ChaĂźne de traitements pour extraire des attributs alt vides des images !

Bonjour tout le monde !

Un petit article rapide qui me replonge dans l’ingĂ©nierie linguistique et la R&D ! J’ai eu une demande pour extraire / trouver des attributs alt vides des images, et de façon prĂ©cise. AprĂšs avoir cherchĂ© du cĂŽtĂ© des outils SEO, et n’ayant pas trouvĂ© la solution, je me suis lancĂ©e Ă  nouveau dans mes lignes de commandes Shell !

Le truc est assez simple Ă  faire : je crawle tout le site afin de ne louper aucune page (merci AUTOVEILLE que j’ai dĂ©tournĂ© en crawler SEO). Voici mon test sur un site en exemple :

trouver-alt-vide-1-vduong

Ensuite, grĂące Ă  une Regex, je peux extraire tous les attributs alt vides du site et savoir de quelles images il s’agit :

extraction-attribut-alt-vide-SEO-vduong

Et voilĂ , tous les attributs alt vides sont mis en Ă©vidence, et il est Ă©videmment possible de faire un export au format TXT ou CSV. Cette technique va me permettre d’automatiser pas mal d’extraction, et me faire gagner un temps fou ! 🙂

Dans le passĂ©, j’avais dĂ©jĂ  passĂ© mal de temps Ă  crĂ©er des petits outils et des chaĂźnes de traitement pour identifier, faire correspondre, extraire des donnĂ©es automatiquement. Vous pouvez dĂ©couvrir tout cela sur mon blog autoveille.free.fr

Si vous ĂȘtes intĂ©ressĂ©, n’hĂ©sitez pas Ă  me contacter 🙂

Bon courage Ă  tous !

VĂ©ronique Duong – Directrice chez Rankwell et passionnĂ©e par le SEO et le TAL !

Publicité

Laissez un petit mot Ă  AUTOVEILLE ;)

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez Ă  l’aide de votre compte WordPress.com. DĂ©connexion /  Changer )

Photo Facebook

Vous commentez Ă  l’aide de votre compte Facebook. DĂ©connexion /  Changer )

Connexion Ă  %s

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

%d blogueurs aiment cette page :