Chaîne de traitements pour extraire des attributs alt vides des images !

Bonjour tout le monde !

Un petit article rapide qui me replonge dans l’ingénierie linguistique et la R&D ! J’ai eu une demande pour extraire / trouver des attributs alt vides des images, et de façon précise. Après avoir cherché du côté des outils SEO, et n’ayant pas trouvé la solution, je me suis lancée à nouveau dans mes lignes de commandes Shell !

Le truc est assez simple à faire : je crawle tout le site afin de ne louper aucune page (merci AUTOVEILLE que j’ai détourné en crawler SEO). Voici mon test sur un site en exemple :

trouver-alt-vide-1-vduong

Ensuite, grâce à une Regex, je peux extraire tous les attributs alt vides du site et savoir de quelles images il s’agit :

extraction-attribut-alt-vide-SEO-vduong

Et voilà, tous les attributs alt vides sont mis en évidence, et il est évidemment possible de faire un export au format TXT ou CSV. Cette technique va me permettre d’automatiser pas mal d’extraction, et me faire gagner un temps fou ! 🙂

Dans le passé, j’avais déjà passé mal de temps à créer des petits outils et des chaînes de traitement pour identifier, faire correspondre, extraire des données automatiquement. Vous pouvez découvrir tout cela sur mon blog autoveille.free.fr

Si vous êtes intéressé, n’hésitez pas à me contacter 🙂

Bon courage à tous !

V̩ronique Duong РDirectrice chez Rankwell et passionn̩e par le SEO et le TAL !

Publicités

Laissez un petit mot à AUTOVEILLE ;)

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

%d blogueurs aiment cette page :