ChaĂźne de traitements pour extraire des attributs alt vides des images !
Bonjour tout le monde !
Un petit article rapide qui me replonge dans l’ingĂ©nierie linguistique et la R&D ! J’ai eu une demande pour extraire / trouver des attributs alt vides des images, et de façon prĂ©cise. AprĂšs avoir cherchĂ© du cĂŽtĂ© des outils SEO, et n’ayant pas trouvĂ© la solution, je me suis lancĂ©e Ă nouveau dans mes lignes de commandes Shell !
Le truc est assez simple Ă faire : je crawle tout le site afin de ne louper aucune page (merci AUTOVEILLE que j’ai dĂ©tournĂ© en crawler SEO). Voici mon test sur un site en exemple :
Ensuite, grĂące Ă une Regex, je peux extraire tous les attributs alt vides du site et savoir de quelles images il s’agit :
Et voilĂ , tous les attributs alt vides sont mis en Ă©vidence, et il est Ă©videmment possible de faire un export au format TXT ou CSV. Cette technique va me permettre d’automatiser pas mal d’extraction, et me faire gagner un temps fou ! đ
Dans le passĂ©, j’avais dĂ©jĂ passĂ© mal de temps Ă crĂ©er des petits outils et des chaĂźnes de traitement pour identifier, faire correspondre, extraire des donnĂ©es automatiquement. Vous pouvez dĂ©couvrir tout cela sur mon blog autoveille.free.fr
Si vous ĂȘtes intĂ©ressĂ©, n’hĂ©sitez pas Ă me contacter đ
Bon courage Ă tous !
VĂ©ronique Duong – Directrice chez Rankwell et passionnĂ©e par le SEO et le TAL !