Bonjour tout le monde !
Hier, je vous ai montrĂ© comment faire une veille automatique et une collecte sur des tweets. Aujourd’hui, je reviens avec un article sur une veille automatisĂ©e et l’extraction des commentaires dans les publications sur les mĂ©dias traditionnels ou les blogs et/ou les forums.
Les commentaires sont Ă©galement des verbatims intĂ©ressants Ă Ă©tudier pour l’e-rĂ©putation ou l’analyse d’opinions. En effet, c’est souvent dans ces derniers que les internautes expriment leurs pensĂ©es et leurs opinions sur un sujet.
Voici rapidement comment je fais pour collecter efficacement et rapidement des commentaires:
1) J’utilise AUTOVEILLE Monitoring et AUTOVEILLE Corpus pour faire ma collecte automatique (si vous voulez en savoir plus sur ces outils, je vous invite Ă aller sur mon site ou Ă m’Ă©crire).
Exemple > Extraction des commentaires ci-dessous:
2) Mes robots récupérent les commentaires au format HTML, et je fais une extraction de ces derniers dans un autre format exploitable par la plupart des outils de traitement automatique
Exemple > Les commentaires affichés dans ma Konsole (qui nécessitent bien évidemment encore quelques nettoyages)
3)Â Le corpus de commentaires extraits (Ă titre d’exemple)
Chaque collecte pour crĂ©er un corpus de commentaires est Ă©tudiĂ© et personnalisĂ© parce que chaque site ne prĂ©sente pas les choses de la mĂȘme façon. Il faut donc des outils adaptables pour rapatrier un maximum de verbatims.
N’hĂ©sitez pas Ă me donner vos avis, vos idĂ©es ou Ă m’Ă©crire si vous voulez en savoir plus đ
Bon courage –
Véronique Duong