Veille automatique et collecte de Tweets
Bonjour Ă tous,
Comme on me le demande souvent, j’ai dĂ©cidĂ© de faire un article pour vous montrer comment faire une veille automatique ainsi qu’une collecte automatique des tweets depuis Twitter.
Pour cela, je dĂ©veloppe un script Perl pour chaque crawl. C’est Ă dire que j’adapte mes crawls en fonction du type d’Ă©lĂ©ments Ă crawler. RĂ©cupĂ©rer des tweets est diffĂ©rent de rĂ©cupĂ©rer des pages web par exemple.
A partir d’une recherche de tweets par #hashtag, mot-clĂ© ou expressions clĂ©s, j’en crĂ©e un flux RSS que je passe sous AUTOVEILLE. Ensuite, mon logiciel de veille collecte les tweets au format XML, et je traite ce XML au format demandĂ© par le client.
Voici un exemple d’un tweet au format XML:
Avec quelques lignes de commandes Bash (Shell), je récupÚre uniquement les liens vers mes tweets collectés:
Encore un peu de nettoyage automatique pour retirer les balises link
Voilà , avec cette collecte, vous pouvez sauvegarder vos précieux tweets. Pour les afficher, il suffit de les repasser au format XML ou HTML. En repassant au format HTML, on obtient des tweets dans ce format:
J’adapte chaque veille / chaque collecte au cas par cas comme vous pouvez le constater.
Bon courage !
VĂ©ronique Duong –
Pingback: Logiciel veille: AgrĂ©gateur de flux RSS d’AUTOVEILLE | Logiciel veille automatique AUTOVEILLE http://autoveille.free.fr
Pingback: Veille automatique et collecte de Tweets | Outi...
Pingback: Veille automatique et collecte de Tweets | Inte...