Logiciel de veille | Flux RSS chinois | Résultats
Bonjour à tous !
Avec l’approche de la fin de Google Reader, j’ai récemment pas mal retravaillé et innové mon logiciel de veille pour le détourner en agrégateur de flux RSS (j’ai déjà fait un article sur ce sujet il y a quelques jours). Je ne veille pas que du français ou des langues latines, mais également du chinois.
De ce fait, il me faut un outil très efficace qui soit bien encodé pour me collecter automatiquement des informations chinoises qui soient lisibles. J’ai fait un petit test de mon AUTOVEILLE Monitoring en utilisant QQ comme cobaye.
Voici le flux RSS en question: http://n.rss.qq.com/rss/tech_rss.php
1) Passage du flux RSS dans mon logiciel de veille pour automatiser la veille (extrait du script Perl):
2) A la sortie, on obtient un fichier XML (proccessus habituel de la chaine de traitement):
3) Conversion du fichier XML en fichier Excel (très pratique pour classer les news et les trier)
4) Il suffit de cliquer sur l’URL de l’information pour l’ouvrir dans le navigateur (ici, j’ai cliqué sur le premier lien qui est devenu violet):
Même si vous ne savez pas lire le chinois, vous pouvez reconnaître que c’est la même nouvelle grâce au titre (avec les mots-clés CEO, BB10 et Playbook) et l’emplacement des caractères.
L’article est donc parfaitement rapatrié et complet. A partir de là , on peut faire la curation de données ou constituer un corpus de textes.
Bon courage à tous !
Véronique Duong –
Ingénieure linguiste pour la vie 😉
Pingback: 2013, une année fructueuse pour AUTOVEILLE ! News du 28 décembre 2013 | AUTOVEILLE | Logiciel de veille
Pingback: Veille Digitale donne le clavier à AUTOVEILLE | Logiciel veille automatique AUTOVEILLE
Pingback: AUTOVEILLE: Logiciel de veille automatique | Projet R&D
Pingback: Logiciel de veille | Flux RSS chinois | R&eacut...