archive

Archives de Tag: Google Reader

Bonjour à tous !

Avec l’approche de la fin de Google Reader, j’ai récemment pas mal retravaillé et innové mon logiciel de veille pour le détourner en agrégateur de flux RSS (j’ai déjà fait un article sur ce sujet il y a quelques jours). Je ne veille pas que du français ou des langues latines, mais également du chinois.

logo flux rss AUTOVEILLE

De ce fait, il me faut un outil très efficace qui soit bien encodé pour me collecter automatiquement des informations chinoises qui soient lisibles. J’ai fait un petit test de mon AUTOVEILLE Monitoring en utilisant QQ comme cobaye.

Voici le flux RSS en question: http://n.rss.qq.com/rss/tech_rss.php

1) Passage du flux RSS dans mon logiciel de veille pour automatiser la veille (extrait du script Perl):

logiciel de veille agrégateur de flux RSS AUTOVEILLE2) A la sortie, on obtient un fichier XML (proccessus habituel de la chaine de traitement):

fichier XML en sortie de l'agrégateur de flux RSS3) Conversion du fichier XML en fichier Excel (très pratique pour classer les news et les trier)

flux rss avec Excel et XML | logiciel veille AUTOVEILLE

4) Il suffit de cliquer sur l’URL de l’information pour l’ouvrir dans le navigateur (ici, j’ai cliqué sur le premier lien qui est devenu violet):

Logiciel de veille: flux d'informations RSS par AUTOVEILLE

Même si vous ne savez pas lire le chinois, vous pouvez reconnaître que c’est la même nouvelle grâce au titre (avec les mots-clés CEO, BB10 et Playbook) et l’emplacement des caractères.

L’article est donc parfaitement rapatrié et complet. A partir de là, on peut faire la curation de données ou constituer un corpus de textes.

Bon courage à tous !

Véronique Duong –

Ingénieure linguiste pour la vie 😉

Bonjour à tous !

Avec l’approche de la disparition de Google Reader (T_T), j’ai récupéré tous mes flux RSS pour les mettre dans mon logiciel de veille.

En effet, AUTOVEILLE effectue également une veille automatique sur les flux RSS, et je pense que c’est l’un des plus gros points forts de mon outil de veille. Il récupère selon la durée programmée toutes les informations disponibles en temps réel via le flux RSS donné.

Précédemment, je vous avais montré comment je collecte et veille automatiquement sur des tweets (vous pouvez lire l’article: Veille automatique et collecte de Tweets) et le principe est très similaire. Mon outil de veille automatique permet alors de collecter à la fois des tweets et des flux RSS en même temps (en plus de la détection des changements de pages web).

Voici une petite démonstration de la collecte automatique de flux RSS:

1) Je prends l’exemple de Webrankinfo > Les flux RSS des articles

Logiciel veille: Collecte flux RSS Webrankinfo

2) Les flux RSS sont des fichiers XML, et ont cette apparence:

Logiciel de veille: Collecte automatique flux RSS XML

3) Ensuite, je passe ce fichier XML ou ce flux RSS dans mon logiciel de veille automatique pour récupérer les dernières informations selon la durée que j’ai programmée. Perso, je mets souvent 2 heures. C’est à dire que toutes les deux heures, mon outil de veille va aller crawler la page et détecter s’il y a de nouvelles informations.

Voici un aperçu de mon fameux logiciel de veille

logiciel de veille: collecte automatique de flux RSS, de tweets et de pages web4) Après avoir mis le flux dans l’outil de collecte, je laisse tourner tout seul (vive l’automatisation), et au bout de deux heures, s’il y a eu des changements, je le vois dans un fichier XML comme celui-ci:

Logiciel de veille automatique: flux RSS webrankinfoEt voilà, en plus je vous ai récupéré la dernière news du jour (19/06/2013) qui parle des parts de marché de Google, Bing, Yahoo du site WebRankInfo !

En tout cas Google Reader va me manquer, mais j’ai ma solution pour toujours utiliser les flux RSS intelligement. Et une nouveauté dont je ne vous ai pas encore parlé (je vous parlais de mise à jour hier dans mon article précédent avec les 8 astuces SEO), c’est le moteur de recherche interne. On peut trier les informations collectées avec ce moteur, et cela facilite beaucoup le travail du tri car c’est également une tâche très chronophage ! On récupère juste les informations contenant les mots-clés recherchés. Exemple ci-dessous « Google OR Yahoo »

Logiciel veille: moteur de recherche interne au agrégateur de flux RSS comme Google ReaderC’est un moteur de recherche intégré au agrégateur de flux RSS, AUTOVEILLE Monitoring. J’essaye de développer une stratégie / un moteur similaire à celui de Google Reader, et avec ce que j’obtiens, j’en suis satisfaite pour le moment, mais je peux encore améliorer (I can do it !!)

Avec la plupart des agrégateurs, on ne peut pas trier par mots-clés les données récupérées. Je peux tout de même le faire avec Bamboo de Firefox, mais c’est moins robuste que Reader.

En tout cas, si vous voulez en savoir plus, ou si vous voulez une petite démo sur un de vos flux, laissez moi un petit mot !

Bon courage !

Véronique Duong –