archive

Archives de Tag: Flux RSS

Bonjour à tous !

Durant le week end dernier, j’ai continué à mettre en place différents tests avec mon logiciel de veille pour travailler la veille automatique des flux RSS. J’ai testé mon outil de collecte sur les sites Abondance.com (site sur le SEO), Marchés Online.com (site d’appels d’offres).

Ces deux sites proposent des formats de flux RSS légèrement différents (l’un possède un schèma XSD, et l’autre non). Le XSD est très pratique pour générer un fichier Excel propre du premier coup car il donne la struture aux données. Mais sans XSD, on peut tout aussi avoir un fichier Excel correct, mais il faut faire du nettoyage.

Je l’ai rappelé à plusieurs reprises, mais les encodages des fichiers sont également très importants. S’ils sont mal encodés, on risque de récupérer des données illisibles, et donc non exploitables. Néanmoins, ce problème peut être plus ou moins facilement corrigé.

Voici le résultat de mon test sur le flux RSS d’Abondance.com:

Logiciel de veille AUTOVEILLE: test flux RSS AbondanceL’Excel est propre et lisible. Il suffit de cliquer sur les URL pour lire les nouvelles.

Voici le résultat de mon test sur l’un des flux RSS de Marchés Online:

Logiciel veille AUTOVEILLE: test flux RSS Marchés OnlineL’Excel est presque propre. On voit juste qu’il reste des balises HTML dans les descriptions. Mais le fichier reste exploitable sans problème.

Comme vous l’auriez remarquer, je n’utilise pas toujours le même outil pour les tableurs (tantôt Microsoft Excel, tantôt Open Office Calc), ainsi je teste l’adaptabilité de mon processus de veille.

Je vous donnerai régulièrement des informations sur mon logiciel de veille, et les résultats de mes tests sur diverses langues.

Si vous souhaitez en savoir plus, n’hésitez pas à m’en parler.

Bon courage à tous !

Véronique Duong –

Publicités

Bonjour à tous !

Avec l’approche de la fin de Google Reader, j’ai récemment pas mal retravaillé et innové mon logiciel de veille pour le détourner en agrégateur de flux RSS (j’ai déjà fait un article sur ce sujet il y a quelques jours). Je ne veille pas que du français ou des langues latines, mais également du chinois.

logo flux rss AUTOVEILLE

De ce fait, il me faut un outil très efficace qui soit bien encodé pour me collecter automatiquement des informations chinoises qui soient lisibles. J’ai fait un petit test de mon AUTOVEILLE Monitoring en utilisant QQ comme cobaye.

Voici le flux RSS en question: http://n.rss.qq.com/rss/tech_rss.php

1) Passage du flux RSS dans mon logiciel de veille pour automatiser la veille (extrait du script Perl):

logiciel de veille agrégateur de flux RSS AUTOVEILLE2) A la sortie, on obtient un fichier XML (proccessus habituel de la chaine de traitement):

fichier XML en sortie de l'agrégateur de flux RSS3) Conversion du fichier XML en fichier Excel (très pratique pour classer les news et les trier)

flux rss avec Excel et XML | logiciel veille AUTOVEILLE

4) Il suffit de cliquer sur l’URL de l’information pour l’ouvrir dans le navigateur (ici, j’ai cliqué sur le premier lien qui est devenu violet):

Logiciel de veille: flux d'informations RSS par AUTOVEILLE

Même si vous ne savez pas lire le chinois, vous pouvez reconnaître que c’est la même nouvelle grâce au titre (avec les mots-clés CEO, BB10 et Playbook) et l’emplacement des caractères.

L’article est donc parfaitement rapatrié et complet. A partir de là, on peut faire la curation de données ou constituer un corpus de textes.

Bon courage à tous !

Véronique Duong –

Ingénieure linguiste pour la vie 😉

Bonjour à tous !

Avec l’approche de la disparition de Google Reader (T_T), j’ai récupéré tous mes flux RSS pour les mettre dans mon logiciel de veille.

En effet, AUTOVEILLE effectue également une veille automatique sur les flux RSS, et je pense que c’est l’un des plus gros points forts de mon outil de veille. Il récupère selon la durée programmée toutes les informations disponibles en temps réel via le flux RSS donné.

Précédemment, je vous avais montré comment je collecte et veille automatiquement sur des tweets (vous pouvez lire l’article: Veille automatique et collecte de Tweets) et le principe est très similaire. Mon outil de veille automatique permet alors de collecter à la fois des tweets et des flux RSS en même temps (en plus de la détection des changements de pages web).

Voici une petite démonstration de la collecte automatique de flux RSS:

1) Je prends l’exemple de Webrankinfo > Les flux RSS des articles

Logiciel veille: Collecte flux RSS Webrankinfo

2) Les flux RSS sont des fichiers XML, et ont cette apparence:

Logiciel de veille: Collecte automatique flux RSS XML

3) Ensuite, je passe ce fichier XML ou ce flux RSS dans mon logiciel de veille automatique pour récupérer les dernières informations selon la durée que j’ai programmée. Perso, je mets souvent 2 heures. C’est à dire que toutes les deux heures, mon outil de veille va aller crawler la page et détecter s’il y a de nouvelles informations.

Voici un aperçu de mon fameux logiciel de veille

logiciel de veille: collecte automatique de flux RSS, de tweets et de pages web4) Après avoir mis le flux dans l’outil de collecte, je laisse tourner tout seul (vive l’automatisation), et au bout de deux heures, s’il y a eu des changements, je le vois dans un fichier XML comme celui-ci:

Logiciel de veille automatique: flux RSS webrankinfoEt voilà, en plus je vous ai récupéré la dernière news du jour (19/06/2013) qui parle des parts de marché de Google, Bing, Yahoo du site WebRankInfo !

En tout cas Google Reader va me manquer, mais j’ai ma solution pour toujours utiliser les flux RSS intelligement. Et une nouveauté dont je ne vous ai pas encore parlé (je vous parlais de mise à jour hier dans mon article précédent avec les 8 astuces SEO), c’est le moteur de recherche interne. On peut trier les informations collectées avec ce moteur, et cela facilite beaucoup le travail du tri car c’est également une tâche très chronophage ! On récupère juste les informations contenant les mots-clés recherchés. Exemple ci-dessous « Google OR Yahoo »

Logiciel veille: moteur de recherche interne au agrégateur de flux RSS comme Google ReaderC’est un moteur de recherche intégré au agrégateur de flux RSS, AUTOVEILLE Monitoring. J’essaye de développer une stratégie / un moteur similaire à celui de Google Reader, et avec ce que j’obtiens, j’en suis satisfaite pour le moment, mais je peux encore améliorer (I can do it !!)

Avec la plupart des agrégateurs, on ne peut pas trier par mots-clés les données récupérées. Je peux tout de même le faire avec Bamboo de Firefox, mais c’est moins robuste que Reader.

En tout cas, si vous voulez en savoir plus, ou si vous voulez une petite démo sur un de vos flux, laissez moi un petit mot !

Bon courage !

Véronique Duong –

 

 

Bonjour à tous !

Aujourd’hui, je vous propose une nouvelle infographie SEO réalisée par Axe-net, une agence web française. Cela change un peu des infographies en anglais que je poste d’habitude !

Le référencement naturel est bien résumé en une seule et même image. On a les principales actions qui y figurent: méta tags, contenus, liens, structure du HTML, etc.

Avec ce joli schèma, on ne risquerait pas d’oublier les étapes importantes d’une stratégie SEO !

Imprimez-la, et affichez-la au dessus de vos bureaux … bon, je retourne sur ma veille automatique pour collecter des tweets, des pages web et des flux RSS.

les facteurs SEO à prendre en compte lors de l'optimisation

Bon courage 🙂 !

Véronique Duong –

 

Bonjour bonjour !

J’ai décidé de faire un petit article rapide pour vous donner quelques astuces de collecte automatique pour faire une veille efficace (avec un minimum de données loupées).

J’ai plusieurs outils, dont ma suite de logiciels AUTOVEILLE.

1) Les agrégateurs de flux RSS

J’aspire automatiquement les flux RSS des sites web qui m’intéressent, et je les mets dans les agrégateurs de flux. Voici une petite liste (je ne les ai pas tous testés, mais mon préféré, après Google Reader, est Netvibes).

J’utilise également l’agrégateur de flux RSS chinois, Xianguo (鲜果) pour faire ma veille en Chine. Je vous ferai une petite présentation de Xianguo dans un autre article, mais le principe est simple: on s’abonne à des flux.

2) Les outils d’alertes

J’utilise Google Alertes avec des requêtes booléennes. Il me ramène pas mal de bruit sur certaines expressions, mais il est tout de même pas mal.

Sinon, j’utilise également de temps en temps Website Watcher, WatchThatPage, Sysomos pour compléter mes recherches et être sûr de ne pas avoir de données loupées.

Et pour finir, bien évidemment, mon propre outil: AUTOVEILLE monitoring qui est à la fois un agrégateur de flux ET un logiciel de veille automatique.

3) Analyse et rédaction

Ensuite, une fois les informations collectées, triez, catégorisez, analysez et synthétisez votre veille 🙂

La veille sur le web

La veille sur le web

Bon courage,

Véronique D.

%d blogueurs aiment cette page :