archive

Archives de Tag: Flux RSS

Bonjour Ă  tous !

Durant le week end dernier, j’ai continuĂ© Ă  mettre en place diffĂ©rents tests avec mon logiciel de veille pour travailler la veille automatique des flux RSS. J’ai testĂ© mon outil de collecte sur les sites Abondance.com (site sur le SEO), MarchĂ©s Online.com (site d’appels d’offres).

Ces deux sites proposent des formats de flux RSS lĂ©gĂšrement diffĂ©rents (l’un possĂšde un schĂšma XSD, et l’autre non). Le XSD est trĂšs pratique pour gĂ©nĂ©rer un fichier Excel propre du premier coup car il donne la struture aux donnĂ©es. Mais sans XSD, on peut tout aussi avoir un fichier Excel correct, mais il faut faire du nettoyage.

Je l’ai rappelĂ© Ă  plusieurs reprises, mais les encodages des fichiers sont Ă©galement trĂšs importants. S’ils sont mal encodĂ©s, on risque de rĂ©cupĂ©rer des donnĂ©es illisibles, et donc non exploitables. NĂ©anmoins, ce problĂšme peut ĂȘtre plus ou moins facilement corrigĂ©.

Voici le rĂ©sultat de mon test sur le flux RSS d’Abondance.com:

Logiciel de veille AUTOVEILLE: test flux RSS AbondanceL’Excel est propre et lisible. Il suffit de cliquer sur les URL pour lire les nouvelles.

Voici le rĂ©sultat de mon test sur l’un des flux RSS de MarchĂ©s Online:

Logiciel veille AUTOVEILLE: test flux RSS MarchĂ©s OnlineL’Excel est presque propre. On voit juste qu’il reste des balises HTML dans les descriptions. Mais le fichier reste exploitable sans problĂšme.

Comme vous l’auriez remarquer, je n’utilise pas toujours le mĂȘme outil pour les tableurs (tantĂŽt Microsoft Excel, tantĂŽt Open Office Calc), ainsi je teste l’adaptabilitĂ© de mon processus de veille.

Je vous donnerai réguliÚrement des informations sur mon logiciel de veille, et les résultats de mes tests sur diverses langues.

Si vous souhaitez en savoir plus, n’hĂ©sitez pas Ă  m’en parler.

Bon courage Ă  tous !

VĂ©ronique Duong –

Bonjour Ă  tous !

Avec l’approche de la fin de Google Reader, j’ai rĂ©cemment pas mal retravaillĂ© et innovĂ© mon logiciel de veille pour le dĂ©tourner en agrĂ©gateur de flux RSS (j’ai dĂ©jĂ  fait un article sur ce sujet il y a quelques jours). Je ne veille pas que du français ou des langues latines, mais Ă©galement du chinois.

logo flux rss AUTOVEILLE

De ce fait, il me faut un outil trĂšs efficace qui soit bien encodĂ© pour me collecter automatiquement des informations chinoises qui soient lisibles. J’ai fait un petit test de mon AUTOVEILLE Monitoring en utilisant QQ comme cobaye.

Voici le flux RSS en question: http://n.rss.qq.com/rss/tech_rss.php

1) Passage du flux RSS dans mon logiciel de veille pour automatiser la veille (extrait du script Perl):

logiciel de veille agrégateur de flux RSS AUTOVEILLE2) A la sortie, on obtient un fichier XML (proccessus habituel de la chaine de traitement):

fichier XML en sortie de l'agrégateur de flux RSS3) Conversion du fichier XML en fichier Excel (trÚs pratique pour classer les news et les trier)

flux rss avec Excel et XML | logiciel veille AUTOVEILLE

4) Il suffit de cliquer sur l’URL de l’information pour l’ouvrir dans le navigateur (ici, j’ai cliquĂ© sur le premier lien qui est devenu violet):

Logiciel de veille: flux d'informations RSS par AUTOVEILLE

MĂȘme si vous ne savez pas lire le chinois, vous pouvez reconnaĂźtre que c’est la mĂȘme nouvelle grĂące au titre (avec les mots-clĂ©s CEO, BB10 et Playbook) et l’emplacement des caractĂšres.

L’article est donc parfaitement rapatriĂ© et complet. A partir de lĂ , on peut faire la curation de donnĂ©es ou constituer un corpus de textes.

Bon courage Ă  tous !

VĂ©ronique Duong –

IngĂ©nieure linguiste pour la vie 😉

Bonjour Ă  tous !

Avec l’approche de la disparition de Google Reader (T_T), j’ai rĂ©cupĂ©rĂ© tous mes flux RSS pour les mettre dans mon logiciel de veille.

En effet, AUTOVEILLE effectue Ă©galement une veille automatique sur les flux RSS, et je pense que c’est l’un des plus gros points forts de mon outil de veille. Il rĂ©cupĂšre selon la durĂ©e programmĂ©e toutes les informations disponibles en temps rĂ©el via le flux RSS donnĂ©.

PrĂ©cĂ©demment, je vous avais montrĂ© comment je collecte et veille automatiquement sur des tweets (vous pouvez lire l’article: Veille automatique et collecte de Tweets) et le principe est trĂšs similaire. Mon outil de veille automatique permet alors de collecter Ă  la fois des tweets et des flux RSS en mĂȘme temps (en plus de la dĂ©tection des changements de pages web).

Voici une petite démonstration de la collecte automatique de flux RSS:

1) Je prends l’exemple de Webrankinfo > Les flux RSS des articles

Logiciel veille: Collecte flux RSS Webrankinfo

2) Les flux RSS sont des fichiers XML, et ont cette apparence:

Logiciel de veille: Collecte automatique flux RSS XML

3) Ensuite, je passe ce fichier XML ou ce flux RSS dans mon logiciel de veille automatique pour rĂ©cupĂ©rer les derniĂšres informations selon la durĂ©e que j’ai programmĂ©e. Perso, je mets souvent 2 heures. C’est Ă  dire que toutes les deux heures, mon outil de veille va aller crawler la page et dĂ©tecter s’il y a de nouvelles informations.

Voici un aperçu de mon fameux logiciel de veille

logiciel de veille: collecte automatique de flux RSS, de tweets et de pages web4) AprĂšs avoir mis le flux dans l’outil de collecte, je laisse tourner tout seul (vive l’automatisation), et au bout de deux heures, s’il y a eu des changements, je le vois dans un fichier XML comme celui-ci:

Logiciel de veille automatique: flux RSS webrankinfoEt voilà, en plus je vous ai récupéré la derniÚre news du jour (19/06/2013) qui parle des parts de marché de Google, Bing, Yahoo du site WebRankInfo !

En tout cas Google Reader va me manquer, mais j’ai ma solution pour toujours utiliser les flux RSS intelligement. Et une nouveautĂ© dont je ne vous ai pas encore parlĂ© (je vous parlais de mise Ă  jour hier dans mon article prĂ©cĂ©dent avec les 8 astuces SEO), c’est le moteur de recherche interne. On peut trier les informations collectĂ©es avec ce moteur, et cela facilite beaucoup le travail du tri car c’est Ă©galement une tĂąche trĂšs chronophage ! On rĂ©cupĂšre juste les informations contenant les mots-clĂ©s recherchĂ©s. Exemple ci-dessous « Google OR Yahoo »

Logiciel veille: moteur de recherche interne au agrĂ©gateur de flux RSS comme Google ReaderC’est un moteur de recherche intĂ©grĂ© au agrĂ©gateur de flux RSS, AUTOVEILLE Monitoring. J’essaye de dĂ©velopper une stratĂ©gie / un moteur similaire Ă  celui de Google Reader, et avec ce que j’obtiens, j’en suis satisfaite pour le moment, mais je peux encore amĂ©liorer (I can do it !!)

Avec la plupart des agrĂ©gateurs, on ne peut pas trier par mots-clĂ©s les donnĂ©es rĂ©cupĂ©rĂ©es. Je peux tout de mĂȘme le faire avec Bamboo de Firefox, mais c’est moins robuste que Reader.

En tout cas, si vous voulez en savoir plus, ou si vous voulez une petite démo sur un de vos flux, laissez moi un petit mot !

Bon courage !

VĂ©ronique Duong –

 

 

Bonjour Ă  tous !

Aujourd’hui, je vous propose une nouvelle infographie SEO rĂ©alisĂ©e par Axe-net, une agence web française. Cela change un peu des infographies en anglais que je poste d’habitude !

Le rĂ©fĂ©rencement naturel est bien rĂ©sumĂ© en une seule et mĂȘme image. On a les principales actions qui y figurent: mĂ©ta tags, contenus, liens, structure du HTML, etc.

Avec ce joli schĂšma, on ne risquerait pas d’oublier les Ă©tapes importantes d’une stratĂ©gie SEO !

Imprimez-la, et affichez-la au dessus de vos bureaux … bon, je retourne sur ma veille automatique pour collecter des tweets, des pages web et des flux RSS.

les facteurs SEO Ă  prendre en compte lors de l'optimisation

Bon courage 🙂 !

VĂ©ronique Duong –

 

Bonjour bonjour !

J’ai dĂ©cidĂ© de faire un petit article rapide pour vous donner quelques astuces de collecte automatique pour faire une veille efficace (avec un minimum de donnĂ©es loupĂ©es).

J’ai plusieurs outils, dont ma suite de logiciels AUTOVEILLE.

1) Les agrégateurs de flux RSS

J’aspire automatiquement les flux RSS des sites web qui m’intĂ©ressent, et je les mets dans les agrĂ©gateurs de flux. Voici une petite liste (je ne les ai pas tous testĂ©s, mais mon prĂ©fĂ©rĂ©, aprĂšs Google Reader, est Netvibes).

J’utilise Ă©galement l’agrĂ©gateur de flux RSS chinois, Xianguo (éČœæžœ) pour faire ma veille en Chine. Je vous ferai une petite prĂ©sentation de Xianguo dans un autre article, mais le principe est simple: on s’abonne Ă  des flux.

2) Les outils d’alertes

J’utilise Google Alertes avec des requĂȘtes boolĂ©ennes. Il me ramĂšne pas mal de bruit sur certaines expressions, mais il est tout de mĂȘme pas mal.

Sinon, j’utilise Ă©galement de temps en temps Website Watcher, WatchThatPage, Sysomos pour complĂ©ter mes recherches et ĂȘtre sĂ»r de ne pas avoir de donnĂ©es loupĂ©es.

Et pour finir, bien évidemment, mon propre outil: AUTOVEILLE monitoring qui est à la fois un agrégateur de flux ET un logiciel de veille automatique.

3) Analyse et rédaction

Ensuite, une fois les informations collectĂ©es, triez, catĂ©gorisez, analysez et synthĂ©tisez votre veille 🙂

La veille sur le web

La veille sur le web

Bon courage,

VĂ©ronique D.

%d blogueurs aiment cette page :