archive

Traitement automatique des langues

Bonjour à tous,

Pour faire une veille très efficace, on doit être très vigilant à tout ce qui se passe sur le web minute par minute (je caricature, mais c’est pratiquement ça). Lors de la dernière mise à jour d’AUTOVEILLE, j’ai mis en place un système permettant de détecter automatiquement les changements de plusieurs pages web surveillées en même temps.

Cette technique permet de faire une veille automatique très robuste puisqu’il est, en plus, possible de modifier / d’adapter les périodes de détection selon les besoins (par seconde, par minute, par demi-heure, par heure, par jour, par mois, etc.).

Faire de la veille est un vrai métier qui peut être lourd et très stressant: toujours être en mode « alerte », avoir peur de louper des informations importantes, avoir à traiter une masse d’informations, faire attention à l’infobésité -> quelle est l’information la plus explicite ?, et pour atténuer le stress de la collecte de l’information, il faut un outil intelligent pouvant être personnalisé et adapté aux attentes des différents chef de projet, chargés de veille, veilleurs.

En étant également chef de projet de veille stratégique, je suis à même de comprendre les problématiques de l’activité de monitoring, et j’estime que la veille automatisée est une solution à intégrer dans tous processus.

AUTOVEILLE Veille automatique

Logo d’AUTOVEILLE

Par ailleurs, c’est grâce à la veille que j’apprends de nouvelles choses tous les jours. La veille me permet sans cesse de renouveler mes sources d’estimation, d’inspiration, d’innovation, et de comprendre les nouvelles attentes des internautes 😉

Bon courage !

Véronique Duong –

Bonjour à tous !

Me voilà de nouveau avec un article 100% geek. Aujourd’hui, je vais vous présenter un outil qui permet de traduire automatiquement des contenus textuels. On est vraiment dans l’ingénierie linguistique pur et dur là !

Ce petit outil se nomme Golgu Translate, et il est programmé en Shell. Il est donc nécessaire de savoir coder en Shell pour pouvoir l’utiliser, du moins, maîtriser les lignes de commandes Unix 😉

Golgu Translate est inspiré de Google Translate, et permet d’effectuer des traductions directement depuis le Terminal, ce qui est bien pratique lorsqu’on travaille sur la konsole, et qu’on veut traduire quelque chose tout de suite (comme un verbatim :p).

>> Alors comment se présente t-il ?

C’est un script Shell. Il ressemble à cela:

traduire automatiquement avec Shell

Vous pouvez le télécharger depuis ce package >> Golgu Translate

Puis installez-le en suivant la procédure décrite dans le README ou dans la documentation en ligne 😉

Pour saisir une traduction, faites « golgu-translate -o fr -t « my sentence to translate in French »

Résultats dans la Konsole d’Unix

golgu translate traduire automatiquement traduction automatique

Simple, pratique et rigolo ! J’adore 🙂

Merci à Noireaude pour l’avoir partager sur le web !

Bon courage !

Véronique Duong

Bonjour à tous !

Après avoir rédigé quelques règles pour mettre en place des méta tags sur plus de 500 pages, j’ai eu envie de rédiger un article sur … la synthétisation automatique d’un texte.

Récemment, Google et Yahoo! ont racheté des boîtes spécialisées (Wavii et Summly) dans le traitement automatique des langues (TAL), et plus spécialement dans le résumé automatique. Nouvelles excitantes, d’autant plus que je suis une grande passionnée du TAL.

Pour faire un résumé automatique, j’utilise de la programmation Perl, quelques lignes de commandes Shell et des modules. Certes, cela permet de résumer très rapidement pas mal de contenus, mais au niveau de la qualité, il faut une relecture humaine.

En créant AUTOVEILLE il y a 2 ans, j’avais envie de voir s’il était aussi possible de résumer automatiquement mes alertes, de les produire automatiquement en quelque sorte. Cela est faisable, mais il faut une correction manuelle derrière comme je viens de le préciser.

En tout cas, le résumé automatique reste quelque chose à étudier et à analyser.

Résumé automatique - Traitement automatique des Langues

Résumé automatique – Traitement automatique des Langues

 

Bon courage !

Véronique D.

Bonjour tout le monde !

Je profite de cet article pour vous faire part d’une information importante sur AUTOVEILLE. J’ai reçu des demandes, et à chaque fois, on me demandait le téléchargement de l’outil.

En réalité, AUTOVEILLE est une suite d’outils qui n’est pas destinée à la vente (secret de fabrication oblige ;)). AUTOVEILLE est, plus exactement, un service de veille automatique. Si vous souhaitez veiller avec AUTOVEILLE, donnez-moi vos sources (URL et/ou RSS et/ou Tweets), et je m’occupe de tout. Vous n’avez plus qu’à attendre vos données collectées (et je peux faire une première phase de tri si vous souhaitez).

La veille se fait au quotidien, et voire à tout instant pour certains sujets où la fraîcheur des informations est primordial. Il faut donc des outils puissants qui puissent à la fois lire les flux RSS, collecter les données, et détecter les changements sur les pages HTML. AUTOVEILLE possède toutes ces fonctions. Mais pour chaque cas (client), le logiciel de veille automatique sera adapté aux problématiques.

Avec cette veille automatisée, il y a un réel gain de temps au niveau de la collecte, et les entreprises ou même les particuliers peuvent se concentrer sur l’analyse, la rédaction de leurs alertes.

Collecte de données - Fraîcheur de l'information - Veille automatique

Collecte de données – Fraîcheur de l’information – Veille automatique

 

Bon courage !

Véronique Duong –

Bonjour à tous !

Le Salon du Référencement Naturel se déroulera le 12 et 13 juin 2013 à Paris (Porte de Versailles).

Au programme, on parlera de « référencement naturel » (SEO), de « web sémantique » (ontologies), « d’hyper ciblage du consommateur » (retargeting / remarketing), du SEM / SEA (campagnes Adwords payantes).

Wow, que des supers sujets, et vous avez bien compris, je n’ai qu’une envie, c’est d’y ALLER ! Je pense que ce salon pourrait nous faire découvrir de nouvelles choses dans le monde du webmarketing.

Voici ce qui est dit sur ce salon:

Le but est de vous familiariser ou développer votre maîtrise des outils webmarketing afin d’optimiser le « time to market » et la relation client.

Source: Salon référencement naturel Paris 2013

Pour ceux qui veulent y aller, je vous conseille de vous inscrire dès maintenant via ce formulaire en ligne >> http://www.time2marketing.fr/main/inscription

Salon du référencement naturel / SEO - Le 12 et 13 juin 2013 à Paris

Salon du référencement naturel / SEO – Le 12 et 13 juin 2013 à Paris

EDIT: j’ai récupéré plus d’informations sur ce salon >> http://www.lafonderie-idf.fr/le-web-et-ses-nouvelles-problematiques-12245.html

Bon courage !

Véronique Duong

Hello tout le monde !

Vous avez trouvé des contenus néfastes pour l’image de votre marque ou pour votre image, et vous souhaitez les faire disparaître des premières pages Google ? Voici un petit article rapide pour vous donner quelques astuces pour nettoyer votre e-réputation si elle a été « salie » sur le web.

1) Demander à Google de supprimer ces contenus via le formulaire suivant:

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=1663688

2) Si cela ne marche pas, contacter les sites qui ont publiés ces contenus, et demander les (gentiment) de les supprimer.

3) Si cela ne marche toujours pas (et cela est probable), il faut utiliser certaines techniques du référencement naturel. Il faut optimiser le site de votre entreprise et produire des contenus de qualité pour remonter de bonnes informations sur la première page.

4) J’ai testé cette technique pour mon propre site AUTOVEILLE, et elle marche très bien. En quelques jours, sur la première page Google, on ne voyait que les contenus que j’ai produits pour référencer ma marque.

Et bien sûr, faites parler de vous, défendez-vous sur le web, faites du community management renforcé en période de crise, soyez très à l’écoute, suivez tout ce qui se passe sur le web par rapport à votre marque, etc.

Il y a des outils pour automatiser la plupart de ces tâches, comme le suivi d’informations qui circulent sur le web via des alertes.

e-réputation et SEO

E-réputation et SEO

Bon courage !

Véronique D.

Bonjour à tous,

Un nouvel article en rapport avec le multilinguisme ! Comme vous le savez, je travaille dans l’international, et le multilinguisme est un élément facteur pour réussir.

Linked Heritage proposait un séminaire sur le multilinguisme et la terminologie cette semaine, et l’objectif de cette colloque est de présenter des projets nationaux et européens concernant les problématiques de terminologie et de multilinguisme.

Lors de ce séminaire, le projet européen « Linked Heritage » sera présentée. Ce projet est une plate-forme de gestion de terminologies (Terminology Management Platform : TMP).

D’autres initiatives européennes et nationales créant et développant des ressources terminologiques multilingues ou des outils pour leur gestion ou leur réutilisation ont été aussi présentées lors de ce séminaire.

Découvrez le projet sur la page de « Linked Heritage« .

Linked heritage

Linked heritage

Bon courage !

VDuong

Bonjour à tous !

Un petit article sur l’opinion mining / analyse des opinions / des sentiments (bref, toutes les appellations possibles et inimaginables). A travers ce post, je souhaite faire comprendre aux personnes qui sont intéressées par ces domaines que l’analyse des opinions ou des sentiments ne peut (pour l’instant ?) se faire que manuellement pour assurer un maximum de qualité. En effet, aucune machine ou aucun outil peut déterminer la tonalité d’un texte. J’ai travaillé sur ce sujet à plusieurs reprises, testé des outils, développé mes propres outils, et les résultats en sortie étaient toujours assez peu précis.

En revanche, on peut toujours se servir d’un catégoriseur automatique pour faire le premier gros tri parmi les 1000000 contenus rapatriés lors de la collecte. Récemment, j’ai développé un catégoriseur de tonalités, mais je le mentionne une nouvelle fois, un tri à la main est obligatoire.

Pour travailler dans la e-réputation, je pense que les outils peuvent réellement intervenir lors de la fouille d’opinions (opinions mining), dans la collecte des contenus, en fait. Ces outils peuvent être une grande aide pour trouver tous les contenus possibles / existants sur un sujet, mais ensuite l’analyse de ces opinions doivent se faire, en grande partie, à la main. Non seulement, la qualité est assurée, mais en plus vous serez sûr de vous quand vous allez présenter les résultats aux clients.

analyse des sentiments, analyse des opinions, ereputation

Bon, je retourne constituer un corpus de tweets 😀

Bon courage !

Véronique Duong

Bonjour à tous !

Je l’ai déjà mentionné sur Twitter, mais je dois également le faire ici: la news de la semaine est en ligne. Au rendez-vous: une petite astuce SEO, deux / trois petits conseils SMO, un rapide rappel sur l’outil de Page Rank, et le lancement de diverses collectes automatiques pour faire des veilles efficaces avec un minimum de loupés (lire mon article sur « Collecter automatiquement des données pour veiller efficacement« ).

>> Rendez-vous sur le site AUTOVEILLE: AUTOVEILLE News !

Actualités AUTOVEILLE

Bon courage,

Véronique D.

Bonjour bonjour !

J’ai décidé de faire un petit article rapide pour vous donner quelques astuces de collecte automatique pour faire une veille efficace (avec un minimum de données loupées).

J’ai plusieurs outils, dont ma suite de logiciels AUTOVEILLE.

1) Les agrégateurs de flux RSS

J’aspire automatiquement les flux RSS des sites web qui m’intéressent, et je les mets dans les agrégateurs de flux. Voici une petite liste (je ne les ai pas tous testés, mais mon préféré, après Google Reader, est Netvibes).

J’utilise également l’agrégateur de flux RSS chinois, Xianguo (鲜果) pour faire ma veille en Chine. Je vous ferai une petite présentation de Xianguo dans un autre article, mais le principe est simple: on s’abonne à des flux.

2) Les outils d’alertes

J’utilise Google Alertes avec des requêtes booléennes. Il me ramène pas mal de bruit sur certaines expressions, mais il est tout de même pas mal.

Sinon, j’utilise également de temps en temps Website Watcher, WatchThatPage, Sysomos pour compléter mes recherches et être sûr de ne pas avoir de données loupées.

Et pour finir, bien évidemment, mon propre outil: AUTOVEILLE monitoring qui est à la fois un agrégateur de flux ET un logiciel de veille automatique.

3) Analyse et rédaction

Ensuite, une fois les informations collectées, triez, catégorisez, analysez et synthétisez votre veille 🙂

La veille sur le web

La veille sur le web

Bon courage,

Véronique D.