archive

Traitement automatique des langues

Bonjour Ă  tous,

Pour faire une veille trĂšs efficace, on doit ĂȘtre trĂšs vigilant Ă  tout ce qui se passe sur le web minute par minute (je caricature, mais c’est pratiquement ça). Lors de la derniĂšre mise Ă  jour d’AUTOVEILLE, j’ai mis en place un systĂšme permettant de dĂ©tecter automatiquement les changements de plusieurs pages web surveillĂ©es en mĂȘme temps.

Cette technique permet de faire une veille automatique trĂšs robuste puisqu’il est, en plus, possible de modifier / d’adapter les pĂ©riodes de dĂ©tection selon les besoins (par seconde, par minute, par demi-heure, par heure, par jour, par mois, etc.).

Faire de la veille est un vrai mĂ©tier qui peut ĂȘtre lourd et trĂšs stressant: toujours ĂȘtre en mode « alerte », avoir peur de louper des informations importantes, avoir Ă  traiter une masse d’informations, faire attention Ă  l’infobĂ©sitĂ© -> quelle est l’information la plus explicite ?, et pour attĂ©nuer le stress de la collecte de l’information, il faut un outil intelligent pouvant ĂȘtre personnalisĂ© et adaptĂ© aux attentes des diffĂ©rents chef de projet, chargĂ©s de veille, veilleurs.

En Ă©tant Ă©galement chef de projet de veille stratĂ©gique, je suis Ă  mĂȘme de comprendre les problĂ©matiques de l’activitĂ© de monitoring, et j’estime que la veille automatisĂ©e est une solution Ă  intĂ©grer dans tous processus.

AUTOVEILLE Veille automatique

Logo d’AUTOVEILLE

Par ailleurs, c’est grĂące Ă  la veille que j’apprends de nouvelles choses tous les jours. La veille me permet sans cesse de renouveler mes sources d’estimation, d’inspiration, d’innovation, et de comprendre les nouvelles attentes des internautes 😉

Bon courage !

VĂ©ronique Duong –

Bonjour Ă  tous !

Me voilĂ  de nouveau avec un article 100% geek. Aujourd’hui, je vais vous prĂ©senter un outil qui permet de traduire automatiquement des contenus textuels. On est vraiment dans l’ingĂ©nierie linguistique pur et dur lĂ  !

Ce petit outil se nomme Golgu Translate, et il est programmĂ© en Shell. Il est donc nĂ©cessaire de savoir coder en Shell pour pouvoir l’utiliser, du moins, maĂźtriser les lignes de commandes Unix 😉

Golgu Translate est inspirĂ© de Google Translate, et permet d’effectuer des traductions directement depuis le Terminal, ce qui est bien pratique lorsqu’on travaille sur la konsole, et qu’on veut traduire quelque chose tout de suite (comme un verbatim :p).

>> Alors comment se présente t-il ?

C’est un script Shell. Il ressemble Ă  cela:

traduire automatiquement avec Shell

Vous pouvez le télécharger depuis ce package >> Golgu Translate

Puis installez-le en suivant la procĂ©dure dĂ©crite dans le README ou dans la documentation en ligne 😉

Pour saisir une traduction, faites « golgu-translate -o fr -t « my sentence to translate in French »

RĂ©sultats dans la Konsole d’Unix

golgu translate traduire automatiquement traduction automatique

Simple, pratique et rigolo ! J’adore 🙂

Merci Ă  Noireaude pour l’avoir partager sur le web !

Bon courage !

Véronique Duong

Bonjour Ă  tous !

AprĂšs avoir rĂ©digĂ© quelques rĂšgles pour mettre en place des mĂ©ta tags sur plus de 500 pages, j’ai eu envie de rĂ©diger un article sur … la synthĂ©tisation automatique d’un texte.

RĂ©cemment, Google et Yahoo! ont rachetĂ© des boĂźtes spĂ©cialisĂ©es (Wavii et Summly) dans le traitement automatique des langues (TAL), et plus spĂ©cialement dans le rĂ©sumĂ© automatique. Nouvelles excitantes, d’autant plus que je suis une grande passionnĂ©e du TAL.

Pour faire un rĂ©sumĂ© automatique, j’utilise de la programmation Perl, quelques lignes de commandes Shell et des modules. Certes, cela permet de rĂ©sumer trĂšs rapidement pas mal de contenus, mais au niveau de la qualitĂ©, il faut une relecture humaine.

En crĂ©ant AUTOVEILLE il y a 2 ans, j’avais envie de voir s’il Ă©tait aussi possible de rĂ©sumer automatiquement mes alertes, de les produire automatiquement en quelque sorte. Cela est faisable, mais il faut une correction manuelle derriĂšre comme je viens de le prĂ©ciser.

En tout cas, le résumé automatique reste quelque chose à étudier et à analyser.

Résumé automatique - Traitement automatique des Langues

RĂ©sumĂ© automatique – Traitement automatique des Langues

 

Bon courage !

Véronique D.

Bonjour tout le monde !

Je profite de cet article pour vous faire part d’une information importante sur AUTOVEILLE. J’ai reçu des demandes, et Ă  chaque fois, on me demandait le tĂ©lĂ©chargement de l’outil.

En rĂ©alitĂ©, AUTOVEILLE est une suite d’outils qui n’est pas destinĂ©e Ă  la vente (secret de fabrication oblige ;)). AUTOVEILLE est, plus exactement, un service de veille automatique. Si vous souhaitez veiller avec AUTOVEILLE, donnez-moi vos sources (URL et/ou RSS et/ou Tweets), et je m’occupe de tout. Vous n’avez plus qu’Ă  attendre vos donnĂ©es collectĂ©es (et je peux faire une premiĂšre phase de tri si vous souhaitez).

La veille se fait au quotidien, et voire Ă  tout instant pour certains sujets oĂč la fraĂźcheur des informations est primordial. Il faut donc des outils puissants qui puissent Ă  la fois lire les flux RSS, collecter les donnĂ©es, et dĂ©tecter les changements sur les pages HTML. AUTOVEILLE possĂšde toutes ces fonctions. Mais pour chaque cas (client), le logiciel de veille automatique sera adaptĂ© aux problĂ©matiques.

Avec cette veille automatisĂ©e, il y a un rĂ©el gain de temps au niveau de la collecte, et les entreprises ou mĂȘme les particuliers peuvent se concentrer sur l’analyse, la rĂ©daction de leurs alertes.

Collecte de données - Fraßcheur de l'information - Veille automatique

Collecte de donnĂ©es – FraĂźcheur de l’information – Veille automatique

 

Bon courage !

VĂ©ronique Duong –

Bonjour Ă  tous !

Le Salon du Référencement Naturel se déroulera le 12 et 13 juin 2013 à Paris (Porte de Versailles).

Au programme, on parlera de « rĂ©fĂ©rencement naturel » (SEO), de « web sĂ©mantique » (ontologies), « d’hyper ciblage du consommateur » (retargeting / remarketing), du SEM / SEA (campagnes Adwords payantes).

Wow, que des supers sujets, et vous avez bien compris, je n’ai qu’une envie, c’est d’y ALLER ! Je pense que ce salon pourrait nous faire dĂ©couvrir de nouvelles choses dans le monde du webmarketing.

Voici ce qui est dit sur ce salon:

Le but est de vous familiariser ou dĂ©velopper votre maĂźtrise des outils webmarketing afin d’optimiser le « time to market » et la relation client.

Source: Salon référencement naturel Paris 2013

Pour ceux qui veulent y aller, je vous conseille de vous inscrire dĂšs maintenant via ce formulaire en ligne >> http://www.time2marketing.fr/main/inscription

Salon du référencement naturel / SEO - Le 12 et 13 juin 2013 à Paris

Salon du rĂ©fĂ©rencement naturel / SEO – Le 12 et 13 juin 2013 Ă  Paris

EDIT: j’ai rĂ©cupĂ©rĂ© plus d’informations sur ce salon >> http://www.lafonderie-idf.fr/le-web-et-ses-nouvelles-problematiques-12245.html

Bon courage !

Véronique Duong

Hello tout le monde !

Vous avez trouvĂ© des contenus nĂ©fastes pour l’image de votre marque ou pour votre image, et vous souhaitez les faire disparaĂźtre des premiĂšres pages Google ? Voici un petit article rapide pour vous donner quelques astuces pour nettoyer votre e-rĂ©putation si elle a Ă©tĂ© « salie » sur le web.

1) Demander Ă  Google de supprimer ces contenus via le formulaire suivant:

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=1663688

2) Si cela ne marche pas, contacter les sites qui ont publiés ces contenus, et demander les (gentiment) de les supprimer.

3) Si cela ne marche toujours pas (et cela est probable), il faut utiliser certaines techniques du référencement naturel. Il faut optimiser le site de votre entreprise et produire des contenus de qualité pour remonter de bonnes informations sur la premiÚre page.

4) J’ai testĂ© cette technique pour mon propre site AUTOVEILLE, et elle marche trĂšs bien. En quelques jours, sur la premiĂšre page Google, on ne voyait que les contenus que j’ai produits pour rĂ©fĂ©rencer ma marque.

Et bien sĂ»r, faites parler de vous, dĂ©fendez-vous sur le web, faites du community management renforcĂ© en pĂ©riode de crise, soyez trĂšs Ă  l’Ă©coute, suivez tout ce qui se passe sur le web par rapport Ă  votre marque, etc.

Il y a des outils pour automatiser la plupart de ces tĂąches, comme le suivi d’informations qui circulent sur le web via des alertes.

e-réputation et SEO

E-réputation et SEO

Bon courage !

Véronique D.

Bonjour Ă  tous,

Un nouvel article en rapport avec le multilinguisme ! Comme vous le savez, je travaille dans l’international, et le multilinguisme est un Ă©lĂ©ment facteur pour rĂ©ussir.

Linked Heritage proposait un sĂ©minaire sur le multilinguisme et la terminologie cette semaine, et l’objectif de cette colloque est de prĂ©senter des projets nationaux et europĂ©ens concernant les problĂ©matiques de terminologie et de multilinguisme.

Lors de ce sĂ©minaire, le projet europĂ©en « Linked Heritage » sera prĂ©sentĂ©e. Ce projet est une plate-forme de gestion de terminologies (Terminology Management Platform : TMP).

D’autres initiatives europĂ©ennes et nationales crĂ©ant et dĂ©veloppant des ressources terminologiques multilingues ou des outils pour leur gestion ou leur rĂ©utilisation ont Ă©tĂ© aussi prĂ©sentĂ©es lors de ce sĂ©minaire.

DĂ©couvrez le projet sur la page de « Linked Heritage« .

Linked heritage

Linked heritage

Bon courage !

VDuong

Bonjour Ă  tous !

Un petit article sur l’opinion mining / analyse des opinions / des sentiments (bref, toutes les appellations possibles et inimaginables). A travers ce post, je souhaite faire comprendre aux personnes qui sont intĂ©ressĂ©es par ces domaines que l’analyse des opinions ou des sentiments ne peut (pour l’instant ?) se faire que manuellement pour assurer un maximum de qualitĂ©. En effet, aucune machine ou aucun outil peut dĂ©terminer la tonalitĂ© d’un texte. J’ai travaillĂ© sur ce sujet Ă  plusieurs reprises, testĂ© des outils, dĂ©veloppĂ© mes propres outils, et les rĂ©sultats en sortie Ă©taient toujours assez peu prĂ©cis.

En revanche, on peut toujours se servir d’un catĂ©goriseur automatique pour faire le premier gros tri parmi les 1000000 contenus rapatriĂ©s lors de la collecte. RĂ©cemment, j’ai dĂ©veloppĂ© un catĂ©goriseur de tonalitĂ©s, mais je le mentionne une nouvelle fois, un tri Ă  la main est obligatoire.

Pour travailler dans la e-rĂ©putation, je pense que les outils peuvent rĂ©ellement intervenir lors de la fouille d’opinions (opinions mining), dans la collecte des contenus, en fait. Ces outils peuvent ĂȘtre une grande aide pour trouver tous les contenus possibles / existants sur un sujet, mais ensuite l’analyse de ces opinions doivent se faire, en grande partie, Ă  la main. Non seulement, la qualitĂ© est assurĂ©e, mais en plus vous serez sĂ»r de vous quand vous allez prĂ©senter les rĂ©sultats aux clients.

analyse des sentiments, analyse des opinions, ereputation

Bon, je retourne constituer un corpus de tweets 😀

Bon courage !

Véronique Duong

Bonjour Ă  tous !

Je l’ai dĂ©jĂ  mentionnĂ© sur Twitter, mais je dois Ă©galement le faire ici: la news de la semaine est en ligne. Au rendez-vous: une petite astuce SEO, deux / trois petits conseils SMO, un rapide rappel sur l’outil de Page Rank, et le lancement de diverses collectes automatiques pour faire des veilles efficaces avec un minimum de loupĂ©s (lire mon article sur « Collecter automatiquement des donnĂ©es pour veiller efficacement« ).

>> Rendez-vous sur le site AUTOVEILLE: AUTOVEILLE News !

Actualités AUTOVEILLE

Bon courage,

Véronique D.

Bonjour bonjour !

J’ai dĂ©cidĂ© de faire un petit article rapide pour vous donner quelques astuces de collecte automatique pour faire une veille efficace (avec un minimum de donnĂ©es loupĂ©es).

J’ai plusieurs outils, dont ma suite de logiciels AUTOVEILLE.

1) Les agrégateurs de flux RSS

J’aspire automatiquement les flux RSS des sites web qui m’intĂ©ressent, et je les mets dans les agrĂ©gateurs de flux. Voici une petite liste (je ne les ai pas tous testĂ©s, mais mon prĂ©fĂ©rĂ©, aprĂšs Google Reader, est Netvibes).

J’utilise Ă©galement l’agrĂ©gateur de flux RSS chinois, Xianguo (éČœæžœ) pour faire ma veille en Chine. Je vous ferai une petite prĂ©sentation de Xianguo dans un autre article, mais le principe est simple: on s’abonne Ă  des flux.

2) Les outils d’alertes

J’utilise Google Alertes avec des requĂȘtes boolĂ©ennes. Il me ramĂšne pas mal de bruit sur certaines expressions, mais il est tout de mĂȘme pas mal.

Sinon, j’utilise Ă©galement de temps en temps Website Watcher, WatchThatPage, Sysomos pour complĂ©ter mes recherches et ĂȘtre sĂ»r de ne pas avoir de donnĂ©es loupĂ©es.

Et pour finir, bien évidemment, mon propre outil: AUTOVEILLE monitoring qui est à la fois un agrégateur de flux ET un logiciel de veille automatique.

3) Analyse et rédaction

Ensuite, une fois les informations collectĂ©es, triez, catĂ©gorisez, analysez et synthĂ©tisez votre veille 🙂

La veille sur le web

La veille sur le web

Bon courage,

Véronique D.