archive

J’ai testĂ© …

Bonjour Ă  tous !

Aujourd’hui, j’ai dĂ©cidĂ© de vous prĂ©parer un article pour rĂ©sumer toutes les technologies que AUTOVEILLE Monitoring, mon outil de veille automatique peut offrir. Avec les amĂ©liorations et les changements que j’apporte souvent Ă  mes outils d’automatisation, j’estime qu’un rĂ©capitulatif est important.

Au fur et Ă  mesure que je travaille sur mes outils, je dĂ©couvre ou je dĂ©tourne certains d’entre eux pour les utiliser Ă  diffĂ©rentes fins. AUTOVEILLE Monitoring n’est plus seulement un logiciel de veille automatique, mais Ă©galement un outil pour constituer des corpus de textes, un outil de crawl, et Ă©galement un outil de scraping.

Voici plus en dĂ©tails, les descriptions de chaque technologie qu’AUTOVEILLE Monitoring peut offrir:

1) C’est … un logiciel de veille. AUTOVEILLE peut surveiller:

  • des pages web
  • des flux RSS
  • des tweets
  • des textes issus d’une base de donnĂ©es (par mot-clĂ©)

2) C’est … un outil de constitution de corpus automatique. AUTOVEILLE peut collecter:

  • des pages web
  • des flux RSS
  • les contenus textuels des sites web

3) C’est … un outil de crawl. AUTOVEILLE peut rĂ©cupĂ©rer:

  • des pages web
  • des donnĂ©es (partiellement ou en totalitĂ©) d’un site web
  • des PDF, des Word, des Excel, des images, etc.

4) C’est … un outil de scraping (SEO). AUTOVEILLE peut extraire:

  • des URL d’un site web (partiellement ou en totalitĂ©)
  • des liens internes d’une page web

Cependant, AUTOVEILLE est avant tout un service de veille automatique dont les contenus veillĂ©s seront directement envoyĂ©s aux chargĂ©s de veille. J’ai Ă©galement des demandes pour utiliser AUTOVEILLE comme outil d’extraction d’URL pour rĂ©cupĂ©rer toutes les URL d’un site.

Je rappelle Ă  l’occasion que mes outils ne sont pas Ă  vendre car ce sont des scripts Perl sans interface graphique. En revanche, AUTOVEILLE peut vous offrir un service adaptable et robuste au vu de la flexibilitĂ© des logiciels.

Logiciel veille: AUTOVEILLE et ses technologies

Bon courage !

VĂ©ronique Duong –

 

Bonjour Ă  tous !

Juste un petit article trĂšs rapide pour vous rappeler que vous pouvez retrouver AUTOVEILLE, outil de veille automatique et d’automatisation sur les mĂ©dias sociaux suivants:

Linkedin: http://www.linkedin.com/in/veroniqueduong

Twitter: https://twitter.com/veroduong

Google+: https://plus.google.com/116862245349529851498/posts

NOUVEAU !! >> Facebook: https://www.facebook.com/pages/AUTOVEILLE/568073609912021

Hellocoton: http://www.hellocoton.fr/mapage/autoveille

Une prĂ©sence professionnelle et sĂ©rieuse sur les rĂ©seaux sociaux est un vrai bonus pour la e-rĂ©putation et la e-apparence d’une entreprise. N’hĂ©sitez pas Ă  modĂ©rer et Ă  gĂ©rer vos profils trĂšs rĂ©guliĂšrement pour Ă©viter qu’il y ait des commentaires nĂ©gatifs (insultes, racistes, hors sujets, etc.) sur vos profils.

Les réseaux sociaux sont des plateformes (pour la plupart) gratuites et pratiques pour faire du marketing, faire la promotion de votre marque, de vos produits, de vos services.

En tout cas, si vous aimez les conseils et/ou les astuces que je donne sur la veille automatique, sur les logiciels de veille, sur le rĂ©fĂ©rencement naturel (SEO), sur la linguistique, ou si vous avez des suggestions, n’hĂ©sitez pas Ă  vous manifester sur l’un de mes mĂ©dias sociaux !

Vous pouvez liker, googleplusser, tweetter, linkedin-er, hellocoton-er !! Au choix 😉

icÎnes des réseaux sociaux

Bon courage !

VĂ©ronique Duong –

 

Bonjour tout le monde !

Aujourd’hui, je vous propose un article avec quelques conseils sur l’optimisation du SEO d’un site. Faire du SEO, c’est bon pour la santĂ© du site, mais faire trop de SEO, c’est mauvais. Comme tout excĂšs me diriez-vous. On appelle cela de la sur-optimisation, et il faut Ă©viter mĂȘme si on est tentĂ© de faire cela pour arriver sur la 1ere SERP.

1) Utilisez les termes et la phrasĂ©ologie de votre client. Cela est trĂšs important pour l’image de la marque. Si votre client veut se positionner sur quelques expressions moins recherchĂ©es mais qui relĂšvent de leurs domaines, il faut les utiliser.

2) Employez systĂ©matiquement les noms des produits ou des services de votre client. Il ne faut pas modifier les appellations car cela peut Ă©galement « altĂ©rer » Ă  l’image de la marque.

3) Ne mettez pas tout le temps le mĂȘme mot-clĂ© dans les pages. Il faut varier, utiliser des synonymes, des expressions plus longues ou plus courtes qui veulent dire la mĂȘme chose. Il faut que le vocabulaire soit le plus riche possible.

4) Ne faites pas de sur-optimisation. Cela ne va pas améliorer votre visibilité, au contraire.

5) Optimisez normalement, en produisant trĂšs souvent du contenu de qualitĂ©, et mettez les pages en ligne par « petit lot ».

6) Evitez de mettre 10000 pages en ligne d’un coup. Les moteurs de recherche vont trouver cela trĂšs suspect.

AprĂšs avoir optimisĂ©, soyez patient. Le SEO, c’est un processus sur le long terme. Il faut laisser le temps aux moteurs de recherche de trouver les pages, de crawler, d’indexer, de classer, etc. De temps en temps, il faut laisser la « magie » des moteurs de recherche agir.

Bon courage !

VĂ©ronique Duong –

Bonjour Ă  tous !

Je reviens aujourd’hui avec un article sur le SEO. Au fur et Ă  mesure que je travaille et me spĂ©cialise dans le domaine du rĂ©fĂ©rencement naturel, je me rends compte que beaucoup de personnes ou d’entreprises ne sont pas sensibles aux questions du SEO lorsqu’il s’agit de la crĂ©ation d’un nouveau site ou d’un nouveau blog.

Avant de mettre en ligne un site, je pense qu’il faudrait vraiment bien Ă©tudier les problĂ©matiques liĂ©es au rĂ©fĂ©rencement. Une fois qu’un site ou qu’un blog est en ligne, et crawlĂ© par les moteurs de recherche, il est tout de mĂȘme un peu plus compliquĂ© pour faire des corrections, surtout au niveau des endroits stratĂ©giques.

C’est pourquoi, avant de vous lancer, j’ai quelques conseils Ă  vous donner:

1) Bien trouvez et étudiez vos mots-clés: les mots-clés sont la base des bases du SEO. Il faut absolument faire une étude détaillée des expressions sur lesquelles vous souhaitez positionner le site.

2) Etablissez un plan de votre site sur papier. Le menu avec les onglets, le nombre de pages, le fil d’Ariane, etc. Imaginez le maillage interne.

3) A partir de l’Ă©tude de mots-clĂ©s, rĂ©digez vos titres et vos descriptions au brouillon sans dĂ©passer les limites de caractĂšres (70 et 160).

4) Remplissez les premiĂšres pages. Evitez de mettre en ligne des pages « vides ». Il faut remplir toutes les pages avec au moins 2 contenus pertinents.

5) Attention aux URL: nommez bien vos pages HTML pour avoir des URL propres.

6) Pour un site SEO friendly, allégez le plus possible vos codes JS, CSS, car les moteurs de recherche ne lisent pas ces derniers.

AprĂšs avoir effectuĂ© toutes ces Ă©tapes, vous pouvez enfin passer le tout dans votre serveur pour la mise en ligne, et avoir un site optimisĂ© dĂšs le dĂ©but :).Il y a bien Ă©videmment d’autres Ă©tapes dans une stratĂ©gie SEO en amont, mais je viens de vous dĂ©voiler les principales qui constituent la base. En tout cas, si vous souhaitez dĂ©velopper un site, je vous conseille de consulter un spĂ©cialiste en SEO avant de vous lancer seul.

 

Source: http://1.bp.blogspot.com/-4x41BUL3QDY/Tg8g7pYDurI/AAAAAAAAAAk/3oHMd-33TzU/s1600/seo-services.gif

Bon courage !

VĂ©ronique Duong –

Bonjour tout le monde 🙂

Aujourd’hui, je vais vous parler un petit peu de SEO, et plus particuliĂšrement de SEO multilingue. Je gĂšre plusieurs projets SEO dans diffĂ©rentes langues, et j’ai quelques petits conseils Ă  vous donner si vous aussi, vous faites ou souhaitez faire du rĂ©fĂ©rencement naturel multilingue.

Je travaille dans 4 langues: français, anglais, mandarin et cantonais. Elles sont toutes trĂšs diffĂ©rentes les unes des autres. SĂ©mantiquement parlant, dans diffĂ©rentes langues, un mĂȘme concept ne s’exprime pas du tout dans les mĂȘmes formes. Il y a donc une grande Ă©tape d’analyse sĂ©mantique Ă  faire via les forums, les blogs, les sites communautaires, par exemple, du pays en question pour trouver la phrasĂ©ologie / terminologie.

Voici quelques petits conseils principaux que je peux donner (aprĂšs les Ă©tudes de cas et les tests que j’ai effectuĂ©s):

1) Utilisez le générateur de mots-clés du moteur de recherche le plus utilisé du pays (Baidu, Naver, Yandex, Yahoo! Japan, etc.)

2) NE traduisez PAS littĂ©ralement les mots-clĂ©s. Il faut faire des adaptations de ces mots. J’ai fait la mauvaise expĂ©rience de deux ou trois cas (surtout en chinois) avec des traductions littĂ©rales des expressions clĂ©s. Ces traductions n’Ă©taient pas du tout recherchĂ©es par les internautes, et de ce fait, je n’ai pas pu les intĂ©grer dans le site.

3) Si possible, faites des Ă©tudes de mots-clĂ©s directement dans la langue de travail. C’est la meilleure façon de s’assurer d’une bonne qualitĂ© et d’une haute pertinence.

4) Si possible (Ă©galement), discutez avec des internautes et des experts mĂ©tiers qui travaillent ou sont passionĂ©s par les domaines dans lesquels vous travaillez le rĂ©fĂ©rencement naturel. C’est ainsi que vous enrichir votre « vocabulaire ».

5) Utilisez les rĂ©seaux sociaux du pays 🙂 Par exemple: Weibo, Tencent, etc. pour la Chine

J’ai rĂ©cemment créé une communautĂ© de SEO multilingue sur Google+, n’hĂ©sitez pas Ă  la rejoindre ! C’est par ici: https://plus.google.com/u/0/communities/117188661633379266436

 

SEO Multilingue: astuces et conseils

Bon courage !

VĂ©ronique Duong –

AUTOVEILLE

Bonjour tout le monde !

Je reviens avec un article sur l’outil de gĂ©nĂ©rateur de mots-clĂ©s chinois, Baidu Paid Search. J’avais dĂ©jĂ  fait un article (Baidu « Keywords Generator » 癟ćșŠæŽšćčż) sur cet outil SEO, mais je n’Ă©tais pas allĂ©e dans les dĂ©tails. C’Ă©tait juste une rapide introduction Ă  Baidu Paid Search.

Si vous avez lu mon premier article, vous avez dĂ©jĂ  vu Ă  quoi ressemble l’interface. Je vais tout de mĂȘme vous faire un article dĂ©taillĂ© cette fois, et vous montrer Ă©tape par Ă©tape Baidu Paid Search.

Je vous invite à utiliser le navigateur Internet Explorer (pour plus de stabilité). Veuillez cliquer sur les images pour les agrandir.

1) En vous connectant, vous tombez sur l’interface ci-dessous. Pour accĂ©der au gĂ©nĂ©rateur de mots-clĂ©s de Baidu, il faut cliquer sur le 2e onglet (pour ceux qui ne savent pas lire le chinois, j’ai mis une petite flĂšche rouge pour vous guider :))

baidu keyword generator SEO

2) Ensuite, aprĂšs avoir cliquĂ© sur le deuxiĂšme onglet, on tombe sur cette page (Ă  chaque fois que vous cliquez sur une rubrique, Baidu l’ouvre dans un nouvel onglet de votre navigateur … la plupart des sites chinois font cela … ils mettent des _blank partout :p). Pour accĂšder au gĂ©nĂ©rateur de mots-clĂ©s Baidu, il faut cliquer sur la derniĂšre rubrique (encadrĂ© orange)

Baidu SEM interface Baidu Paid Search

3) AprĂšs avoir cliquĂ© sur cette rubrique, vous trouverez toutes les annonces en cours, et toutes les donnĂ©es qui vont avec (CPC, CTR, QS, etc.). Mais ce qui nous intĂ©resse ici, c’est le SEO, et le sujet du jour … c’est accĂšder Ă  Baidu « Keyword Generator ». Cliquer sur l’onglet encadrĂ© en rouge:

Générateur de mots-clés Baidu Paid Search

4) Et voilĂ , nous sommes (enfin !) arrivĂ©s dans le gĂ©nĂ©rateur de mots-clĂ©s de Baidu. Il n’y a pas la fonction « export CSV » sur Baidu, donc pour rĂ©cupĂ©rer les mots-clĂ©s, cliquez sur ceux qui vous intĂ©ressent, et copier / coller les dans un Excel.

Baidu Keyword Generator interface

Si vous vous concentrez uniquement sur la Chine continentale, je vous conseille d’utiliser Baidu pour faire vos Ă©tudes de mots-clĂ©s. Par contre, si vous travaillez Ă©galement sur Hong Kong ou TaĂŻwan, je vous conseille d’utiliser Adwords.

Si vous avez des questions, n’hĂ©sitez pas Ă  me les poser par mail ou dans les commentaires 🙂

Bon courage !

VĂ©ronique Duong –

PS: Je viens de finir une conf call en cantonais avec Hong Kong sur le SEO de la Chine continentale … trĂšs intĂ©ressant de parler de rĂ©fĂ©rencement naturel avec un autre pays ! Les logiques restent les mĂȘmes.

Bonjour Ă  tous !

Je reviens avec un article geek pour dĂ©buter la semaine en beautĂ© ! VoilĂ , rĂ©cemment, j’ai eu besoin de faire une extraction complĂšte d’URL d’un trĂšs trĂšs gros site web contenant plus de 5000 pages. Je sais qu’il existe pas mal d’outils (plus ou moins) gratuits sur le marchĂ© pour faire des extractions d’URL, mais aprĂšs avoir Ă©tudiĂ© nombreux d’entre eux, ils ne rĂ©pondaient pas parfaitement Ă  ce que je recherchais.

AprĂšs avoir cherchĂ© une solution pendant un bon moment, je me suis dit qu’AUTOVEILLE pourrait trĂšs bien crawler un site web tout en extrayant les URL. Parce que si j’arrive Ă  veiller des sites ou des pages avec AUTOVEILLE Monitoring en rĂ©cupĂ©rant des masses d’informations, je pourrais Ă©galement dĂ©tourner mon logiciel de veille automatique en outil de crawl de sites web.

J’ai donc tentĂ© l’essai. J’ai Ă©galement mis en place un log pour rĂ©cupĂ©rer les URL et leurs codes de statuts http.

Voici l’exemple du crawl sur mon propre site AUTOVEILLE:

1) Indication du temps que mon outil de crawl AUTOVEILLE a mis pour extraire toutes les URL du site

Outil extraction URL AUTOVEILLE

2) Indication détaillée sur une des URL de mon site (poids, code de statut http, etc.)

Outil de crawl d'URL AUTOVEILLE

3) Ensuite, si vous souhaitez n’extraire que les URL, il suffit de faire un peu de nettoyage pour obtenir un fichier propre. Dans l’exemple ci-dessous, il y a toutes les URL mĂȘme les images, le robots.txt, le CSS, etc.

Extraction des URL d'un site4) Si vous ne souhaitez que les URL avec .html ou autre extension, il suffit de recréer un filtre sur les URL extraites

Outil SEO extraction URL

En tout cas, je suis contente de ma « dĂ©couverte » qui est en fait une autre façon d’utiliser mon outil de veille automatique ! 🙂 Il marche trĂšs bien sur les petits / moyens sites. Par contre pour un trĂšs trĂšs gros site, il faut avoir un peu de patience, car il met plus de temps Ă  crawler (ce qui est normal me diriez-vous).

Facilement adaptables, mes outils peuvent ĂȘtre personnalisĂ©s pour diffĂ©rents cas.

Bon courage !

VĂ©ronique Duong –

 

Bonjour Ă  tous !

Je vous ai prĂ©parĂ© un petit article sur le calcul automatique de la frĂ©quence d’une occurence dans un corpus de textes ou … tout simplement d’une page web pour effectuer une analyse des mots-clĂ©s.

L’outil de calcul, que j’ai implĂ©mentĂ©, ressemble quelque peu au Keyword Analysis Tool

Ce petit robot a Ă©tĂ© scriptĂ© en Perl. Il permet de dĂ©couper un corpus de textes en mot et d’indiquer la frĂ©quence (statistiques textuelles) de chaque forme prĂ©sente dans le contenu.

Mon outil met environ 1 Ă  2 secondes pour dĂ©couper le texte. TrĂšs rapide, non ? 🙂

Voici Ă  quoi ressemble le script:

Outil d'analyse de mots-clés

AprĂšs avoir passĂ© ce script sur un corpus de textes, on obtient des donnĂ©es statistiques, montrant le nombre de fois qu’une forme apparaĂźt, comme celles-ci:

FrĂ©quence de mots-clĂ©s et statistiques textuellesSi vous souhaitez en savoir plus, je vous invite Ă  vous rendre sur le site AUTOVEILLE pour avoir plus d’informations. Sinon, posez-moi des questions via autoveille@gmail.com

Bon courage !

VĂ©ronique Duong –

Bonjour tout le monde !

Hier, je vous ai montrĂ© comment faire une veille automatique et une collecte sur des tweets. Aujourd’hui, je reviens avec un article sur une veille automatisĂ©e et l’extraction des commentaires dans les publications sur les mĂ©dias traditionnels ou les blogs et/ou les forums.

Les commentaires sont Ă©galement des verbatims intĂ©ressants Ă  Ă©tudier pour  l’e-rĂ©putation ou l’analyse d’opinions. En effet, c’est souvent dans ces derniers que les internautes expriment leurs pensĂ©es et leurs opinions sur un sujet.

Voici rapidement comment je fais pour collecter efficacement et rapidement des commentaires:

1) J’utilise AUTOVEILLE Monitoring et AUTOVEILLE Corpus pour faire ma collecte automatique (si vous voulez en savoir plus sur ces outils, je vous invite Ă  aller sur mon site ou Ă  m’Ă©crire).

Exemple > Extraction des commentaires ci-dessous:

commentaires Figaro

2) Mes robots récupérent les commentaires au format HTML, et je fais une extraction de ces derniers dans un autre format exploitable par la plupart des outils de traitement automatique

Exemple > Les commentaires affichés dans ma Konsole (qui nécessitent bien évidemment encore quelques nettoyages)

commentaires-figaro-2

3)  Le corpus de commentaires extraits (Ă  titre d’exemple)

Corpus et collecte de commentaires / verbatims

Chaque collecte pour crĂ©er un corpus de commentaires est Ă©tudiĂ© et personnalisĂ© parce que chaque site ne prĂ©sente pas les choses de la mĂȘme façon. Il faut donc des outils adaptables pour rapatrier un maximum de verbatims.

 

N’hĂ©sitez pas Ă  me donner vos avis, vos idĂ©es ou Ă  m’Ă©crire si vous voulez en savoir plus 🙂

Bon courage –

Véronique Duong

Bonjour Ă  tous,

Comme on me le demande souvent, j’ai dĂ©cidĂ© de faire un article pour vous montrer comment faire une veille automatique ainsi qu’une collecte automatique des tweets depuis Twitter.

Pour cela, je dĂ©veloppe un script Perl pour chaque crawl. C’est Ă  dire que j’adapte mes crawls en fonction du type d’Ă©lĂ©ments Ă  crawler. RĂ©cupĂ©rer des tweets est diffĂ©rent de rĂ©cupĂ©rer des pages web par exemple.

A partir d’une recherche de tweets par #hashtag, mot-clĂ© ou expressions clĂ©s, j’en crĂ©e un flux RSS que je passe sous AUTOVEILLE. Ensuite, mon logiciel de veille collecte les tweets au format XML, et je traite ce XML au format demandĂ© par le client.

Voici un exemple d’un tweet au format XML:

collecte automatique de tweets

Avec quelques lignes de commandes Bash (Shell), je récupÚre uniquement les liens vers mes tweets collectés:

collecte automatique de tweets

Encore un peu de nettoyage automatique pour retirer les balises link

tweets collectés

Voilà, avec cette collecte, vous pouvez sauvegarder vos précieux tweets. Pour les afficher, il suffit de les repasser au format XML ou HTML. En repassant au format HTML, on obtient des tweets dans ce format:

tweet-format-html

J’adapte chaque veille / chaque collecte au cas par cas comme vous pouvez le constater.

Bon courage !

VĂ©ronique Duong –