archive

Archives de Tag: duplicate content

Hello tout le monde !

Suite à une question posée sur Twitter par Cédric Guérin pour comprendre plus en détails mon test sur les communiqués de presse et le duplicate content, je poste ce petit article !

Voici l’histoire : en novembre 2015, je voulais voir si les communiquĂ©s de presse et le Duplicate Content pĂ©nalisent vraiment les sites, et je me suis inscrite sur le site Agence Presse (aujourd’hui, le site que j’ai crĂ©Ă© n’existe plus, c’Ă©tait juste pour le test). Lors du premier mois, il ne se passe rien. Mes positionnements sur mes mots-clĂ©s prĂ©fĂ©rĂ©s comme « logiciel de veille », « logiciel veille », « logiciels de veille » sont dans le top 5, comme vous pouvez le constater ci-dessous :

Positionnement SEO logiciel de veille AUTOVEILLE

 

Mais au bout de quelques mois, je me suis prise une grosse pĂ©nalitĂ© Panda, et je perds 15 positions pour « logiciel de veille » ! Vous pouvez constater cela avec la capture de mon rapport ci-dessous :

logiciel-veille-seo-autoveille-2016

J’ai publiĂ© un ou deux articles seulement sur ce site de communiquĂ©s de presse, et je les avais plus ou moins rĂ©Ă©crits (mais en changeant trĂšs peu, c’est fait exprĂšs). Maintenant, j’ai la preuve que la pĂ©nalitĂ© existe ! Ne faites surtout pas de copiĂ©s / collĂ©s de site, de communiquĂ©s de presse, sinon vous risquez une claque comme celle que j’ai pris pour ce test. J’essaye de remonter la pente maintenant, et je vous dirais comment j’aurais fait (si je m’en sors 🙂 ) !

Si vous avez des questions sur les pénalités SEO Google, sur le Duplicate Content, comment le gérer, etc. écrivez moi à autoveille@gmail.com

Bon courage Ă  tous !

VĂ©ronique Duong – Consultante SEO certifiĂ©e CESEO

Bonjour Ă  tous !

Ce week-end pour changer un peu des veilles automatiques d’infographies avec AUTOVEILLE, mon logiciel de veille, je vous propose de dĂ©couvrir un outil que je suis en train de dĂ©velopper pour identifier automatiquement les auteurs et les sources des articles.

Avec la big data, la curation, les partages sur les divers mĂ©dias sociaux et l’infobĂ©sitĂ©, parfois, on ne sait plus qui est l’auteur original d’un article ou d »une information. J’ai donc dĂ©cidĂ© (et surtout tentĂ©) de dĂ©velopper un nouvel outil pour extraire les auteurs et le maximum de sources pour retrouver le crĂ©ateur de l’article parmi une base de fichiers HTML que j’aurais collectĂ©s au prĂ©alable avec … AUTOVEILLE corpus.

Dans mon algorithme, j’y ai mis plusieurs rĂšgles pour pouvoir extraire un maximum d’Ă©lĂ©ments sur les auteurs. De ce fait, mon outil pourrait Ă©galement ĂȘtre utilisĂ© dans l’extraction des « auteurs-copieurs » d’articles, les plagiats et le duplicate content …

Voici un cas de figure que je suis en train d’Ă©tudier :

Je recherche sur le web si on m’a copiĂ© avec Google. Je copie/colle un extrait d’un de mes articles entre  »  »Â  dans le moteur de recherche.

Ensuite, j’aspire automatiquement toutes les pages qui contiennent cet extrait.

Puis, je télécharge les liens de ces pages sous forme de fichiers .html. Cela me crée une base.

Et au final, je lance mon algorithme d’identification d’auteurs, et je dĂ©couvre qui sont les auteurs qui ont repris mes contenus …

Voici un extrait de mon code source :

Outil extraction d'auteurs automatique big data AUTOVEILLEVoici ce que j’obtiens en rĂ©sultats :

RĂ©sultats extraction automatique d'auteurs AUTOVEILLEJ’ai identifiĂ© une personne qui reprend souvent mes contenus et qui les publient sur son blog. J’ai son nom et son prĂ©nom, son profil Google+, ainsi que les citations qu’il a repris de mes discours (vous reconnaĂźtriez mon style …)

Pour l’instant, mon outil est en cours de dĂ©veloppement. Je pense qu’un outil d’identification d’auteurs, pour trouver les plagiats, les duplicate content, ou tout simplement retrouver l’auteur original d’un article, pourrait ĂȘtre trĂšs utile pour affiner les tris des informations lors d’un processus de veille, par exemple.

Qu’en pensez-vous ? Toute suggestion est la bienvenue en tout cas. Et si vous souhaitez en savoir plus, Ă©crivez-moi !

Bon courage à tous 🙂

VĂ©ronique Duong –

 

Bonjour Ă  tous !

Je profite de cet article pour vous donner ma routine de la veille stratĂ©gique que j’effectue quotidiennement. Chaque veilleur a sa mĂ©thode, et se dĂ©brouille selon les outils et les ressources dont il possĂšde. Chacune des mĂ©thodes peut ĂȘtre plus ou moins diffĂ©rente, mais le rĂ©sultat final devrait ĂȘtre le mĂȘme c’est Ă  dire la diffusion de l’information veillĂ©e sous forme de comptes-rendus.

TrĂšs rapidement, je vais vous dĂ©crire ma routine de veilleuse Ă  laquelle j’y tiens depuis plus de 2 ans. Je rappelle que je veille avec mon outil de veille automatique (AUTOVEILLE) mais Ă©galement plusieurs autres outils disponibles sur le marchĂ©. J’avais rĂ©digĂ© un article sur ces outils de veille, si cela vous intĂ©resse, je vous invite Ă  le lire.

Voici les étapes de mon activité:

1) TrĂšs rĂ©guliĂšrement, je regarde ce que ma collecte automatique donne comme rĂ©sultats. Je reçois Ă©galement trĂšs souvent des alertes, des tweets, et tout de suite, je trie parmi ces donnĂ©es pour ne garder que ce qui m’intĂ©resse (surtout qu’il y a une rĂ©elle infobĂ©sitĂ© sur les sujets que je veille !)

2) AprĂšs avoir triĂ© mes donnĂ©es rĂ©cupĂ©rĂ©es automatiquement, je sĂ©lectionne parmi ces derniĂšres celles que je vais traiter sous forme de comptes-rendus (en gĂ©nĂ©ral, je choisis les plus pertinentes et originales), et le reste, je le partage sur Twitter ou sur d’autres rĂ©seaux sociaux.

3) Pour sélectionner mes informations préférées à traiter, je regarde:

  • le site d’oĂč vient l’article (site pro ? site perso ? blog ? etc.)
  • la fraĂźcheur de l’article (plus c’est rĂ©cent, mieux c’est)
  • le contenu de l’article (s’il y a de la matiĂšre ou pas ?)
  • l’auteur de l’article (quelqu’un de connu ? un blogueur ? un expert ? un amateur ? etc.)
  • le niveau « d’alerte » de l’article (est-ce que c’est un article qui contient une information cruciale pour les prochains jours / mois / annĂ©es ?)

Et bien sûr le sujet traité (mais cela va de soi ;))

4) Ensuite, je commence Ă  les lire et Ă  rĂ©diger mon compte-rendu soit sur mon blog AUTOVEILLE,  soit sur mon site (dans la partie News !). Le compte-rendu ne doit pas ĂȘtre un copiĂ© / collĂ© des informations rĂ©cupĂ©rĂ©es ! En plus en termes de SEO, c’est Ă  Ă©viter absolument (… duplicate content !!). En moyenne un compte-rendu me prend de 30 min Ă  1h de lecture / rĂ©daction. Tout dĂ©pend de la technicitĂ© des informations collectĂ©es.

Le mĂ©tier de veilleur, comme je le disais, est un mĂ©tier vĂ©ritablement riche en apprentissage, en stress (la « peur » de louper des informations importantes), et en rĂ©daction (s’exprimer Ă  travers sa plume (ou plutĂŽt son clavier …), crĂ©er des textes originaux rĂ©guliĂšrement). On ne s’ennuie jamais ! 😉

Les différents types de veille: veille commerciale, veille sociétale, veille technologique, veille webmarketing, veille réglementaire

Les différents types de veille

Bon courage !

VĂ©ronique Duong –

%d blogueurs aiment cette page :