archive

Archives de Tag: duplicate content

Hello tout le monde !

Suite à une question posée sur Twitter par Cédric Guérin pour comprendre plus en détails mon test sur les communiqués de presse et le duplicate content, je poste ce petit article !

Voici l’histoire : en novembre 2015, je voulais voir si les communiqués de presse et le Duplicate Content pénalisent vraiment les sites, et je me suis inscrite sur le site Agence Presse (aujourd’hui, le site que j’ai créé n’existe plus, c’était juste pour le test). Lors du premier mois, il ne se passe rien. Mes positionnements sur mes mots-clés préférés comme « logiciel de veille », « logiciel veille », « logiciels de veille » sont dans le top 5, comme vous pouvez le constater ci-dessous :

Positionnement SEO logiciel de veille AUTOVEILLE

 

Mais au bout de quelques mois, je me suis prise une grosse pénalité Panda, et je perds 15 positions pour « logiciel de veille » ! Vous pouvez constater cela avec la capture de mon rapport ci-dessous :

logiciel-veille-seo-autoveille-2016

J’ai publié un ou deux articles seulement sur ce site de communiqués de presse, et je les avais plus ou moins réécrits (mais en changeant très peu, c’est fait exprès). Maintenant, j’ai la preuve que la pénalité existe ! Ne faites surtout pas de copiés / collés de site, de communiqués de presse, sinon vous risquez une claque comme celle que j’ai pris pour ce test. J’essaye de remonter la pente maintenant, et je vous dirais comment j’aurais fait (si je m’en sors 🙂 ) !

Si vous avez des questions sur les pénalités SEO Google, sur le Duplicate Content, comment le gérer, etc. écrivez moi à autoveille@gmail.com

Bon courage à tous !

V̩ronique Duong РConsultante SEO certifi̩e CESEO

Bonjour à tous !

Ce week-end pour changer un peu des veilles automatiques d’infographies avec AUTOVEILLE, mon logiciel de veille, je vous propose de découvrir un outil que je suis en train de développer pour identifier automatiquement les auteurs et les sources des articles.

Avec la big data, la curation, les partages sur les divers médias sociaux et l’infobésité, parfois, on ne sait plus qui est l’auteur original d’un article ou d »une information. J’ai donc décidé (et surtout tenté) de développer un nouvel outil pour extraire les auteurs et le maximum de sources pour retrouver le créateur de l’article parmi une base de fichiers HTML que j’aurais collectés au préalable avec … AUTOVEILLE corpus.

Dans mon algorithme, j’y ai mis plusieurs règles pour pouvoir extraire un maximum d’éléments sur les auteurs. De ce fait, mon outil pourrait également être utilisé dans l’extraction des « auteurs-copieurs » d’articles, les plagiats et le duplicate content …

Voici un cas de figure que je suis en train d’étudier :

Je recherche sur le web si on m’a copié avec Google. Je copie/colle un extrait d’un de mes articles entre  »  »Â  dans le moteur de recherche.

Ensuite, j’aspire automatiquement toutes les pages qui contiennent cet extrait.

Puis, je télécharge les liens de ces pages sous forme de fichiers .html. Cela me crée une base.

Et au final, je lance mon algorithme d’identification d’auteurs, et je découvre qui sont les auteurs qui ont repris mes contenus …

Voici un extrait de mon code source :

Outil extraction d'auteurs automatique big data AUTOVEILLEVoici ce que j’obtiens en résultats :

Résultats extraction automatique d'auteurs AUTOVEILLEJ’ai identifié une personne qui reprend souvent mes contenus et qui les publient sur son blog. J’ai son nom et son prénom, son profil Google+, ainsi que les citations qu’il a repris de mes discours (vous reconnaîtriez mon style …)

Pour l’instant, mon outil est en cours de développement. Je pense qu’un outil d’identification d’auteurs, pour trouver les plagiats, les duplicate content, ou tout simplement retrouver l’auteur original d’un article, pourrait être très utile pour affiner les tris des informations lors d’un processus de veille, par exemple.

Qu’en pensez-vous ? Toute suggestion est la bienvenue en tout cas. Et si vous souhaitez en savoir plus, écrivez-moi !

Bon courage à tous 🙂

Véronique Duong –

 

Bonjour à tous !

Je profite de cet article pour vous donner ma routine de la veille stratégique que j’effectue quotidiennement. Chaque veilleur a sa méthode, et se débrouille selon les outils et les ressources dont il possède. Chacune des méthodes peut être plus ou moins différente, mais le résultat final devrait être le même c’est à dire la diffusion de l’information veillée sous forme de comptes-rendus.

Très rapidement, je vais vous décrire ma routine de veilleuse à laquelle j’y tiens depuis plus de 2 ans. Je rappelle que je veille avec mon outil de veille automatique (AUTOVEILLE) mais également plusieurs autres outils disponibles sur le marché. J’avais rédigé un article sur ces outils de veille, si cela vous intéresse, je vous invite à le lire.

Voici les étapes de mon activité:

1) Très régulièrement, je regarde ce que ma collecte automatique donne comme résultats. Je reçois également très souvent des alertes, des tweets, et tout de suite, je trie parmi ces données pour ne garder que ce qui m’intéresse (surtout qu’il y a une réelle infobésité sur les sujets que je veille !)

2) Après avoir trié mes données récupérées automatiquement, je sélectionne parmi ces dernières celles que je vais traiter sous forme de comptes-rendus (en général, je choisis les plus pertinentes et originales), et le reste, je le partage sur Twitter ou sur d’autres réseaux sociaux.

3) Pour sélectionner mes informations préférées à traiter, je regarde:

  • le site d’où vient l’article (site pro ? site perso ? blog ? etc.)
  • la fraîcheur de l’article (plus c’est récent, mieux c’est)
  • le contenu de l’article (s’il y a de la matière ou pas ?)
  • l’auteur de l’article (quelqu’un de connu ? un blogueur ? un expert ? un amateur ? etc.)
  • le niveau « d’alerte » de l’article (est-ce que c’est un article qui contient une information cruciale pour les prochains jours / mois / années ?)

Et bien sûr le sujet traité (mais cela va de soi ;))

4) Ensuite, je commence à les lire et à rédiger mon compte-rendu soit sur mon blog AUTOVEILLE,  soit sur mon site (dans la partie News !). Le compte-rendu ne doit pas être un copié / collé des informations récupérées ! En plus en termes de SEO, c’est à éviter absolument (… duplicate content !!). En moyenne un compte-rendu me prend de 30 min à 1h de lecture / rédaction. Tout dépend de la technicité des informations collectées.

Le métier de veilleur, comme je le disais, est un métier véritablement riche en apprentissage, en stress (la « peur » de louper des informations importantes), et en rédaction (s’exprimer à travers sa plume (ou plutôt son clavier …), créer des textes originaux régulièrement). On ne s’ennuie jamais ! 😉

Les différents types de veille: veille commerciale, veille sociétale, veille technologique, veille webmarketing, veille réglementaire

Les différents types de veille

Bon courage !

Véronique Duong –

<span>%d</span> blogueurs aiment cette page :