S'abonner: Articles | Commentaires | E-mail

Un canon pour votre site !

La semaine dernière Thomas évoquait dans un de ses brèves le sujet du clonage intempestif et de la solution adopté par les 3 géants de l’internet que sont Yahoo, Microsoft et Google.

De nombreux commentaires ici sur Moteurzine me font réagir car la brève semble être mal comprise.

En effet de nombreux lecteurs se sont dit que la balise « canonical » supportée par les 3 moteurs de recherche allait mettre fin au copiage de sites internet entier.

Il en est rien. Cette balise n’évitera pas que votre site soit copié par un indélicat webmaster, que ceci soit partiel ou carrément complet.

Cette balise vous permettra uniquement d’indiquer aux moteurs de recherche qu’une page est similaire à d’autres et qu’il faut prendre en compte uniquement celle-ci. Les autres pages sont la uniquement pour des raisons techniques ou visuelles.

Celle-ci ne seront alors pas affiché dans le moteur mais apporterons tout de même leur poids à la page de référence.

Un exemple :

Monsite.com/ma_page.php ?id=1 est équivalente à Monsite.com/ma_page.php ?id=1&SID=123456

La page Canon est ici ma_page=1 et dans ma_page.php ?id=1&SID=123456 contiendra alors un

En ce qui concerne le vol de contenu, entier ou partiel, les moteurs de recherche en ont l’habitude et les internautes aussi : La fuite. Bien évidement ceci n’est vrai que partiellement, car les techniques des copieurs sont souvent uniques et il est bien difficile pour un moteur de recherche de détecter qui a été dupliqué et qui faut-il mettre en avant.

La aussi un exemple simple. Imaginez-vous devant un tas de foins et que l’on vous demande de trier chaque paille en fonction du nombre de graines et de sa nuance de couleur et de sa maturité.

Bien que vous réussirez sans aucun doute à trier les 100 premières pailles, je suis à peu près sur qu’au bout de 10.000 pailles que vous aurez des erreurs.

Il est clair que pour un moteur de recherche de la taille des géants il ne s’agit pas de trier juste un tas de foins, mais de traiter des milliards de pages. Il est tout aussi clair que tout est robotisé et de fait qu’il peut y avoir des erreurs et ce malgré les innombrables filtres.

On pourrait comparer cela à la lutte contre les virus informatique ou encore le spam dans votre boite mail.

VN:F [1.9.11_1134]
Votez pour cet article :
Rating: 0.0/5 (0 votes cast)
VN:F [1.9.11_1134]
Rating: 0 (from 0 votes)

Pour compléter votre lecture :


  1. Bonsoir

    Cette phrase semble incomplète :

    La page Canon est ici ma_page=1 et dans ma_page.php ?id=1&SID=123456 contiendra alors un ??????????

    VA:F [1.9.11_1134]
    Rating: 0.0/5 (0 votes cast)
    VA:F [1.9.11_1134]
    Rating: 0 (from 0 votes)
  2. Mea culpa :
    ma_page.php?id=1 pour le canonical.

    VA:F [1.9.11_1134]
    Rating: 0.0/5 (0 votes cast)
    VA:F [1.9.11_1134]
    Rating: 0 (from 0 votes)
  3. Bonjour,

    Et merci Gilbert pour ces précisions.
    Je pense être responsable de la confusion car la brève n’est pas précise et j’ai certainement semé le trouble dans mon commentaire en parlant des copieurs de contenu.

    VN:F [1.9.11_1134]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.11_1134]
    Rating: 0 (from 0 votes)
  4. Évidement avec ce gros nombre de pages à analyser et les changements continus du contenu général de la toile, il est difficile de distinguer ce qui original.
    chaque jour il y a des milliers de sites qui naissent et d’autres qui disparaissent si ce n’est plus.

    VA:F [1.9.11_1134]
    Rating: 0.0/5 (0 votes cast)
    VA:F [1.9.11_1134]
    Rating: 0 (from 0 votes)
  5. Imaginons un blog ou l’article est inséré dans une rubrique et une sous rubrique.

    Exemple:
    l’article « ma voiture écologique » est présent dans la rubrique AUTOMOBILE, ainsi que dans la sous rubrique ELECTRIQUE.

    Y a til alors double contenu ?

    VA:F [1.9.11_1134]
    Rating: 0.0/5 (0 votes cast)
    VA:F [1.9.11_1134]
    Rating: 0 (from 0 votes)

Laisser une réponse