S'abonner: Articles | Commentaires | E-mail
Recherche
Un canon pour votre site !
La semaine dernière Thomas évoquait dans un de ses brèves le sujet du clonage intempestif et de la solution adopté par les 3 géants de l’internet que sont Yahoo, Microsoft et Google.
De nombreux commentaires ici sur Moteurzine me font réagir car la brève semble être mal comprise.
En effet de nombreux lecteurs se sont dit que la balise « canonical » supportée par les 3 moteurs de recherche allait mettre fin au copiage de sites internet entier.
Il en est rien. Cette balise n’évitera pas que votre site soit copié par un indélicat webmaster, que ceci soit partiel ou carrément complet.
Cette balise vous permettra uniquement d’indiquer aux moteurs de recherche qu’une page est similaire à d’autres et qu’il faut prendre en compte uniquement celle-ci. Les autres pages sont la uniquement pour des raisons techniques ou visuelles.
Celle-ci ne seront alors pas affiché dans le moteur mais apporterons tout de même leur poids à la page de référence.
Un exemple :
Monsite.com/ma_page.php ?id=1 est équivalente à Monsite.com/ma_page.php ?id=1&SID=123456
La page Canon est ici ma_page=1 et dans ma_page.php ?id=1&SID=123456 contiendra alors un
En ce qui concerne le vol de contenu, entier ou partiel, les moteurs de recherche en ont l’habitude et les internautes aussi : La fuite. Bien évidement ceci n’est vrai que partiellement, car les techniques des copieurs sont souvent uniques et il est bien difficile pour un moteur de recherche de détecter qui a été dupliqué et qui faut-il mettre en avant.
La aussi un exemple simple. Imaginez-vous devant un tas de foins et que l’on vous demande de trier chaque paille en fonction du nombre de graines et de sa nuance de couleur et de sa maturité.
Bien que vous réussirez sans aucun doute à trier les 100 premières pailles, je suis à peu près sur qu’au bout de 10.000 pailles que vous aurez des erreurs.
Il est clair que pour un moteur de recherche de la taille des géants il ne s’agit pas de trier juste un tas de foins, mais de traiter des milliards de pages. Il est tout aussi clair que tout est robotisé et de fait qu’il peut y avoir des erreurs et ce malgré les innombrables filtres.
On pourrait comparer cela à la lutte contre les virus informatique ou encore le spam dans votre boite mail.
Pour compléter votre lecture :
- Avant de promouvoir un site, créez-le
- Site ou pas site, tel est la question
- Echange de liens 3.0
- Devenons des internautes écologiquement responsables
- Google ou Facebook ?
- Quand je snobais Google
- Un long fleuve tranquille














Bonsoir
Cette phrase semble incomplète :
La page Canon est ici ma_page=1 et dans ma_page.php ?id=1&SID=123456 contiendra alors un ??????????
Mea culpa :
ma_page.php?id=1 pour le canonical.
Bonjour,
Et merci Gilbert pour ces précisions.
Je pense être responsable de la confusion car la brève n’est pas précise et j’ai certainement semé le trouble dans mon commentaire en parlant des copieurs de contenu.
Évidement avec ce gros nombre de pages à analyser et les changements continus du contenu général de la toile, il est difficile de distinguer ce qui original.
chaque jour il y a des milliers de sites qui naissent et d’autres qui disparaissent si ce n’est plus.
Imaginons un blog ou l’article est inséré dans une rubrique et une sous rubrique.
Y a til alors double contenu ?