Sur votre beau site de tricot, vous avez récemment installé un programme qui vous permet de générer des statistiques Web. Lorsque l’on est un super hackerz-2-la-mort-ki-kill, on tourne sous Apache et on génère ses stats avec un machin comme AWStats.
C’est bien les stats, car elles vous donnent tout plein d’informations sur les gens qui viennent, les robots, les mots clé utilisés, etc. En bref, un très bon outil qui vous permet de bien optimiser votre beau site de tricot. Vous savez désormais que la page la plus fréquentée de celui-ci est celle qui décrit votre week-end au festival du tricotin à Crottes-en-Pithiverais, dans le Loiret.
Dans la partie referer, autrement dit l’url de la page vue précédemment par le visiteur, vous constatez la présence de nombreux sites complètement inconnus de votre part. Eperdu de joie (Wouhaaa, des gens font des liens vers mon site !), vous les visitez et nulle part, vous ne trouvez trace de votre site. Par ailleurs, ces sites n’ont strictement rien à voir avec le votre. On y parle de choses incompréhensibles comme « gambling », « mortgage », « viagra » et « loan ». Et en plus, ils sont en anglais, mais qu’est ce que c’est que ce binz ??
Vous êtes la malheureuse victime d’un spam referer, il ne vous reste plus qu’à aller vite pleurer sur un forum pour y épancher votre colère, à dire tout le mal que vous pensez de ce que l’on s’est permit de vous faire, à proposer que l’on fasse voter une loi contre le spam referer, à en appeler à la cour européenne de justice, à blablablablabla …, interdit, blablablabla …, illégal, blablablabla …, maison à gagner…, blablablabla …
Alors, c’est quoi ce machin de spam referer ? c’est tout simplement une petite technique Blackhat pour faire tout plein de liens vers un beau site qui vend des pilules radis. Des pilules radis, qu’est-ce que c’est encore que cette histoire ? Et bien à l’instar du radis, les pilules sont rouges à l’extérieur et blanches à l’intérieur, un peu comme certains politiciens ;-)
L’idée, c’est d’aller visiter votre site de tricot en faisant croire que vous venez d’un autre site, donc que vous arrivez au moyen d’un lien extérieur. Après ce lien apparaitra dans vos statistiques, et si ces dernières sont visibles, alors elles seront indexées par les moteurs de recherche, ce qui implique l’obtention d’un backlink vers le site du spammeur, tout bénéf, quoi. Mais c’est du spam, ça ! Oui, bien sur, et en plus c’est mal !
Un programme comme PRStorm utilise cette technique: en bombardant une multitude de sites avec un referer fabriqué de toute pièce, et ce pendant plusieurs heures, un spammeur peut facilement générer plusieurs centaines de backlinks.
Vous voulez des preuves ? Facile, il suffit d’utiliser l’arme absolue sur Internet pour récupérer des statistiques publiques; faites cela en lançant cette requête. Ici, on cherche l’empreinte (Footprint) de AWStats, et on se focalise sur la période de septembre 2008. On peut être plus restrictif en précisant par exemple un mot clé particulier afin de travailler uniquement sur la niche qui nous intéresse. Et puis bien entendu, il n’y a pas qu’AWStats comme logiciel de statistiques. Il suffit d’isoler l’empreinte du logiciel et rien ne vous empêche d’utiliser d’autres moteurs comme Yahoo ou Live par exemple.
Une fois que vous avez récolté des milliers d’URLs, vous n’avez plus qu’à lancer un simple wget, ou générer du trafic de M (encore !) en direction du site. Ici, les statistiques de www.tartopom.com sont spammées par l’infâme Pagasa:
# wget –referer=http://www.pagasa.net www.tartopom.com
Bien sûr, il manque plein de choses: un faux UserAgent et puis quelques proxy pour ne pas trop se faire remarquer.
Et la boucle, hein la boucle ? Parce que là, tu nous donnes l’instruction juste pour une seule URL. Mais moi, j’ai acheté 1500000 URL à utiliser et toi, tu nous dis pas comment faire pour utiliser toutes les URL. C’est simple, vous prenez Excel ou Calc et vous faites du copier-coller, un peu comme pour le trafic de M.
Voilà, à noter tout de même qu’il s’agit d’une technique assez ancienne et que les dernières versions des programmes de statistiques ont tendance à supprimer les URL des referer; il reste toutefois largement de quoi faire.
Salut Thibaut
article intéressant d’autant plus que j’ai constaté depuis quelque temps que l’un de mes sites était la proie depuis environ 1 mois, d’un site d’obédience lubrique à faire rougir une armée de nonnes ayant pour origine le bloc soviétique pour faire original…
Y aurait il un remède pour y palier ?
Tu peux toujours filtrer le ref via un htaccess, mais tu risques de perdre ton temps. Et en fin de compte, ce genre de spam ne nuie franchement pas à ton site, si ce n’est qu’il pollue un peu tes stats. Par ailleurs, les liens obtenus sont de très basse qualité (absence d’ancre SEO)