1 août 2008 # # 11 commentaires

1001rss.com : nouveau parasite du web et comment s’en débarasser

Ce matin dans mes referers (les urls des sites qui renvoient vers barbayellow.com) j’ai vu un nouveau venu : 1001rss.com. Je me dis :Chouette ! Un site qui parle de RSS qui renvoie chez moi. Allons vite voir ce nouvel ami !

Je clique donc sur l’adresse de ce referer et là, que vois-je ? Ça :

Barbablog honteusement rssisé par 1001rss.com

1001rss.com encapsule mon site dans un frameset et lui adjoint une barre supérieure avec son logo et sa pub à l’intérieur. Et ça, ça me gêne profondément. Pour plusieurs raisons :

  1. l’internaute qui arrive sur le barbablog à partir de 1001rss.com peut croire que 1001rss.com est le proriétaire légitime du Barbablog,
  2. l’internaute qui arrive sur le barbablog à partir de 1001rss.com peut croire que je rajoute des vieilles pubs nazes sur mon site,
  3. 1001rss.com se fait du beurre sur mon dos.

1001rss.com se la joue à la wikio genre : je suis un annuaire de flux, j’apporte un service aux internautes et au passage je me sers du contenu produit par d’autres sites pour me gaver comme une vieille oie dont le foie malade finira bientôt dans un rayon de supermarché entouré d’un vieux bout de cellophane transparent. Et ça, j’aime pas trop (pas le foie gras mais l’attitude de 1001rss.com).

Comment se débarasser des parasites

J’ai donc décidé de sucrer l’accès à mes flux à ce vilain parasite. Et je vous invite  à faire de même. Pour ce faire c’est très simple : il suffit de rajouter un peu de vermifuge sur son site.

Dans le répertoire où se trouvent vos fichiers rss ou atom, rajoutez un fichier htaccess (un simple fichier texte que vous renommerez en .htacces) avec ce bout de code à l’intérieur :

#Controle de l'accès aux flux RSS
Order Allow,Deny
# On autorise l'accès à tous
Allow from All
# Acces interdit à 1001rss
Deny from 213.186.33.2

1001rss.com se verra couper l’accès à vos flux et ne pourra donc plus les indexer. Évidemment, ça peut vous faire perdre un peu de trafic. Ceci dit, vu la taille de 1001rss.com pour l’instant, ça devrait vous faire perdre une demi-visite tous les 5 ans. Par ailleurs, je reste persuadé qu’un bon site avec du contenu intéressant n’a pas besoin de béquilles à la wikio ou 1001rss.com pour exister et se faire connaitre.

Sur ce sujet, je vous invite  à lire le billets de Narvic sur la qualité de l’audience apportée par ce genre de sites.

A bon entendeur, salut.

Réagissez

Si ce billet vous a plu ou si vous voulez apporter des précisions, ou si vous n’êtes pas d’accord avec ce que je raconte, c’est ici qu’il faut vous manifester. Je me réserve toutefois le droit de supprimer toute contribution insultante ou qui n’aurait rien à voir avec la choucroute.

  1. Les sites comme Wikio font leur beurre sur le dos des blogueurs. Cependant, un certain nombre de blogueurs y trouvent leur compte grâce au traffic qu’ils retirent de ce genre de sites qui est parfois pas négligeable (un bon positionnement sur wikio pouvant rapporter plusieurs centaines de visites par jour). Après, il est sûr qu’un bon blog n’a pas forcément besoin de cela pour vivre 😉

  2. C’est un bon truc, ce htaccess. Je vais sûrement l’utiliser pour empêcher plusieurs sites de me pomper. Dans ce cas, il faut séparer les IP par une virgule comme :

    Deny from 213.186.33.2,213.186.33.3,213.186.33.4

    ou bien multiplier les Deny from, comme :

    Deny from 213.186.33.2
    Deny from 213.186.33.3
    Deny from 213.186.33.4

    Merci pour ta réponse 😉

  3. Merci pour ces précisions. Petite question à la marge, mais qui a son importance : beaucoup d’agrégateur sont sur des hébergements mutualisés et en bloquant une IP, on bloque de facto l’accès à de nombreux sites.

    Enfin, je dis ça, mais mon intuition me dis qu’il ne s’agit pas vraiment de réseaux de particuliers ou même d’entreprise qui nous priverait de trafic qualifié.

    Tu en penses quoi ?

  4. J’en pense qu’il est toujours un peu dangereux de jouer avec son htacess. En même temps, c’est la méthode la plus efficace pour contrôler l’accès au contenu d’un site. Donc oui, j’imagine que bloquant une IP indésirable tu peux également bloquer involontairement certains services qui partageraient la même ip pour une histoire de proxy ou autre. Mais en même temps je n’imagine pas que ce genre de site soit du gabarit d’un netvibes ou d’un google reader. Donc au final, peu de risques. Ton intuition était bonne 😉

    D’une manière générale, dès qu’on fait une modif un peu sensible sur un site (modifier le htaccesss ou le robots.txt, changer les règles de redirection, déménager un serveur, migrer une version…), le secret pour ne pas se planter et être sûr de ne rien avoir oublié, c’est de surveiller ses stats. Ainsi si un problème survient, on l’identifie en général assez vite.

  5. bonjour,
    ha ce que je vois j’ai un nouvel ami !

    Si vous me permettez que j’apporte une réponse à ce post.
    Pour commencer on a sortie 1001rss avant les google reader, wikio, netvibes et j’en passe (pour la petite histoire). Nous n’avons pas fait une pale copie mais une innovation lorsqu’il est sortie à l’époque, innovation qui depuis a été reprise par les plus gros (je ne suis pas entrain de dire qu’il nous ont copié mais seulement que les idées sont universels).

    De plus, parmi ceux cité nous sommes les seuls à mettre un backlink sur l’url du flux rss ce qui influe sur le ref nat du site inscrit dans l’annuaire.

    Pour info, Nous sommes sur la V2 et nous avons décidé de supprimer la fameuse frame dans cette prochaine version (qui peut être retiré par les webmasters chevronnés dores et déjà).

    Sinon le plus simple est de nous demandé de retiré le flux rss de nos bases si vous ne souhaiter pas y être. Solution bien plus pratique et plus efficace que celle que vous proposez avec le htacces. En effet techniquement votre solution est largement contournable (on le fera pas car on veut que les webmasters qui ont leur flux rss de soumis aient donnée leur aval)

    bref, nous nous sentons pas plus ‘parasite’ que google qui fait ca fortune sur votre contenu également et qui reprend encore plus d’info de vos sites via son cache entre autre et sans votre accord au passage… donc je trouve le raisonnement un peu étrange.

    Ensuite chaque point de vu est respectable et je dirais même qu’en tant que webmaster une partie de moi comprends votre point de vue mais l’autre coté pense aussi a ce que ca apporte.

    Nous sommes dans une logique win – win :
    on relaie votre contenu mais en échange on vous apporte une visibilité et un backlink entre autre.

    auriez vous le même raisonnement avec un moteur de recherche ? car techniquement ils ont les même pratiques et eux n’attendent pas que le webmaster donne son url ce qui est le cas dans notre annuaire.

    ps : j’ai retiré votre flux rss de notre annuaire

    rudegreg
    co-fondateur de 1001rss

  6. Merci rudegreg, cofondateur de 1001 rss, de m’avoir supprimé de votre annuaire.

    Juste un mot sur la logique ouin ouin (traduction française de win win): depuis que ce blog existe, je n’ai eu qu’une seule et unique visite en provenance de 1001rss.com. Je trouve ça trop peu cher payé pour abandonner mon contenu à un agrégateur.

  7. je ne voudrais pas polémiquer mais a mon avis ce n’est pas si simple…
    Déjà nous sommes au moins 2 à etre venu sur ton site via google via la requête ‘1001rss’. De plus, tu ne prend pas en compte le ref nat que tu avais peut etre gagné via le backlink sur le flux.

    tu n’abandonne pas ton contenu parce que tu le propose dans un agrégateur via un flux RSS. Y’a surement des moteur de recherche de niche qui ont mis en cache ton contenu et plus (les images et le javascript) et qui t’opporte autant de trafic mais tu n’as surement pas ce raisonnement avec eux.
    Ton flux rss est une vitrine pour des visiteurs via un autre canal. surtout quand général le flux est limité en nombre d’item et que donc les gens finissent par cliquer sur les liens pour voir le reste du site.

    autre exemple avec flickr : les photos que tu as soumise il les rentabilise bien en faisant du trafic sur tes droits d’auteurs si on pousse la réflection

  8. @rudegreg > « autre exemple avec flickr : les photos que tu as soumise il les rentabilise bien en faisant du trafic sur tes droits d’auteurs si on pousse la réflection »

    Pas besoin de pousser la réflexion pour voir que le bénéfice pour Grégoire est sans commune mesure entre 1001rss et flickr. Sans compter que dans le cas de Flickr, il s’est inscrit de son plein gré 😀

    Quant à envoyer un mail pour demander une éventuelle suppression, je l’ai déjà fait, en vain (pas sur 1001rss, hein, je parle d’un autre aspirateur).

    Je lis souvent l’argument du moteur de recherche qui ferait la même chose. Le fait même que les éditeur de blogs n’aiment pas voir leur flux aspirés mais cherchent à être présent dans les premiers résultats de google, montre bien que les choses sont différentes !

    Un moteur qui reprendrait un flux pour le monétiser sans envoyer de visiteur ressemblerait furieusement à un aspirateur de flux, ni plus ni moins ^^

    Bref,plus je lis les argument de ceux qui aspirent les flux, et plus j’ai le sentiment d’être pris pour un imbécile… je sais quand même où est mon intérêt.

    En ce qui me concerne, j’ai accepté la présence de mon flux sur un site qui agrège des flux RSS, ce qui ne veut pas dire que c’est la porte ouverte à toutes les fenêtres.

    On a bien le droit de donner aux uns et de refuser aux autres, non ?

  9. re,
    on aspire pas les flux sur 1001rss ils sont soumis par les internautes ou les webmasters du site.

    Je n’insiste pas.
    En tous cas, c’est déjà gentil de m’avoir laisser répondre.

    bonne continuation.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.