Accueil > Agréger les informations, Organiser son projet de veille > Les flux RSS pour automatiser et centraliser sa collecte de données sur le Web

Les flux RSS pour automatiser et centraliser sa collecte de données sur le Web

Lorsque l’on parle de dispositif de veille structuré aujourd’hui, on peut immédiatement penser à trois grandes tendances :

  • L’automatisation de la collecte donnée : Cette méthode de collecte est appelée « push » et s’oppose à la méthode dite « pull » (l’utilisateur se charge lui même de collecter ses données). Notez que ces deux méthodes peuvent être complémentaires, la méthode « pull » pouvant être utilisée pour réaliser son sourcing, et la méthode « push » peut quant à elle être mobilisée pour la collecte d’informations.
  • La centralisation : Faire en sorte que l’ensemble des données collectées soient agrégées sur une seule et même plateforme.
  • La combinaison de plusieurs outils : l’interopérabilité des différentes solutions de veille permet de mettre de plus en plus de sources d’informations sous surveillance et d’agréger le contenu récupéré sur la même plateforme.

Si il y a bien aujourd’hui un format qui vous permet de satisfaire à ces trois exigences, c’est bien les flux RSS. Peu importe que vous choisissiez une plateforme d’agrégation sur Internet ou un logiciel en dur, ce qui importe ici, c’est que les flux RSS permettent de couvrir un vaste besoin en matière de veille. Nous nous focaliserons donc essentiellement sur le contenu et très peu sur le contenant (le strict minimum nécessaire à la compréhension de ce billet sera ici exposé).

Qu’est-ce qu’un flux RSS ? (Nota : la définition provient de l’excellent livre « E-réputation, Méthodes et outils pour les individus et les entreprises »)

Le format RSS, qui signifie « Rich Site Summary », est un format de type XML universel  (Extensible Markup Language), capable de véhiculer différent type de données. Un flux RSS contient des informations publiées sur un site Web ou, à présent, sur les réseaux sociaux. Le flux RSS peut intégrer différents types de contenus (images, vidéos, flash…).

Un flux RSS contient généralement plusieurs informations :

  • Des informations générales (site d’où provient le flux, description du site, dernière date de mise à jour du flux, lien vers le site)
  • Des informations spécifiques (titre et description de l’élément,  date de publication, lien vers l’élément).

Un flux RSS offre l’avantage d’être proposé par les traditionnelles sources utilisées dans le cadre d’une veille sur Internet (blogs, sites Web, forums, réseaux sociaux…).

Choisir son agrégateur de flux

votre choix d’agrégateur dépendra essentiellement de la fréquence avec laquelle vous le consulterez et de vos préférences en matière de design et d’enrichissement des fonctionnalités de l’outil.

Si les agrégateurs de flux en ligne sont généralement très visuels (Pulse, Netvibes, Bloglines…) et proposent des Widgets parfois inutiles mais souvent intéressants, ils nécessitent en revanche une visite quasi quotidienne (pas d’archivages des flux, à quelques exceptions près cependant, comme Google Reader). Les logiciels sont généralement plus compliqués à configurer mais offrent des possibilités étendues (notamment l’archivage).

Pour choisir votre agrégateur de flux, rendez vous ici.

Organiser ses flux RSS

La majeure partie des sites Internet, blogs et autres proposent aujourd’hui un accès direct à leurs flux RSS. Il suffit juste d’identifier sur le site visité cette petite icône. rss

Cependant, bien que les flux RSS constituent un outil parfait pour la veille Internet, il est possible de rencontrer certains problèmes :

  • Le site visité ne propose pas de flux : C’est très simple, vous en créez un à partir d’outils comme page2rss par exemple. Enfin en théorie car, personnellement, je ne suis que peu satisfait des résultats de page2rss, et je préfère configurer un système d’alertes pour surveiller un site Web qui ne propose pas de flux RSS ou suivre le compte Twitter ou Facebook du site en question. Mais bien évidemment cela remet en cause le principe de centralisation…

page2rss

  • Toutes les informations en provenance d’un site web ne vous intéressent pas : Dans ce cas, inutile de perdre votre temps en faisant du tri entre informations pertinentes et « bruit ». Gagner en productivité en mettant en place un filtre dans vos flux RSS. Pour placer un filtre « basique », vous pouvez par exemple utiliser feedrinse, qui vous permettra d’autoriser ou de bloquer un post en fonction de mots clés que vous aurez définis. Plus avancé, Yahoo ! Pipes propose de créer des « pipes »(tuyaux) via lesquels vous pourrez définir un certain nombre de commandes, permettant de filtrer vos flux. Les possibilités offertes par cet outil étant tellement riches, mais son utilisation tellement délicate, que je ne m’attarderai pas dessus (je tâcherai de créer un tutoriel sur son utilisation rapidement).

feedrinse

  • Sourcing large : Si vous avez identifié un grand nombre de sources d’informations, et que vous avez agrégé leur(s) flux dans votre agrégateur, celui-ci risque vite d’être saturé et de devenir illisible. Pour limiter le nombre de flux, il vous est tout à fait possible de définir, classer et rassembler vos sources d’informations par thématiques et de condenser l’ensemble des flux en provenance de sites appartenant à une même thématique en un seul flux. Comment ? En utilisant par exemple Chimpfeedr qui vous permettra de regrouper plusieurs flux en un seul. Attention cependant,via cette méthode, si vous ne faîtes pas de la veille à temps plein, vous risquez de perdre un grand nombre d’informations. Pour éviter cela, utilisez un filtre comme présenté ci-dessus, si cela vous est possible, et/ou privilégiez un agrégateur de flux permettant l’archivage des données récoltées (la plupart des agrégateurs sous format logiciels et Google Reader par exemple).
  • La mise à jour du sourcing : Dans le cadre d’une veille sur le long terme, il peut être utile de surveiller l’apparition de nouvelles sources d’informations. Il est évident que vous pouvez utiliser un système d’alertes pour ce faire. Le système d’alerte Google permet de recevoir ses alertes par flux RSS plutôt que par email.

google alertes

Les flux RSS, les réseaux sociaux et les plateformes collaboratives

Depuis que les plateformes du Web ont partiellement ouvert l’accès à leurs serveurs aux développeurs (API, Application Programming Interface), ces derniers ont développé des applications capables d’interagir avec ces plateformes.

Les flux RSS ne sont pas en reste puisqu’il est aujourd’hui possible, grâce aux API, de transformer en flux RSS un grand nombre de données intéressantes sur les réseaux sociaux et les sites de partage de contenu.

  • Sur Twitter

–>Vous pouvez aisément créer un flux à partir de votre timeline twitter en utilisant « Twitter2rss ».

–>Vous pouvez également suivre un ou plusieurs comptes via cette URL :

https://api.twitter.com/1/statuses/user_timeline.rss?screen_name=compte

Il suffit de remplacer « compte » par le compte que vous souhaitez suivre. Par exemple avec mon compte twitter :

https://api.twitter.com/1/statuses/user_timeline.rss?screen_name=@StratVeille

–>Il est possible de transformer une requête de recherche en flux RSS (les nouveaux résultats liés à cette requête s’afficheront sous forme de flux).

http://search.twitter.com/search.atom?q=search%20motclé

Pour créer un flux en fonction d’une recherche par hashtag

http://search.twitter.com/search.atom?q=search%23hashtag

–>Vous pouvez, enfin, générer un flux RSS à partir d’une liste twitter en utilisant l’outil Twitter Lists 2 RSS.

  • Sur Facebook

Pour mettre sous surveillance une fanpage Facebook, il vous faut tout d’abord vous rendre sur la Fan page et copier la dernière série de chiffres que vous trouverez dans l’url de la page en question. Vous pouvez ensuite intégré cette série de chiffre dans l’url suivante :

http://www.facebook.com/feeds/page.php?format=atom10&id=XXXXX

Autre méthode plus simple, intégrer directement l’id de la fanpage dans ce Pipe développé par l’agence Voyelle.

  • Sur Google+

Même fonctionnement que pour Facebook. Il vous faut copier l’ID utilisateur (dernière série de chiffres d’une page google+) et l’intégrer dans cette URL :

https://plus.google.com/u/0/113035435799472998580

http://dlvritplus.appspot.com/113035435799472998580

  • Sur Youtube

Pour suivre une chaîne Youtube, copiez le nom de la chaîne et intégrez la directement dans cette URL :

http://gdata.youtube.com/feeds/base/users/nomdelachaîne/uploads

  • Sur Pinterest

–>Vous pouvez mettre sous surveillance, soit un compte, via l’url suivante:

feed://pinterest.com/username/feed.rss

–>soit un classeur (board) via le lien suivant:

feed://pinterest.com/board/feed.rss

  • Sur Instagram

Vous pouvez créer un flux à partir d’une recherche par hashtags via l’url suivante:

http://instagr.am/tags/hashtag/feed/recent.rss

  • Sur Delicious

–>Vous pouvez mettre sous surveillance un compte delicious via cette url :

http://delicious.com/v2/rss/compte

–>Vous pouvez également créer un flux à partir d’un tag :

http://delicious.com/v2/rss/tag/nomDuTag

 A noter que pour l’ensemble de ces réseaux sociaux, l’agence Voyelle a développé des Pipes en libre accès que vous pouvez trouver sur leur blog.

Via les flux RSS vous pouvez également mettre sous surveillance les comptes des sites de curation. Scoop.it par exemple, vous permet de vous abonner au flux RSS d’un compte.

scoop it

About these ads
  1. Pas encore de commentaire.
  1. 10 janvier 2013 à 10 h 48 min

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

Suivre

Recevez les nouvelles publications par mail.

Rejoignez 95 autres abonnés

%d blogueurs aiment cette page :