Extraire les données d'un site web à l'aide de Ruby
Par Bounga le dimanche, 25 juin 2006, 14:03 - Documentations - Lien permanent
Il arrive pour des raisons personnelles mais aussi dans le but d'alimenter l'une de vos applications que vous ayez besoin d'extraire les données d'un site web de façon régulière et automatisée. Vous pouvez, par exemple, vouloir récupérer des données météorologiques, des résultats de moteur de recherche, une liste d'articles, etc. Ruby vous propose plusieurs solutions pour arriver à vos fins.
Peter Szinek a étudié les différentes possibilités d'extraction Web et de navigation Web automatisée à l'aide de Ruby. Son article présente plusieurs librairies (HTree, REXML, RubyfulSoup et WWW::Mechaniz) répondants à plusieurs types d'utilisation et à différents besoins. Un article très intéressant, en anglais, que je conseille vivement de lire si vous comptez faire de l'extraction de données Web.
L'article est disponible ici.