Peter Szinek a étudié les différentes possibilités d'extraction Web et de navigation Web automatisée à l'aide de Ruby. Son article présente plusieurs librairies (HTree, REXML, RubyfulSoup et WWW::Mechaniz) répondants à plusieurs types d'utilisation et à différents besoins. Un article très intéressant, en anglais, que je conseille vivement de lire si vous comptez faire de l'extraction de données Web.

L'article est disponible ici.