RSSフィードを使って悪だくみをしようと思い立ち、久しぶりにRSS周りをいじることに。そんでもって、たまにはイマドキの言語で書こうとPythonで書いてみることに。
いろいろGoogle様にお伺いを立てたところ、Pythonではfeedparserを使うのが手っ取り早い模様。
ということで、早速feedparserをインストール。
Ubuntu上でいじっているのでこんな感じ。
$ sudo apt-get install python-feedparser
インストールできたので、Google様にお伺いを立てつつ、サンプルコード作成。
#!/usr/bin/env python # -*- coding: utf-8 -*- # # feedparser のサンプルコード # import feedparser rssurl = "http://d.hatena.ne.jp/calnarsa/rss" fdp = feedparser.parse( rssurl ) for entry in fdp[ 'entries' ]: print "Title: ", entry[ 'title' ] print "URL: ", entry[ 'link' ] print "Description: ", entry[ 'description' ] print "Date: ", entry[ 'updated' ]
上のコードを実行してみたら、こんな感じ。
$ ./rss.py Title: Bazaarのある生活 Description: 基本的に古いタイプのプログラマなもので、バージョン管理とかメンドクセーとか言い出す奴なのです。 なので、自分しか使わねーソースはバージョン管理無視、あるいはがんばってrcs使えばじゅーぶんじゃん、で済ませるヤローなのですが、さすがにヤバくなってきました。 と Date: 2010-08-23T16:59:12+09:00 Title: はじまり Description: いまごろになってはじめてみた。 特に意味はない。 ただ思いついただけ。 Date: 2010-08-20T16:34:25+09:00
うん、ちゃんと取れてるね。
上のサンプルコードではRSS1.0形式を想定してるけど、feedparserはRSS1.0, 2.0, Atomに対応している感じ。
RSS2.0は試したけど、このまんまで動いた。ちゃんと検証してないけど。