PythonでRSSフィード取得してみた

RSSフィードを使って悪だくみをしようと思い立ち、久しぶりにRSS周りをいじることに。そんでもって、たまにはイマドキの言語で書こうとPythonで書いてみることに。
いろいろGoogle様にお伺いを立てたところ、Pythonではfeedparserを使うのが手っ取り早い模様。
ということで、早速feedparserをインストール。
Ubuntu上でいじっているのでこんな感じ。

$ sudo apt-get install python-feedparser

インストールできたので、Google様にお伺いを立てつつ、サンプルコード作成。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
#
# feedparser のサンプルコード
#

import feedparser

rssurl = "http://d.hatena.ne.jp/calnarsa/rss"
fdp = feedparser.parse( rssurl )
	
for entry in fdp[ 'entries' ]:
    print "Title: ", entry[ 'title' ]
    print "URL: ", entry[ 'link' ]
    print "Description: ", entry[ 'description' ]
    print "Date: ", entry[ 'updated' ]

上のコードを実行してみたら、こんな感じ。

$ ./rss.py
Title:  Bazaarのある生活
Description:  基本的に古いタイプのプログラマなもので、バージョン管理とかメンドクセーとか言い出す奴なのです。 なので、自分しか使わねーソースはバージョン管理無視、あるいはがんばってrcs使えばじゅーぶんじゃん、で済ませるヤローなのですが、さすがにヤバくなってきました。 と
Date:  2010-08-23T16:59:12+09:00
Title:  はじまり
Description:  いまごろになってはじめてみた。 特に意味はない。 ただ思いついただけ。
Date:  2010-08-20T16:34:25+09:00

うん、ちゃんと取れてるね。
上のサンプルコードではRSS1.0形式を想定してるけど、feedparserはRSS1.0, 2.0, Atomに対応している感じ。
RSS2.0は試したけど、このまんまで動いた。ちゃんと検証してないけど。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)