pyqueryを使ってスクレイピングしてみたのでメモ
インストールは
pip install pyquery
でOK。pyqueryが依存しているlxmlもあわせてインストールされる。
from pyquery import PyQuery
q = PyQuery(url='http://b.hatena.ne.jp/')
for elem in q.find('a.entry-link'):
#PyQuery
q2 = PyQuery(elem)
print q2.text()
print q2.attr('href')
#lxml
# print elem.text
# print elem.get('href')
こんな感じで使える。