kurokikaze/togif.py

## togif.py
from bs4 import BeautifulSoup
from urllib2 import urlopen
from urlparse import urljoin
import re

for num in range(1, 150):
	url = "http://togif.me/catalog/" + str(num)
	res = urlopen(url)
	soup = BeautifulSoup(res.read())
	links = soup.select('td a')
	for link in links:
		page_url = urljoin(url, link.attrs['href'])
		page_res = urlopen(page_url)
		page_soup = BeautifulSoup(page_res.read())
		views  = page_soup.select('div.image-date')[0].text
		views_int = int(re.findall(r'\d+', views)[0])
		img_src = urljoin(page_url, page_soup.select('img')[0].attrs['src'])
		print str(views_int) + "," + img_src
	from bs4 import BeautifulSoup
	from urllib2 import urlopen
	from urlparse import urljoin
	import re

	for num in range(1, 150):
	url = "http://togif.me/catalog/" + str(num)
	res = urlopen(url)
	soup = BeautifulSoup(res.read())
	links = soup.select('td a')
	for link in links:
	page_url = urljoin(url, link.attrs['href'])
	page_res = urlopen(page_url)
	page_soup = BeautifulSoup(page_res.read())
	views = page_soup.select('div.image-date')[0].text
	views_int = int(re.findall(r'\d+', views)[0])
	img_src = urljoin(page_url, page_soup.select('img')[0].attrs['src'])
	print str(views_int) + "," + img_src