cocomoff/hatena.py

## hatena.py
from bs4 import BeautifulSoup
import requests
import lxml
from collections import defaultdict, Counter

N = 100
l_title = []
for i in range(1, N):
    r = requests.get("http://URL/archive/?page={}".format(i))
    soup = BeautifulSoup(r.text, 'lxml')
    elems = soup.find_all(class_="entry-title-link")
    for e in elems:
        year = int(e.text.split(" ")[0].split("/")[0])
        if year == 2018:
            l_title.append(e.text)

list_title = []
for title in l_title:
    tdate, t = title.split(" ")
    list_title.append(t)

print(counter.most_common())
counter = Counter(list_title)
	from bs4 import BeautifulSoup
	import requests
	import lxml
	from collections import defaultdict, Counter

	N = 100
	l_title = []
	for i in range(1, N):
	r = requests.get("http://URL/archive/?page={}".format(i))
	soup = BeautifulSoup(r.text, 'lxml')
	elems = soup.find_all(class_="entry-title-link")
	for e in elems:
	year = int(e.text.split(" ")[0].split("/")[0])
	if year == 2018:
	l_title.append(e.text)

	list_title = []
	for title in l_title:
	tdate, t = title.split(" ")
	list_title.append(t)

	print(counter.most_common())
	counter = Counter(list_title)