kotoripiyopiyo/downloadxkcd.py

## downloadxkcd.py
#!/usr/bin/env python3
# downloadxkcd.py XKCDコミックをひとつずつダウンロードする

import requests, os, bs4

url = 'http://xkcd.com'
os.makedirs('xkcd', exist_ok=True)

while not url.endswith('#'):
    # ページをダウンロードする
    print(f'ページ「{url}」をダウンロード中…')
    res = requests.get(url)
    res.raise_for_status() # 失敗したら例外を起こす

    soup = bs4.BeautifulSoup(res.text) #BeautifulSoupオブジェクトを生成

    # コミック画像のURLを見つける
    comic_elem = soup.select('#comic img')
    if comic_elem == []:
        print('コミック画像が見つかりませんでした。')
    else:
        comic_url = 'http:' + comic_elem[0].get('src')
        # 画像をダウンロードする
        print(f'画像をダウンロード中… {comic_url}')
        try:
            res = requests.get(comic_url)
            res.raise_for_status()
        except requests.exceptions.InvalidURL as err:
            print(f'{err}：ダウンロードできませんでした→ {comic_url}')

    # 画像を./xkcdに保存する
    image_file = open(os.path.join('xkcd', os.path.basename(comic_url)), 'wb')
    for chunk in res.iter_content(100000):
        image_file.write(chunk)
    image_file.close()

    # PrevボタンのURLを取得する
    prev_link = soup.select('a[rel="prev"]')[0]
    url = 'http://xkcd.com' + prev_link.get('href')

print('完了')
	#!/usr/bin/env python3
	# downloadxkcd.py XKCDコミックをひとつずつダウンロードする

	import requests, os, bs4

	url = 'http://xkcd.com'
	os.makedirs('xkcd', exist_ok=True)

	while not url.endswith('#'):
	# ページをダウンロードする
	print(f'ページ「{url}」をダウンロード中…')
	res = requests.get(url)
	res.raise_for_status() # 失敗したら例外を起こす

	soup = bs4.BeautifulSoup(res.text) #BeautifulSoupオブジェクトを生成

	# コミック画像のURLを見つける
	comic_elem = soup.select('#comic img')
	if comic_elem == []:
	print('コミック画像が見つかりませんでした。')
	else:
	comic_url = 'http:' + comic_elem[0].get('src')
	# 画像をダウンロードする
	print(f'画像をダウンロード中… {comic_url}')
	try:
	res = requests.get(comic_url)
	res.raise_for_status()
	except requests.exceptions.InvalidURL as err:
	print(f'{err}：ダウンロードできませんでした→ {comic_url}')

	# 画像を./xkcdに保存する
	image_file = open(os.path.join('xkcd', os.path.basename(comic_url)), 'wb')
	for chunk in res.iter_content(100000):
	image_file.write(chunk)
	image_file.close()

	# PrevボタンのURLを取得する
	prev_link = soup.select('a[rel="prev"]')[0]
	url = 'http://xkcd.com' + prev_link.get('href')

	print('完了')