Skip to content

Instantly share code, notes, and snippets.

@allieus
Last active September 23, 2015 01:49
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save allieus/4f22b4f6555d895604e9 to your computer and use it in GitHub Desktop.
Save allieus/4f22b4f6555d895604e9 to your computer and use it in GitHub Desktop.
# -*- coding: utf8 -*-
from __future__ import unicode_literals
try:
from urllib.request import urlopen
except ImportError:
from urllib import urlopen
import re
from bs4 import BeautifulSoup
html = urlopen('http://www.booksaetong.co.kr/shop/list.php?ca_id=60&gdate=2015-04-10').read()
soup = BeautifulSoup(html, 'html.parser')
for table_tag in soup.select('td[width=25%] table'):
try:
orig_amount = table_tag.find('strike').text or None
except AttributeError:
# strike 태그가 없을 때
orig_amount = None
else:
orig_amount = ''.join(re.findall(r'\d+', orig_amount))
is_pumjul = bool(table_tag.select('img[src*=pumjul]'))
properties = {'orig_amount': orig_amount, 'is_pumjul': is_pumjul}
for tag in table_tag.select('input'):
if tag.has_attr('value'):
name = re.sub(r'(^it_|\[\d+\]$)', '', tag['name'])
value = tag['value']
properties[name] = value
print('[{id}] {name} {orig_amount} {amount} {point}, {is_pumjul}'.format(**properties))
[1430893869] 아이들 (이자혜 단편만화) 8800 7920 440, True
[1430270134] 미지의 세계 01 20000 18000 1000, False
[1428640259] 니세코이 비하인드 스토리 01 6800 6120 340, False
[1428562083] 바라카몬 10 4500 4050 220, False
[1428562041] 쿠로코의 농구 29 4500 4050 220, False
[1428562003] 청의 엑소시스트 14 4500 4050 220, False
[1428561974] 금빛 모자이크 03 5000 4500 250, False
[1428561946] 흐린 하늘에 웃다 06 (완) 4500 4050 220, False
[1428561919] 나가토 유키 짱의 소실 07 4500 4050 220, False
[1428561893] 전자상가의 서점 아가씨 08 4800 4320 240, False
[1428561850] 스즈미야 하루히의 경연 (스즈미야 하루히 앤솔로지) 4500 4050 220, False
[1428561816] 사랑한다고 말해 13 4200 3780 210, False
[1428561781] 그녀의 플래그가 꺾이면(코믹) 02 4800 4320 240, False
[1428561756] 노보 씨와 그녀? 03 7000 6300 350, False
[1428561731] 하늘에서! MY NANNY 04 4500 4050 220, False
[1428561680] J노벨- 소드 아트 온라인 15 7000 6300 350, False
[1428561636] J노벨- 리어왕! 01 6800 6120 340, False
[1428561604] 인류는 쇠퇴했습니다 07 6800 6120 340, False
[1428561576] J노벨- 성각의 용기사 16 6800 6120 340, False
[1428561540] 공허의 상자와 제로의 마리아 05 6800 6120 340, False
[1428561497] J노벨- 마법전쟁 07 6800 6120 340, False
[1428561454] J노벨- 특이영역의 특이점 02 8000 7200 400, False
[1428561350] GALGOD!!!!! 04 (갸르고!!!!! - 지옥천국직통대전) 6800 6120 340, False
[1428561289] J노벨- RIGHT X LIGHT 08 6800 6120 340, False
[1428561278] 어떤 마술의 금서목록 SP 7000 6300 350, False
[1428561277] NT노벨- 널 오타쿠로 만들어줄 테니까, 날 리얼충으로 만들어줘! 10 7000 6300 350, False
[1428561276] NT노벨- 도쿄 레이븐스 11 7000 6300 350, False
[1428561275] NT노벨- 풀 메탈 패닉! 어나더 08 7000 6300 350, False
[1428561274] NT노벨- RAIL WARS! -일본국유철도 공안대- 05 7000 6300 350, False
[1428561273] NT노벨- 스즈밍은 육식계 화룡 02 7000 6300 350, False
[1428561272] NT노벨- 관희 챠이카 10 7000 6300 350, False
[1428561271] NT노벨- 라이벌 온리원 03 7000 6300 350, False
[1428561270] 광란 가족 일기 15 (완) 7000 6300 350, False
[1428557708] 할리퀸 080 - 기적을 배달해 드립니다 (단) 4500 4050 220, True
[1428557608] 할리퀸 079 - 숙녀로 가는 계단〈결혼을 싫어하는 삼형제Ⅲ〉 4500 4050 220, True
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment