davidpgero/gist:941132

## gistfile1.py
from nltk import clean_html
from urllib2 import urlopen

html = urlopen('http://mek.niif.hu/00700/00707/html/vs192601.htm').read()
tisztitott_html = clean_html(html)

print tisztitott_html[:50]
	from nltk import clean_html
	from urllib2 import urlopen

	html = urlopen('http://mek.niif.hu/00700/00707/html/vs192601.htm').read()
	tisztitott_html = clean_html(html)

	print tisztitott_html[:50]