nicoledan/imdb.py

## imdb.py
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re

html = urlopen("http://www.imdb.com/chart/top")
bsObj = BeautifulSoup(html, "html.parser")

t = open("imdb250.txt", 'w')
for link in bsObj.find("div", {"id":"pagecontent"}).findAll( "a", href=re.compile("^(/title/)(.)*$") ):
    if 'href' in link.attrs:
        t.write(str(link.attrs['href']) + "\n")

t.close()
	from urllib.request import urlopen
	from bs4 import BeautifulSoup
	import re

	html = urlopen("http://www.imdb.com/chart/top")
	bsObj = BeautifulSoup(html, "html.parser")

	t = open("imdb250.txt", 'w')
	for link in bsObj.find("div", {"id":"pagecontent"}).findAll( "a", href=re.compile("^(/title/)(.)*$") ):
	if 'href' in link.attrs:
	t.write(str(link.attrs['href']) + "\n")

	t.close()