yobibyte/proceedings.py

## proceedings.py
import csv
import urllib
from bs4 import BeautifulSoup

url_to_parse = 'https://papers.nips.cc/book/advances-in-neural-information-processing-systems-31-2018'
page = urllib.request.urlopen(url_to_parse)
soup = BeautifulSoup(page, 'html.parser')

with open('proceedings.csv', 'w') as csvfile:
    wr = csv.writer(csvfile, delimiter=',')
    for p in soup.find('div', attrs={'class':'main-container'}).find('ul').find_all('li'):
        c = p.find_all('a')

        try:
            text = c[0].text
        except:
            text = ''
        try:
            link = 'https://papers.nips.cc' + c[0].attrs['href']
        except:
            link = ''
        try:
            author = c[1].text
        except:
            author = ''

        wr.writerow([text, author, link])
	import csv
	import urllib
	from bs4 import BeautifulSoup

	url_to_parse = 'https://papers.nips.cc/book/advances-in-neural-information-processing-systems-31-2018'
	page = urllib.request.urlopen(url_to_parse)
	soup = BeautifulSoup(page, 'html.parser')

	with open('proceedings.csv', 'w') as csvfile:
	wr = csv.writer(csvfile, delimiter=',')
	for p in soup.find('div', attrs={'class':'main-container'}).find('ul').find_all('li'):
	c = p.find_all('a')

	try:
	text = c[0].text
	except:
	text = ''
	try:
	link = 'https://papers.nips.cc' + c[0].attrs['href']
	except:
	link = ''
	try:
	author = c[1].text
	except:
	author = ''

	wr.writerow([text, author, link])