jiahao/listpdfs.py

## listpdfs.py
from bs4 import BeautifulSoup
import urllib.request

url = "https://arxiv.org/a/chen_j_2.html"

with urllib.request.urlopen(url) as response:
   html = response.read()

soup = BeautifulSoup(html, 'html.parser')
for link in soup.find_all('a'):
    link_url = link.get('href')
    if r"/pdf/" in link_url:
        print("https://arxiv.org"+link_url)
	from bs4 import BeautifulSoup
	import urllib.request

	url = "https://arxiv.org/a/chen_j_2.html"

	with urllib.request.urlopen(url) as response:
	html = response.read()

	soup = BeautifulSoup(html, 'html.parser')
	for link in soup.find_all('a'):
	link_url = link.get('href')
	if r"/pdf/" in link_url:
	print("https://arxiv.org"+link_url)