R97416032/抓取糗事百科.py

## 抓取糗事百科.py
import requests_html
import time
from requests_html import HTMLSession
session=HTMLSession()
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
    }

file1=open("C:\\Users\\R\\Desktop\\笑话.txt","w",encoding='utf-8')
def get_c(url):
    r = session.get(url)
    a=r.html.find('div.content > span')
    for i in range(len(a)):
        file1.write(a[i].text)
        file1.write('\n')
        file1.write('\n')
urls = ['https://www.qiushibaike.com/text/page/{}/'.format(str(i)) for i in range(2)]
for url in urls:
    get_c(url)
    for i in range(5):
        time.sleep(i)
file1.close()
	import requests_html
	import time
	from requests_html import HTMLSession
	session=HTMLSession()
	headers = {
	'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
	}

	file1=open("C:\\Users\\R\\Desktop\\笑话.txt","w",encoding='utf-8')
	def get_c(url):
	r = session.get(url)
	a=r.html.find('div.content > span')
	for i in range(len(a)):
	file1.write(a[i].text)
	file1.write('\n')
	file1.write('\n')
	urls = ['https://www.qiushibaike.com/text/page/{}/'.format(str(i)) for i in range(2)]
	for url in urls:
	get_c(url)
	for i in range(5):
	time.sleep(i)
	file1.close()