Andiology/Instagram post urls.py

## Instagram post urls.py
from selenium import webdriver
from bs4 import BeautifulSoup as Soup
import time

# browser = webdriver.Chrome()
url = 'https://www.instagram.com/bbcnews/'
browser.get(url) # 前往該網址

# 往下滑並取得新的貼文連結
n_scroll = 5
post_url = []
for i in range(n_scroll):
    scroll = 'window.scrollTo(0, document.body.scrollHeight);'
    browser.execute_script(scroll)
    html = browser.page_source
    soup = Soup(html, 'lxml')

    # 尋找所有的貼文連結
    for elem in soup.select('article div div div div a'):
        # 如果新獲得的貼文連結不在列表裡，則加入
        if elem['href'] not in post_url:
            post_url.append(elem['href'])
    time.sleep(2) # 等待網頁加載

# 總共加載的貼文連結數
print("總共取得 " + str(len(post_url)) + " 篇貼文連結")
	from selenium import webdriver
	from bs4 import BeautifulSoup as Soup
	import time

	# browser = webdriver.Chrome()
	url = 'https://www.instagram.com/bbcnews/'
	browser.get(url) # 前往該網址

	# 往下滑並取得新的貼文連結
	n_scroll = 5
	post_url = []
	for i in range(n_scroll):
	scroll = 'window.scrollTo(0, document.body.scrollHeight);'
	browser.execute_script(scroll)
	html = browser.page_source
	soup = Soup(html, 'lxml')

	# 尋找所有的貼文連結
	for elem in soup.select('article div div div div a'):
	# 如果新獲得的貼文連結不在列表裡，則加入
	if elem['href'] not in post_url:
	post_url.append(elem['href'])
	time.sleep(2) # 等待網頁加載

	# 總共加載的貼文連結數
	print("總共取得 " + str(len(post_url)) + " 篇貼文連結")