chiaoyaaaaa chiaoyaaaaa

## fb_number_of_likes_comments_shares.py
from selenium import webdriver
from bs4 import BeautifulSoup as Soup

#driver = webdriver.Chrome()
# 設定要前往的網址
url = 'https://www.facebook.com/bbcnews'
# 前往該網址
driver.get(url)


## share_data_clean.py
# 把'則留言'和','去掉
for i in range(len(share)):
    index = share[i].find('次')
    share[i] = int(share[i][:index].replace(',',''))

## catch_every_share.py
# 建立一個空的list
share = []

# 抓取每一篇貼文的分享數
# find_all() 後面要加上 [1] 才能取出分享數
# class name可能會修改，需要定期偵錯!
for ii in frames:
    read = ii.find_all('span',class_="oi732d6d ik7dh3pa d2edcug0 hpfvmrgz qv66sw1b c1et5uql a8c37x1j muag1w35 enqfppq2 jq4qci2q a3bd9o3v knj5qynh m9osqain")[1]

    # 有些貼文沒有分享數，所以抓下來的東西是None，因此直接append 0

## catch_one_share.py
from bs4 import BeautifulSoup

# 前面解釋過的，抓取所有貼文
soup = Soup(driver.page_source, "lxml")
frames = soup.find_all(class_='du4w35lb k4urcfbm l9j0dhe7 sjgh65i0')

# 抓取第一篇的留言數
# find_all()裡面要先放'span'標籤再放class name
# frames[0]為第一篇貼文
# .text為抓取文字內容

## comment_data_clean.py
# 把'則留言'和','去掉
for i in range(len(comment_nums)):
    index = comment_nums[i].find('則')
    comment_nums[i] = int(comment_nums[i][:index].replace(',',''))

## catch_every_comment.py
# 建立一個空的list
comment_nums = []

# 抓取每一篇貼文的留言數
# class name可能會修改，需要定期偵錯!
for ii in frames:
    read = ii.find('span',class_="oi732d6d ik7dh3pa d2edcug0 hpfvmrgz qv66sw1b c1et5uql a8c37x1j muag1w35 enqfppq2 jq4qci2q a3bd9o3v knj5qynh m9osqain")

    # 有些貼文沒有留言數，所以抓下來的東西是None，因此直接append 0
    if(read == None):

## catch_one_comment.py
from bs4 import BeautifulSoup

# 前面解釋過的，抓取所有貼文
soup = Soup(driver.page_source, "lxml")
frames = soup.find_all(class_='du4w35lb k4urcfbm l9j0dhe7 sjgh65i0')

# 抓取第一篇的留言數
# find()裡面要先放'span'標籤再放class name
# frames[0]為第一篇貼文
# .text為抓取文字內容

## like_data_clean.py
for i in range(len(like)):
    # 處理出現 '\xa0萬' 的數值
    if(like[i].find('\xa0萬') != -1):
        like[i] = int(float(like[i][:like[i].find('\xa0萬')])*10000)

    # 處理有出現 ',' 的數值
    else:
        like[i] = int(like[i].replace(',',''))

## catch_every_like.py
# 建立一個空的list
like = []

# 抓取每一篇貼文的按讚數
# class name可能會修改，需要定期偵錯!
for ii in frames:
    thumb = ii.find('span',class_="gpro0wi8 pcp91wgn")

    # 有些貼文沒有按讚數，所以抓下來的東西是None，因此直接append 0
    if(thumb == None):

## catch_one_like.py
from bs4 import BeautifulSoup

# 前面解釋過的，抓取所有貼文
soup = Soup(driver.page_source, "lxml")
frames = soup.find_all(class_='du4w35lb k4urcfbm l9j0dhe7 sjgh65i0')

# 抓取第一篇的按讚數
# find()裡面要先放'span'標籤再放class name
# frames[0]為第一篇貼文
# .text為抓取文字內容
	from selenium import webdriver
	from bs4 import BeautifulSoup as Soup

	#driver = webdriver.Chrome()
	# 設定要前往的網址
	url = 'https://www.facebook.com/bbcnews'
	# 前往該網址
	driver.get(url)
	# 把'則留言'和','去掉
	for i in range(len(share)):
	index = share[i].find('次')
	share[i] = int(share[i][:index].replace(',',''))
	# 建立一個空的list
	share = []

	# 抓取每一篇貼文的分享數
	# find_all() 後面要加上 [1] 才能取出分享數
	# class name可能會修改，需要定期偵錯!
	for ii in frames:
	read = ii.find_all('span',class_="oi732d6d ik7dh3pa d2edcug0 hpfvmrgz qv66sw1b c1et5uql a8c37x1j muag1w35 enqfppq2 jq4qci2q a3bd9o3v knj5qynh m9osqain")[1]

	# 有些貼文沒有分享數，所以抓下來的東西是None，因此直接append 0
	from bs4 import BeautifulSoup

	# 前面解釋過的，抓取所有貼文
	soup = Soup(driver.page_source, "lxml")
	frames = soup.find_all(class_='du4w35lb k4urcfbm l9j0dhe7 sjgh65i0')

	# 抓取第一篇的留言數
	# find_all()裡面要先放'span'標籤再放class name
	# frames[0]為第一篇貼文
	# .text為抓取文字內容
	# 把'則留言'和','去掉
	for i in range(len(comment_nums)):
	index = comment_nums[i].find('則')
	comment_nums[i] = int(comment_nums[i][:index].replace(',',''))
	# 建立一個空的list
	comment_nums = []

	# 抓取每一篇貼文的留言數
	# class name可能會修改，需要定期偵錯!
	for ii in frames:
	read = ii.find('span',class_="oi732d6d ik7dh3pa d2edcug0 hpfvmrgz qv66sw1b c1et5uql a8c37x1j muag1w35 enqfppq2 jq4qci2q a3bd9o3v knj5qynh m9osqain")

	# 有些貼文沒有留言數，所以抓下來的東西是None，因此直接append 0
	if(read == None):
	for i in range(len(like)):
	# 處理出現 '\xa0萬' 的數值
	if(like[i].find('\xa0萬') != -1):
	like[i] = int(float(like[i][:like[i].find('\xa0萬')])*10000)

	# 處理有出現 ',' 的數值
	else:
	like[i] = int(like[i].replace(',',''))
	# 建立一個空的list
	like = []

	# 抓取每一篇貼文的按讚數
	# class name可能會修改，需要定期偵錯!
	for ii in frames:
	thumb = ii.find('span',class_="gpro0wi8 pcp91wgn")

	# 有些貼文沒有按讚數，所以抓下來的東西是None，因此直接append 0
	if(thumb == None):