nirmalyaghosh/scrape_news_summaries.py

## scrape_news_summaries.py
from bs4 import BeautifulSoup
import requests
import time
from random import randint

def scrape_news_summaries(s):
    # It is based on a notebook posted on Kaggle, http://bit.ly/1VJ8pF9
    time.sleep(  randint(0,2) ) #relax and don't let google be angry
    r = requests.get("http://www.google.co.uk/search?q="+s+"&tbm=nws")
    content = r.text
    news_summaries = []
    soup = BeautifulSoup(content)
    st_divs = soup.findAll("div", {"class": "st"})
    for st_div in st_divs:
        news_summaries.append(st_div.text)
    return news_summaries

# l = scrape_news_summaries("T-Notes")
l = scrape_news_summaries(""""Sovereign-Debt"+Government-Bonds""")
for n in l:
    print n, "\n"
	from bs4 import BeautifulSoup
	import requests
	import time
	from random import randint

	def scrape_news_summaries(s):
	# It is based on a notebook posted on Kaggle, http://bit.ly/1VJ8pF9
	time.sleep( randint(0,2) ) #relax and don't let google be angry
	r = requests.get("http://www.google.co.uk/search?q="+s+"&tbm=nws")
	content = r.text
	news_summaries = []
	soup = BeautifulSoup(content)
	st_divs = soup.findAll("div", {"class": "st"})
	for st_div in st_divs:
	news_summaries.append(st_div.text)
	return news_summaries

	# l = scrape_news_summaries("T-Notes")
	l = scrape_news_summaries(""""Sovereign-Debt"+Government-Bonds""")
	for n in l:
	print n, "\n"