varundey/rssCrawler.py

## rssCrawler.py
url = "http://timesofindia.indiatimes.com/rss.cms"
from bs4 import BeautifulSoup as bs
import requests

soup = bs(requests.get(url).content, "lxml")
soup = soup.findAll("table",{"border":"0", "width":"740", "cellspacing":"0", "cellpadding":'0'})
print len(soup)
dic = {}
file = open("newsrss.txt","a")
for i in soup:
	x = i.findAll("tr")
	for j in x:
		q = j.findAll("td")[0]
		key = q.text
		val = q.find("a").get("href")
		dic[key]=val


file.write(str(dic))
file.close()
	url = "http://timesofindia.indiatimes.com/rss.cms"
	from bs4 import BeautifulSoup as bs
	import requests

	soup = bs(requests.get(url).content, "lxml")
	soup = soup.findAll("table",{"border":"0", "width":"740", "cellspacing":"0", "cellpadding":'0'})
	print len(soup)
	dic = {}
	file = open("newsrss.txt","a")
	for i in soup:
	x = i.findAll("tr")
	for j in x:
	q = j.findAll("td")[0]
	key = q.text
	val = q.find("a").get("href")
	dic[key]=val


	file.write(str(dic))
	file.close()