relaiyavalli/scrapNewsTitles.py

## scrapNewsTitles.py
import urllib2
import re
import cookielib
from cookielib import CookieJar

# If the web site expects cookies
cookie = CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

# Get Scrapper pose as Browser
opener.addHeaders = [('User-agent', 'Mozilla/5.0')]
page = 'http://feeds.reuters.com/reuters/technologyNews'

def main():
    try:
        # Open the page and retrieve contents
        pageData = opener.open(page).read()

        #Filter for news headlines
        titles = re.findall(r'<title>(.*?)</title>', pageData)

        for title in titles:
            print title

    except Exception, e:
            print str(e)

main()
	import urllib2
	import re
	import cookielib
	from cookielib import CookieJar

	# If the web site expects cookies
	cookie = CookieJar()
	opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

	# Get Scrapper pose as Browser
	opener.addHeaders = [('User-agent', 'Mozilla/5.0')]
	page = 'http://feeds.reuters.com/reuters/technologyNews'

	def main():
	try:
	# Open the page and retrieve contents
	pageData = opener.open(page).read()

	#Filter for news headlines
	titles = re.findall(r'<title>(.*?)</title>', pageData)

	for title in titles:
	print title

	except Exception, e:
	print str(e)

	main()