HebeHH/reddit_news_topics.py

## reddit_news_topics.py
import praw
import re
import pandas as pd

# connect to reddit
reddit = praw.Reddit(client_id='my_id', client_secret='my_secret', user_agent='me')

# get new submissions from News
submissions = []
for submission in reddit.subreddit("News").new(limit = None):
    submissions.append([submission.title, submission.score])
submissions = pd.DataFrame(submissions, columns = ['titles', 'scores'])

# get most common proper nouns
stop_words = 'In|The|Man|New|What|My|This|Woman|Best|Why|How|You|Is|Part|To|After|First|No|Boy'
all_titles = re.sub(stop_words, "", " ". join(submissions.titles))
ProperNouns = re.findall(r'[A-Z][a-z]+', all_titles)
search_terms = pd.Series(ProperNouns).value_counts().nlargest(10).index.values

# return all submissions referencing one of the search terms with more than 200 upvotes
for term in search_terms:
	print "\n\n Titles about " + term + ":"
	print submissions[(submissions.titles.str.contains("(?i)"+term)) & (submissions['scores'] >= 100)]
	import praw
	import re
	import pandas as pd

	# connect to reddit
	reddit = praw.Reddit(client_id='my_id', client_secret='my_secret', user_agent='me')

	# get new submissions from News
	submissions = []
	for submission in reddit.subreddit("News").new(limit = None):
	submissions.append([submission.title, submission.score])
	submissions = pd.DataFrame(submissions, columns = ['titles', 'scores'])

	# get most common proper nouns
	stop_words = 'In\|The\|Man\|New\|What\|My\|This\|Woman\|Best\|Why\|How\|You\|Is\|Part\|To\|After\|First\|No\|Boy'
	all_titles = re.sub(stop_words, "", " ". join(submissions.titles))
	ProperNouns = re.findall(r'[A-Z][a-z]+', all_titles)
	search_terms = pd.Series(ProperNouns).value_counts().nlargest(10).index.values

	# return all submissions referencing one of the search terms with more than 200 upvotes
	for term in search_terms:
	print "\n\n Titles about " + term + ":"
	print submissions[(submissions.titles.str.contains("(?i)"+term)) & (submissions['scores'] >= 100)]