chucknado/write_posts.py

## write_posts.py
import dateutil.parser

import pandas as pd

topic = pd.read_pickle('my_serialized_data')
posts_df = pd.DataFrame(topic['posts'], columns=['id', 'title', 'created_at', 'author_id'])
users_df = pd.DataFrame(topic['users'], columns=['id', 'name']).drop_duplicates(subset=['id'])

posts_df['created_at'] = posts_df['created_at'].apply(lambda x: dateutil.parser.parse(x).date())

merged_df = pd.merge(posts_df, users_df, how='left', left_on='author_id', right_on='id')
merged_df.rename(columns={'id_x': 'post_id'}, inplace=True)
merged_df.drop(['id_y', 'author_id'], axis=1, inplace=True)

merged_df.to_excel('topic_posts.xlsx', index=False)
print('Spreadsheet saved.')
	import dateutil.parser

	import pandas as pd

	topic = pd.read_pickle('my_serialized_data')
	posts_df = pd.DataFrame(topic['posts'], columns=['id', 'title', 'created_at', 'author_id'])
	users_df = pd.DataFrame(topic['users'], columns=['id', 'name']).drop_duplicates(subset=['id'])

	posts_df['created_at'] = posts_df['created_at'].apply(lambda x: dateutil.parser.parse(x).date())

	merged_df = pd.merge(posts_df, users_df, how='left', left_on='author_id', right_on='id')
	merged_df.rename(columns={'id_x': 'post_id'}, inplace=True)
	merged_df.drop(['id_y', 'author_id'], axis=1, inplace=True)

	merged_df.to_excel('topic_posts.xlsx', index=False)
	print('Spreadsheet saved.')