harishsg99/scraper.py

## scraper.py
from autoscraper import AutoScraper
import pandas as pd
import json
import csv
url = 'https://stopcorona.tn.gov.in/beds.php'
wanted_list = ["Ariyalur","District","COVID BEDS","Sai Fertility Centre & Hospital, Vedhachalam Nagar","9941550979","8"]

scraper = AutoScraper()
result = scraper.build(url, wanted_list)
t = scraper.get_result_similar(url, grouped=True)

json_object = json.dumps(t)
print(json_object)
with open("sample.json", "w") as outfile:
    outfile.write(json_object)

with open('sample.json') as json_file:
    data = json.load(json_file)

employee_data = data['emp_details']


data_file = open('data_file.csv', 'w')

csv_writer = csv.writer(data_file)


count = 0

for emp in employee_data:
    if count == 0:

        # Writing headers of CSV file
        header = emp.keys()
        csv_writer.writerow(header)
        count += 1

    # Writing data of CSV file
    csv_writer.writerow(emp.values())

data_file.close()

df = pd.read_csv("data_file.csv")
df.drop_duplicates(keep=False,inplace=True)
df.to_csv('scrapedcovid_data.csv', index = True)
	from autoscraper import AutoScraper
	import pandas as pd
	import json
	import csv
	url = 'https://stopcorona.tn.gov.in/beds.php'
	wanted_list = ["Ariyalur","District","COVID BEDS","Sai Fertility Centre & Hospital, Vedhachalam Nagar","9941550979","8"]

	scraper = AutoScraper()
	result = scraper.build(url, wanted_list)
	t = scraper.get_result_similar(url, grouped=True)

	json_object = json.dumps(t)
	print(json_object)
	with open("sample.json", "w") as outfile:
	outfile.write(json_object)

	with open('sample.json') as json_file:
	data = json.load(json_file)

	employee_data = data['emp_details']


	data_file = open('data_file.csv', 'w')

	csv_writer = csv.writer(data_file)


	count = 0

	for emp in employee_data:
	if count == 0:

	# Writing headers of CSV file
	header = emp.keys()
	csv_writer.writerow(header)
	count += 1

	# Writing data of CSV file
	csv_writer.writerow(emp.values())

	data_file.close()

	df = pd.read_csv("data_file.csv")
	df.drop_duplicates(keep=False,inplace=True)
	df.to_csv('scrapedcovid_data.csv', index = True)