infominer33/extract_metadata.py

## extract_metadata.py
# https://github.com/lethain/extraction

import extraction
import requests
import csv

#### Open CSV + Write Column Names
fname = 'links.csv'
csvFile = open(fname, 'w+')
csvWriter = csv.writer(csvFile)
csvWriter.writerow(["Link", "UrlTitle", "UrlDesc", "UrlImg"])
row = []

# Using readlines()
file1 = open('links.md', 'r')
Lines = file1.readlines()

# Strips the newline character
for line in Lines:
    lin = line.strip()
    print(lin)
    html = requests.get(lin).text
    extracted = extraction.Extractor().extract(html, source_url=lin)
    row = [lin, extracted.title, extracted.description, extracted.image]
    print(row)
    #### Write row to CSV and print lin
    csvWriter.writerow(row)

csvFile.close()
print("Complete")
	# https://github.com/lethain/extraction

	import extraction
	import requests
	import csv

	#### Open CSV + Write Column Names
	fname = 'links.csv'
	csvFile = open(fname, 'w+')
	csvWriter = csv.writer(csvFile)
	csvWriter.writerow(["Link", "UrlTitle", "UrlDesc", "UrlImg"])
	row = []

	# Using readlines()
	file1 = open('links.md', 'r')
	Lines = file1.readlines()

	# Strips the newline character
	for line in Lines:
	lin = line.strip()
	print(lin)
	html = requests.get(lin).text
	extracted = extraction.Extractor().extract(html, source_url=lin)
	row = [lin, extracted.title, extracted.description, extracted.image]
	print(row)
	#### Write row to CSV and print lin
	csvWriter.writerow(row)

	csvFile.close()
	print("Complete")