wetlife/report_hrefs.py

## report_hrefs.py
from bs4 import BeautifulSoup
from requests import request
from pprint import pprint
import re

file_path = './index.html'
with open(file_path, encoding='utf8') as file_object:
    file_markup = file_object.read()
file_soup = bs(file_markup, 'lxml')

relative_hrefs = absolute_hrefs = ()
href_tags = file_soup.find_all(href=True)
for tag in href_tags:
    if re.search('://',tag['href']):
        absolute_hrefs += (tag['href'],)
    else:
        relative_hrefs += (tag['href'],)
print(f"absolute_hrefs: {absolute_hrefs}")
print(f"relative_hrefs: {relative_hrefs}")
print(f"{len(absolute_hrefs+relative_hrefs)} hrefs were found. {len(absolute_hrefs)} hrefs are absolute and {len(relative_hrefs)} hrefs are relative.")
	from bs4 import BeautifulSoup
	from requests import request
	from pprint import pprint
	import re

	file_path = './index.html'
	with open(file_path, encoding='utf8') as file_object:
	file_markup = file_object.read()
	file_soup = bs(file_markup, 'lxml')

	relative_hrefs = absolute_hrefs = ()
	href_tags = file_soup.find_all(href=True)
	for tag in href_tags:
	if re.search('://',tag['href']):
	absolute_hrefs += (tag['href'],)
	else:
	relative_hrefs += (tag['href'],)
	print(f"absolute_hrefs: {absolute_hrefs}")
	print(f"relative_hrefs: {relative_hrefs}")
	print(f"{len(absolute_hrefs+relative_hrefs)} hrefs were found. {len(absolute_hrefs)} hrefs are absolute and {len(relative_hrefs)} hrefs are relative.")