rshipp/html5test.py

## html5test.py
#!/usr/bin/env python3
import html5lib

data = html5lib.parse(open("test.html", "r").read())

def start_tag(node):
    return '<' + node.tag.split('}')[1:][0] + \
            ''.join([' {}="{}"'.format(item[0], item[1])
                     for item in node.items()]) + '>'

def close_tag(node):
    return '</' + node.tag.split('}')[1:][0] + '>'

def indent(data, level=0, space=" ", times=2):
    for node in data:
        print(space*times*level + start_tag(node))
        if node.text and node.text.strip():
            print(space*times*level + node.text.strip())
        if node:
            indent(node, level+1)
        print(space*times*level + close_tag(node))

indent(data)
	#!/usr/bin/env python3
	import html5lib

	data = html5lib.parse(open("test.html", "r").read())

	def start_tag(node):
	return '<' + node.tag.split('}')[1:][0] + \
	''.join([' {}="{}"'.format(item[0], item[1])
	for item in node.items()]) + '>'

	def close_tag(node):
	return '</' + node.tag.split('}')[1:][0] + '>'

	def indent(data, level=0, space=" ", times=2):
	for node in data:
	print(spacetimeslevel + start_tag(node))
	if node.text and node.text.strip():
	print(spacetimeslevel + node.text.strip())
	if node:
	indent(node, level+1)
	print(spacetimeslevel + close_tag(node))

	indent(data)