oneyoung/dom_parser.py

## dom_parser.py
from xml.dom.minidom import parse, parseString

dom1 = parse('c:\\temp\\mydata.xml') # parse an XML file by name

datasource = open('c:\\temp\\mydata.xml')
dom2 = parse(datasource)   # parse an open file

dom3 = parseString('<myxml>Some data<empty/> some more data</myxml>')


#####################################################################
import xml.dom.minidom

document = """\
<slideshow>
<title>Demo slideshow</title>
<slide><title>Slide title</title>
<point>This is a demo</point>
<point>Of a program for processing slides</point>
</slide>

<slide><title>Another demo slide</title>
<point>It is important</point>
<point>To have more than</point>
<point>one slide</point>
</slide>
</slideshow>
"""

dom = xml.dom.minidom.parseString(document)

def getText(nodelist):
    rc = []
    for node in nodelist:
        if node.nodeType == node.TEXT_NODE:
            rc.append(node.data)
    return ''.join(rc)

def handleSlideshow(slideshow):
    print "<html>"
    handleSlideshowTitle(slideshow.getElementsByTagName("title")[0])
    slides = slideshow.getElementsByTagName("slide")
    handleToc(slides)
    handleSlides(slides)
    print "</html>"
	from xml.dom.minidom import parse, parseString

	dom1 = parse('c:\\temp\\mydata.xml') # parse an XML file by name

	datasource = open('c:\\temp\\mydata.xml')
	dom2 = parse(datasource) # parse an open file

	dom3 = parseString('<myxml>Some data<empty/> some more data</myxml>')


	#####################################################################
	import xml.dom.minidom

	document = """\
	<slideshow>
	<title>Demo slideshow</title>
	<slide><title>Slide title</title>
	<point>This is a demo</point>
	<point>Of a program for processing slides</point>
	</slide>

	<slide><title>Another demo slide</title>
	<point>It is important</point>
	<point>To have more than</point>
	<point>one slide</point>
	</slide>
	</slideshow>
	"""

	dom = xml.dom.minidom.parseString(document)

	def getText(nodelist):
	rc = []
	for node in nodelist:
	if node.nodeType == node.TEXT_NODE:
	rc.append(node.data)
	return ''.join(rc)

	def handleSlideshow(slideshow):
	print "<html>"
	handleSlideshowTitle(slideshow.getElementsByTagName("title")[0])
	slides = slideshow.getElementsByTagName("slide")
	handleToc(slides)
	handleSlides(slides)
	print "</html>"