katyukha/xmlrpc_lxmlparser_monkey.py

## xmlrpc_lxmlparser_monkey.py
import xmlrpclib
try:
    from lxml.etree import XMLPullParser
except ImportError:
    LXMLParser = None
else:
    class LXMLParser:
        def __init__(self, target):
            self._parser = XMLPullParser(events=('start', 'end'),
                                         huge_tree=True)
            self._target = target

        def handle_events(self):
            for action, element in self._parser.read_events():
                if action == 'start':
                    self._target.start(element.tag, element.attrib)
                elif action == 'end':
                    if element.text:
                        self._target.data(element.text)
                    self._target.end(element.tag)
                    element.clear()

        def feed(self, data):
            try:
                self._parser.feed(data)
            except:
                print("FEED Error: %r" % data)
                raise
            self.handle_events()

        def close(self):
            self._parser.close()

    def getparser(use_datetime=0):
        """getparser() -> parser, unmarshaller

        Create an instance of the fastest available parser, and attach it
        to an unmarshalling object.  Return both objects.
        """
        target = xmlrpclib.Unmarshaller(use_datetime=use_datetime)
        parser = LXMLParser(target)
        return parser, target

    xmlrpclib.getparser = getparser
	import xmlrpclib
	try:
	from lxml.etree import XMLPullParser
	except ImportError:
	LXMLParser = None
	else:
	class LXMLParser:
	def __init__(self, target):
	self._parser = XMLPullParser(events=('start', 'end'),
	huge_tree=True)
	self._target = target

	def handle_events(self):
	for action, element in self._parser.read_events():
	if action == 'start':
	self._target.start(element.tag, element.attrib)
	elif action == 'end':
	if element.text:
	self._target.data(element.text)
	self._target.end(element.tag)
	element.clear()

	def feed(self, data):
	try:
	self._parser.feed(data)
	except:
	print("FEED Error: %r" % data)
	raise
	self.handle_events()

	def close(self):
	self._parser.close()

	def getparser(use_datetime=0):
	"""getparser() -> parser, unmarshaller

	Create an instance of the fastest available parser, and attach it
	to an unmarshalling object. Return both objects.
	"""
	target = xmlrpclib.Unmarshaller(use_datetime=use_datetime)
	parser = LXMLParser(target)
	return parser, target

	xmlrpclib.getparser = getparser