PiDelport/templatelexer.py

## templatelexer.py
from collections import namedtuple


TOK_TEXT        = 'TOK_TEXT'
TOK_LEFT_META   = 'TOK_LEFT_META'
TOK_RIGHT_META  = 'TOK_RIGHT_META'
TOK_DUMMY       = 'TOK_DUMMY'


# A token has
#   type: one of the TOK_* constants
#   value: string value, as taken from input
#
Token = namedtuple('Token', 'type value')


class LexerError(Exception): pass


class TemplateLexer(object):
    """ A lexer for the template language. Initialize with the input
        string, and then call lex() which generates tokens. None is
        generated at EOF (and the generator expires).
    """
    def __init__(self, input):
        self.items = []
        self.input = input
        self.pos = 0
        self.curstart = 0

        self.state = self._lex_text

    def nextItem(self):
        while self.state:
            if self.items:
                return self.items.pop(0)
            else:
                self.state = self.state()

    #--------- Internal ---------#

    _LEFT_META = '{{'
    _RIGHT_META = '}}'

    def _eof(self):
        return self.pos >= len(self.input)

    def _emit(self, toktype):
        tok = Token(toktype, self.input[self.curstart:self.pos])
        self.curstart = self.pos
        self.items.append(tok)

    def _lex_text(self):
        while not self._eof():
            if self.input.startswith(self._LEFT_META, self.pos):
                # {{ here. Emit the text we've seen so far.
                if self.pos > self.curstart:
                    self._emit(TOK_TEXT)
                return self._lex_left_meta
            self.pos += 1 # ZZZ: can't just find to next {{ here?
        # Reached EOF. Emit trailing text.
        if self.pos > self.curstart:
            self._emit(TOK_TEXT)

    def _lex_left_meta(self):
        self.pos += len(self._LEFT_META)
        self._emit(TOK_LEFT_META)
        return self._lex_inside_action

    def _lex_right_meta(self):
        self.pos += len(self._RIGHT_META)
        self._emit(TOK_RIGHT_META)
        return self._lex_text

    def _lex_inside_action(self):
        while not self._eof():
            if self.input.startswith(self._RIGHT_META, self.pos):
                self._emit(TOK_DUMMY)
                return self._lex_right_meta
            self.pos += 1
        # Reached EOF
        raise LexerError('Unterminated action')
        return None


if __name__ == '__main__':
    text = r'''
    Some text here {{range $s.Text}} and here {{1.2 "%g"}} too {{.}}
    '''

    text = r'''
    Some text here {{action}} and here {{action2}}'''
    tlex = TemplateLexer(text)

    for t in iter(tlex.nextItem, None):
        print(t)
	from collections import namedtuple


	TOK_TEXT = 'TOK_TEXT'
	TOK_LEFT_META = 'TOK_LEFT_META'
	TOK_RIGHT_META = 'TOK_RIGHT_META'
	TOK_DUMMY = 'TOK_DUMMY'


	# A token has
	# type: one of the TOK_* constants
	# value: string value, as taken from input
	#
	Token = namedtuple('Token', 'type value')


	class LexerError(Exception): pass


	class TemplateLexer(object):
	""" A lexer for the template language. Initialize with the input
	string, and then call lex() which generates tokens. None is
	generated at EOF (and the generator expires).
	"""
	def __init__(self, input):
	self.items = []
	self.input = input
	self.pos = 0
	self.curstart = 0

	self.state = self._lex_text

	def nextItem(self):
	while self.state:
	if self.items:
	return self.items.pop(0)
	else:
	self.state = self.state()

	#--------- Internal ---------#

	_LEFT_META = '{{'
	_RIGHT_META = '}}'

	def _eof(self):
	return self.pos >= len(self.input)

	def _emit(self, toktype):
	tok = Token(toktype, self.input[self.curstart:self.pos])
	self.curstart = self.pos
	self.items.append(tok)

	def _lex_text(self):
	while not self._eof():
	if self.input.startswith(self._LEFT_META, self.pos):
	# {{ here. Emit the text we've seen so far.
	if self.pos > self.curstart:
	self._emit(TOK_TEXT)
	return self._lex_left_meta
	self.pos += 1 # ZZZ: can't just find to next {{ here?
	# Reached EOF. Emit trailing text.
	if self.pos > self.curstart:
	self._emit(TOK_TEXT)

	def _lex_left_meta(self):
	self.pos += len(self._LEFT_META)
	self._emit(TOK_LEFT_META)
	return self._lex_inside_action

	def _lex_right_meta(self):
	self.pos += len(self._RIGHT_META)
	self._emit(TOK_RIGHT_META)
	return self._lex_text

	def _lex_inside_action(self):
	while not self._eof():
	if self.input.startswith(self._RIGHT_META, self.pos):
	self._emit(TOK_DUMMY)
	return self._lex_right_meta
	self.pos += 1
	# Reached EOF
	raise LexerError('Unterminated action')
	return None


	if __name__ == '__main__':
	text = r'''
	Some text here {{range $s.Text}} and here {{1.2 "%g"}} too {{.}}
	'''

	text = r'''
	Some text here {{action}} and here {{action2}}'''
	tlex = TemplateLexer(text)

	for t in iter(tlex.nextItem, None):
	print(t)