prateekjoshi565/tokenizer_encode.py

## tokenizer_encode.py
# initialize tokenizer
tokenizer = BertWordPieceTokenizer("bert-base-uncased-vocab.txt")

# sample sentence
sentence = "Language is a thing of beauty. But mastering a new language from scratch is quite a daunting prospect."

# tokenize the sample sentence
encoded_output = tokenizer.encode(sentence)
	# initialize tokenizer
	tokenizer = BertWordPieceTokenizer("bert-base-uncased-vocab.txt")

	# sample sentence
	sentence = "Language is a thing of beauty. But mastering a new language from scratch is quite a daunting prospect."

	# tokenize the sample sentence
	encoded_output = tokenizer.encode(sentence)