kabirahuja2431/tokenize.py

## tokenize.py
from transformers import BertTokenizer

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

#For single sequence input
sentence = 'I really enjoyed this movie a lot.'
tokens = tokenizer.tokenize(sentence)
print(tokens)
# Out: ['i', 'really', 'enjoyed', 'this', 'movie', 'a', 'lot', '.']
	from transformers import BertTokenizer

	tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

	#For single sequence input
	sentence = 'I really enjoyed this movie a lot.'
	tokens = tokenizer.tokenize(sentence)
	print(tokens)
	# Out: ['i', 'really', 'enjoyed', 'this', 'movie', 'a', 'lot', '.']