mohdsanadzakirizvi/bert_tokenize.py

## bert_tokenize.py
import torch
from pytorch_transformers import BertTokenizer, BertModel, BertForMaskedLM

# Load pre-trained model tokenizer (vocabulary)
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

# Tokenize input
text = "[CLS] Who was Jim Henson ? [SEP] Jim Henson was a puppeteer [SEP]"
tokenized_text = tokenizer.tokenize(text)
	import torch
	from pytorch_transformers import BertTokenizer, BertModel, BertForMaskedLM

	# Load pre-trained model tokenizer (vocabulary)
	tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

	# Tokenize input
	text = "[CLS] Who was Jim Henson ? [SEP] Jim Henson was a puppeteer [SEP]"
	tokenized_text = tokenizer.tokenize(text)