rajy4683/convs2s_train.py Secret

## convs2s_train.py
"""
Training loop
"""
def train(model, iterator, optimizer, criterion, clip):
    model.train()
    epoch_loss = 0
    for i, batch in enumerate(iterator):
        src = batch.src
        trg = batch.trg
        optimizer.zero_grad()
        output, _ = model(src, trg[:,:-1])
        #output = [batch size, trg len - 1, output dim]
        #trg = [batch size, trg len]
        output_dim = output.shape[-1]
        output = output.contiguous().view(-1, output_dim)
        trg = trg[:,1:].contiguous().view(-1)
        #output = [batch size * trg len - 1, output dim]
        #trg = [batch size * trg len - 1]
        loss = criterion(output, trg)
        loss.backward()
        torch.nn.utils.clip_grad_norm_(model.parameters(), clip)
        optimizer.step()
        epoch_loss += loss.item()

    return epoch_loss / len(iterator)

"""
Evaluation loop
"""
def evaluate(model, iterator, criterion):

    model.eval()
    epoch_loss = 0
    with torch.no_grad():
        for i, batch in enumerate(iterator):
            src = batch.src
            trg = batch.trg
            output, _ = model(src, trg[:,:-1])
            #output = [batch size, trg len - 1, output dim]
            #trg = [batch size, trg len]
            output_dim = output.shape[-1]
            output = output.contiguous().view(-1, output_dim)
            trg = trg[:,1:].contiguous().view(-1)
            #output = [batch size * trg len - 1, output dim]
            #trg = [batch size * trg len - 1]
            loss = criterion(output, trg)
            epoch_loss += loss.item()
    return epoch_loss / len(iterator)
	"""
	Training loop
	"""
	def train(model, iterator, optimizer, criterion, clip):
	model.train()
	epoch_loss = 0
	for i, batch in enumerate(iterator):
	src = batch.src
	trg = batch.trg
	optimizer.zero_grad()
	output, _ = model(src, trg[:,:-1])
	#output = [batch size, trg len - 1, output dim]
	#trg = [batch size, trg len]
	output_dim = output.shape[-1]
	output = output.contiguous().view(-1, output_dim)
	trg = trg[:,1:].contiguous().view(-1)
	#output = [batch size * trg len - 1, output dim]
	#trg = [batch size * trg len - 1]
	loss = criterion(output, trg)
	loss.backward()
	torch.nn.utils.clip_grad_norm_(model.parameters(), clip)
	optimizer.step()
	epoch_loss += loss.item()

	return epoch_loss / len(iterator)

	"""
	Evaluation loop
	"""
	def evaluate(model, iterator, criterion):

	model.eval()
	epoch_loss = 0
	with torch.no_grad():
	for i, batch in enumerate(iterator):
	src = batch.src
	trg = batch.trg
	output, _ = model(src, trg[:,:-1])
	#output = [batch size, trg len - 1, output dim]
	#trg = [batch size, trg len]
	output_dim = output.shape[-1]
	output = output.contiguous().view(-1, output_dim)
	trg = trg[:,1:].contiguous().view(-1)
	#output = [batch size * trg len - 1, output dim]
	#trg = [batch size * trg len - 1]
	loss = criterion(output, trg)
	epoch_loss += loss.item()
	return epoch_loss / len(iterator)