dasayan05/train.py

## train.py
model = LeNet()
# first synchronization of initial weights
sync_initial_weights(model, rank, world_size)

optimizer = optim.SGD(model.parameters(), lr=1e-3, momentum=0.85)

model.train()
for epoch in range(1, epochs + 1):
    for data, target in train_loader:
        optimizer.zero_grad()
        output = model(data)
        loss = F.nll_loss(output, target)
        loss.backward()

        # The all-reduce on gradients
        sync_gradients(model, rank, world_size)

        optimizer.step()
	model = LeNet()
	# first synchronization of initial weights
	sync_initial_weights(model, rank, world_size)

	optimizer = optim.SGD(model.parameters(), lr=1e-3, momentum=0.85)

	model.train()
	for epoch in range(1, epochs + 1):
	for data, target in train_loader:
	optimizer.zero_grad()
	output = model(data)
	loss = F.nll_loss(output, target)
	loss.backward()

	# The all-reduce on gradients
	sync_gradients(model, rank, world_size)

	optimizer.step()