rish-16/datagen.py

## datagen.py
'''
num_replicas is the total number of times we'll replicate
the batch samples for all cores.
'''
train_sampler = torch.utils.data.distributed.DistributedSampler(
                                                  im_train,
                                                  num_replicas=xm.xrt_world_size(),
                                                  rank=xm.get_ordinal(),
                                                  shuffle=True
                 )

test_sampler = torch.utils.data.distributed.DistributedSampler(
                                                  im_test,
                                                  num_replicas=xm.xrt_world_size(),
                                                  rank=xm.get_ordinal(),
                                                  shuffle=False
                 )

# ignore batch_size and num_workers for now
train_loader = torch.utils.data.DataLoader(
  im_train,
  batch_size=flags['batch_size'],
  sampler=train_sampler,
  num_workers=flags['num_workers'],
  drop_last=True
)

test_loader = torch.utils.data.DataLoader(
  im_test,
  batch_size=flags['batch_size'],
  sampler=test_sampler,
  num_workers=flags['num_workers'],
  drop_last=True
)
	'''
	num_replicas is the total number of times we'll replicate
	the batch samples for all cores.
	'''
	train_sampler = torch.utils.data.distributed.DistributedSampler(
	im_train,
	num_replicas=xm.xrt_world_size(),
	rank=xm.get_ordinal(),
	shuffle=True
	)

	test_sampler = torch.utils.data.distributed.DistributedSampler(
	im_test,
	num_replicas=xm.xrt_world_size(),
	rank=xm.get_ordinal(),
	shuffle=False
	)

	# ignore batch_size and num_workers for now
	train_loader = torch.utils.data.DataLoader(
	im_train,
	batch_size=flags['batch_size'],
	sampler=train_sampler,
	num_workers=flags['num_workers'],
	drop_last=True
	)

	test_loader = torch.utils.data.DataLoader(
	im_test,
	batch_size=flags['batch_size'],
	sampler=test_sampler,
	num_workers=flags['num_workers'],
	drop_last=True
	)