krsnewwave/nvtabular_movielens_demo3.py Secret

## nvtabular_movielens_demo3.py
from nvtabular.loader.torch import TorchAsyncItr, DLDataLoader

# define your categoricals, continuous variables, and labels
train_iter = TorchAsyncItr(
    train_dataset,
    batch_size=BATCH_SIZE,
    cats=CATEGORICAL_COLUMNS + CATEGORICAL_MH_COLUMNS,
    conts=NUMERIC_COLUMNS,
    labels=["rating"],
)

train_loader = DLDataLoader(
    train_iter, batch_size=None, collate_fn=lambda x: x, pin_memory=False, num_workers=0
)

# you can also use the workflow to get info about your data
# for example, if you have categoricals, you can get the vocabular and embedding sizes:
proc = nvt.Workflow.load(os.path.join(WORKING_DIR, "workflow"))
EMBEDDING_TABLE_SHAPES, MH_EMBEDDING_TABLE_SHAPES = nvt.ops.get_embedding_sizes(proc)
	from nvtabular.loader.torch import TorchAsyncItr, DLDataLoader

	# define your categoricals, continuous variables, and labels
	train_iter = TorchAsyncItr(
	train_dataset,
	batch_size=BATCH_SIZE,
	cats=CATEGORICAL_COLUMNS + CATEGORICAL_MH_COLUMNS,
	conts=NUMERIC_COLUMNS,
	labels=["rating"],
	)

	train_loader = DLDataLoader(
	train_iter, batch_size=None, collate_fn=lambda x: x, pin_memory=False, num_workers=0
	)

	# you can also use the workflow to get info about your data
	# for example, if you have categoricals, you can get the vocabular and embedding sizes:
	proc = nvt.Workflow.load(os.path.join(WORKING_DIR, "workflow"))
	EMBEDDING_TABLE_SHAPES, MH_EMBEDDING_TABLE_SHAPES = nvt.ops.get_embedding_sizes(proc)