oborchers/load_onnx_model.py

## load_onnx_model.py
# We start by working with CUDA only
ONNX_PROVIDERS = ["CUDAExecutionProvider", "CPUExecutionProvider"]
opt = rt.SessionOptions()
sess = rt.InferenceSession(str(model_pth), opt, providers=ONNX_PROVIDERS)

model_input = tokenizer.encode_plus(span)
model_input = {name : np.atleast_2d(value) for name, value in model_input.items()}
onnx_result = sess.run(None, model_input)

print(onnx_result[0].shape)
print(onnx_result[1].shape)
	# We start by working with CUDA only
	ONNX_PROVIDERS = ["CUDAExecutionProvider", "CPUExecutionProvider"]
	opt = rt.SessionOptions()
	sess = rt.InferenceSession(str(model_pth), opt, providers=ONNX_PROVIDERS)

	model_input = tokenizer.encode_plus(span)
	model_input = {name : np.atleast_2d(value) for name, value in model_input.items()}
	onnx_result = sess.run(None, model_input)

	print(onnx_result[0].shape)
	print(onnx_result[1].shape)