lotif/upload_and_deploy_new_model_version.py

## upload_and_deploy_new_model_version.py
import sys
import logging

from google.cloud import aiplatform

logging.basicConfig(level=logging.DEBUG, format="%(asctime)s - %(name)s - %(levelname)s: %(message)s")
logger = logging.getLogger(__name__)

model_id = sys.argv[1]
artifact_uri = sys.argv[2]
endpoint_id = sys.argv[3]

aiplatform.init(project="test-project", location="us-west2")

logger.info("Uploading new model version...")

model = aiplatform.Model(f"projects/123/locations/us-west2/models/{model_id}")
model_v2 = aiplatform.Model.upload(
    parent_model=model.resource_name,
    display_name="test-model",
    artifact_uri=artifact_uri,
    serving_container_image_uri="us-west2-docker.pkg.dev/test-project/test-docker-repo/test-inferencer:latest",
    serving_container_environment_variables={
        "HF_TASK": "zero-shot-classification",
        "VERTEX_CPR_WEB_CONCURRENCY": 1,
    },
)

endpoint = aiplatform.models.Endpoint(
    endpoint_name=f"projects/123/locations/us-west2/endpoints/{endpoint_id}",
)

deployed_models = endpoint.list_models()

logger.info("Deploying new model version...")
endpoint.deploy(
    model_v2,
    traffic_percentage=100,
    machine_type="n1-standard-4",
    accelerator_type="NVIDIA_TESLA_T4",
    accelerator_count=1,
    max_replica_count=10,
)

for deployed_model in deployed_models:
    model_id = deployed_model.id
    logger.info(f"Undeploying model id {model_id}")
    endpoint.undeploy(model_id)

logger.info("Done.")
	import sys
	import logging

	from google.cloud import aiplatform

	logging.basicConfig(level=logging.DEBUG, format="%(asctime)s - %(name)s - %(levelname)s: %(message)s")
	logger = logging.getLogger(__name__)

	model_id = sys.argv[1]
	artifact_uri = sys.argv[2]
	endpoint_id = sys.argv[3]

	aiplatform.init(project="test-project", location="us-west2")

	logger.info("Uploading new model version...")

	model = aiplatform.Model(f"projects/123/locations/us-west2/models/{model_id}")
	model_v2 = aiplatform.Model.upload(
	parent_model=model.resource_name,
	display_name="test-model",
	artifact_uri=artifact_uri,
	serving_container_image_uri="us-west2-docker.pkg.dev/test-project/test-docker-repo/test-inferencer:latest",
	serving_container_environment_variables={
	"HF_TASK": "zero-shot-classification",
	"VERTEX_CPR_WEB_CONCURRENCY": 1,
	},
	)

	endpoint = aiplatform.models.Endpoint(
	endpoint_name=f"projects/123/locations/us-west2/endpoints/{endpoint_id}",
	)

	deployed_models = endpoint.list_models()

	logger.info("Deploying new model version...")
	endpoint.deploy(
	model_v2,
	traffic_percentage=100,
	machine_type="n1-standard-4",
	accelerator_type="NVIDIA_TESLA_T4",
	accelerator_count=1,
	max_replica_count=10,
	)

	for deployed_model in deployed_models:
	model_id = deployed_model.id
	logger.info(f"Undeploying model id {model_id}")
	endpoint.undeploy(model_id)

	logger.info("Done.")