Skip to content

Instantly share code, notes, and snippets.

@squaidapp
squaidapp / GBT Squaid Example
Created May 14, 2023 03:45
GBT Squaid Example
# Evaluamos la precisión del modelo
evaluator = MulticlassClassificationEvaluator(labelCol="label", predictionCol="prediction", metricName="accuracy")
accuracy = evaluator.evaluate(predictions)
@squaidapp
squaidapp / GBT Squaid Example
Created May 14, 2023 03:44
GBT Squaid Example
# Obtenemos las predicciones con el conjunto de prueba
predictions = model.transform(testData)
@squaidapp
squaidapp / GBT Squaid Example
Created May 14, 2023 03:44
GBT Squaid Example
# Entrenamos el modelo con el conjunto de entrenamiento
model = gbt.fit(trainingData)
@squaidapp
squaidapp / GBT Squaid Example
Created May 14, 2023 03:43
GBT Squaid Example
# Creamos un modelo de Gradient Boosted Trees
gbt = GBTClassifier(labelCol="label", featuresCol="features", maxIter=10)
@squaidapp
squaidapp / GBT Squaid Example
Created May 14, 2023 03:42
GBT Squaid Example
# Dividimos el conjunto de datos en conjuntos de entrenamiento y prueba
(trainingData, testData) = data.randomSplit([0.7, 0.3], seed=123)
@squaidapp
squaidapp / GBT Squaid Example
Created May 14, 2023 03:34
GBT Squaid Example
# Convertimos la variable objetivo en un índice numérico
labelIndexer = StringIndexer(inputCol="species", outputCol="label")
data = labelIndexer.fit(data).transform(data)
# Convertimos las variables de entrada en un vector de características
assembler = VectorAssembler(inputCols=["sepal_length", "sepal_width", "petal_length", "petal_width"], outputCol="features")
data = assembler.transform(data)
# Seleccionamos las columnas necesarias y las renombramos
data = data.selectExpr("_c0 as sepal_length", "_c1 as sepal_width", "_c2 as petal_length", "_c3 as petal_width", "_c4 as species")
# Cargamos el conjunto de datos (usaremos el conjunto de datos "Iris" de UCI)
data = spark.read.format("csv").option("header", "true").option("inferSchema", "true").load("https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data")
# Creamos una sesión de Spark
spark = SparkSession.builder.appName("GBTClassifier").getOrCreate()