Skip to content

Instantly share code, notes, and snippets.

View marcosatanaka's full-sized avatar

Marcos Tanaka marcosatanaka

View GitHub Profile
# Definindo função de avaliação utilizando métrica Rˆ2. Melhor score = 1.0
def performance_metric(y_true, y_predict):
return r2_score(y_true, y_predict)
Estatísticas para os dados dos imóveis:
Preço mínimo: $105,000.00
Preço máximo: $1,024,800.00
Preço médio: $454,342.94
Preço mediano: $438,900.00
Desvio padrão dos preços: $165,171.13
# Extraindo estatísticas
minimum_price = np.amin(prices)
maximum_price = np.amax(prices)
mean_price = np.average(prices)
median_price = np.median(prices)
std_price = np.std(prices)
print "Estatísticas para os dados dos imóveis:\n"
print "Preço mínimo: ${:,.2f}".format(minimum_price)
print "Preço máximo: ${:,.2f}".format(maximum_price)
O conjunto de dados de imóveis tem 489 pontos com 4 variáveis em cada.
# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd
from sklearn.cross_validation import ShuffleSplit
from sklearn.cross_validation import train_test_split
from sklearn.metrics import r2_score
from sklearn.metrics import make_scorer
from sklearn.grid_search import GridSearchCV
from sklearn.tree import DecisionTreeRegressor