Skip to content

Instantly share code, notes, and snippets.

View tomasoak's full-sized avatar
🛰️

Tomas Carvalho tomasoak

🛰️
View GitHub Profile
@tomasoak
tomasoak / dim_date.sql
Last active February 27, 2024 12:28
Create a date dimension table in AWS Redshift - from 1985 to 2060
begin transaction;
drop table if exists numbers;
create temp table numbers as (
with recursive
counts (number) as (
select 1 as number
union all
select number + 1
from counts m
@tomasoak
tomasoak / logistic_regression_cross_validation.py
Created November 29, 2023 22:54
eEDB-001 - Análise e Mineração de Dados - Atividade 04
"""
Universidade de São Paulo
Escola Politécnica
Especializaçäo em Engenharia de Dados & Big Data
Análise e Mineração de Dados - eEDB-001
Atividade 04
Desenvolvimento de função que realiza validação cruzada no treinamento de
modelo de regressão logística.
"""
@tomasoak
tomasoak / main_etl.py
Last active August 16, 2023 01:14
edb011_activity_03
"""
Main ETL script
Formato table final
Nome do Banco
CNPJ
Classificação do Banco
Quantidade de Clientes do Bancos
Índice de reclamações
Quantidade de reclamações
@tomasoak
tomasoak / docker-compose.yml
Last active June 16, 2023 00:38
Docker com image MySQL para disciplina de Arquitetura de Big Data e BI - eEDB 004
# Copiar o conteúdo em arquivo com nome `docker-compose.yml`
# Em seguida, no terminal aonde está localizado o arquivo rodar: docker-compose up
services:
db:
image: mysql
environment:
MYSQL_ROOT_PASSWORD: root
MYSQL_DATABASE: mydb
MYSQL_USER: user
MYSQL_PASSWORD: pass
@tomasoak
tomasoak / connect_S3_to_PowerBI.py
Last active June 15, 2022 14:26
Connect Amazon S3 to PowerBI
"""
Connect Amazon S3 file to PowerBI
"""
# Make sure these packages are installed in your local
# because the script will run in your local default Python
# otherwise: `pip install boto3` etc.
import os
import io
import boto3
@tomasoak
tomasoak / .gitconfig
Last active July 27, 2021 14:01
Git Aliases
# This .gitconfig file will definitely help to increase your productivity
# It can be accessed through the Visual Studio Code, whithin your user folder, open the CMD and type: "code .gitconfig".
# You need to have the VSCode mapped in your Environment Variables
[user]
name = ____
email = ____@____
[color]
added = green
@tomasoak
tomasoak / VSCode_settings.json
Last active September 5, 2022 06:50
My VSCode settings
{
"workbench.colorTheme": "Dracula",
"workbench.iconTheme": "material-icon-theme",
"editor.tabSize": 2,
"editor.fontSize": 14,
"editor.lineHeight": 26,
"editor.fontFamily": "Fira Code",
"editor.fontLigatures": true,
"editor.semanticHighlighting.enabled": false,
@tomasoak
tomasoak / SIMEX_RO_Ranking.sql
Last active May 3, 2021 16:35
Script de rankeamento de Áreas de Exploração Madeireira desenvolvido para o projeto SIMEX no Estado de Rondônia no período de Agosto de 2019 a Julho de 2020
---================================================================================================--
-- SIMEX - Ranking
-- Rondônia
-- Agosto 2019 - Julho 2020
--
-- Author: Tomás Carvalho
-- Data: Abr/2021
---================================================================================================--
--== Autex agrupada por Número de Série Data: > 2019-08-01 ==--
CREATE MATERIALIZED VIEW ro.mv_autorizao_exploracao_dof_ibama_group AS
@tomasoak
tomasoak / SIMEX_RO_Ago19_Jul20.sql
Last active April 19, 2021 19:56
Script desenvolvido para o projeto SIMEX no Estado de Rondônia no período de Agosto de 2019 a Julho de 2020
---================================================================================================--
-- SIMEX
-- Rondônia
-- Agosto 2019 - Julho 2020
--
-- Author: Tomás Carvalho
-- Data: Abr/2021
---================================================================================================--
--== Autex agrupada por Número de Série Data: > 2019-08-01 ==--
--DROP MATERIALIZED VIEW ro.mv_autorizao_exploracao_dof_ibama_group CASCADE;
@tomasoak
tomasoak / prodes2postgis.py
Created March 31, 2020 16:30
Rotina em Python para consultar os dados da API do PRODES e inserir no Banco de Dados PostgreSQL/PostGIS
### Testado utilizando python 3.7
## requirements:
## pip intall psycopg2 sqlalchemy pandas
import psycopg2
from sqlalchemy import create_engine
import pandas as pd
from datetime import date