Aplicação usando streamlit
# pip install streamlit pandas matplotlib seaborn
import streamlit as st
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Fonte de Dados
# Especificando o título da página e o ícone
st.set_page_config(page_title="Dashboard - Student Dataset", page_icon=":books:")
# sidebar
st.sidebar.title("Configurações de Exibição")
w = st.sidebar.multiselect('Buy', ['milk', 'apples', 'potatoes'])
gsheets_show_id ="Selecione o Dataset", ("Matemática", "Português"))
st.sidebar.subheader("Selecione o que deseja exibir")
show_dataset = st.sidebar.checkbox("Dados do Dataset")
show_dataset_description = st.sidebar.checkbox("Descrição do Dataset")
graph1_type = st.sidebar.selectbox("Gráfico 1: Selecione o tipo de gráfico", ("Barra", "Pizza", "Dispersão", "Histograma", "Boxplot"))
# Carregando o dataset
gsheets_math_id = "1392993996"
gsheets_portuguese_id = "0"
show_id = gsheets_math_id if gsheets_show_id == "Matemática" else gsheets_portuguese_id
gsheets_url = '' + show_id
def load_data(sheets_url):
csv_url = sheets_url.replace("/edit#gid=", "/export?format=csv&gid=")
return pd.read_csv(csv_url)
data = load_data(gsheets_url)
# Adicionando um título
st.title("Análise de Dados do Dataset de Estudantes")
# Descritivo do dataset
if show_dataset_description:
st.subheader("Descrição do Dataset")
| Column | Description |
| school | Student's school (binary: 'GP' - Gabriel Pereira or 'MS' - Mousinho da Silveira) |
| sex | Student's sex (binary: 'F' - female or 'M' - male) |
| age | Student's age (numeric: from 15 to 22) |
| address | Student's home address type (binary: 'U' - urban or 'R' - rural) |
| famsize | Family size (binary: 'LE3' - less or equal to 3 or 'GT3' - greater than 3) |
| Pstatus | Parent's cohabitation status (binary: 'T' - living together or 'A' - apart) |
| Medu | Mother's education (numeric: 0 - none, 1 - primary education (4th grade), 2 - 5th to 9th grade, 3 - secondary education or 4 - higher education) |
| Fedu | Father's education (numeric: 0 - none, 1 - primary education (4th grade), 2 - 5th to 9th grade, 3 - secondary education or 4 - higher education) |
| Mjob | Mother's job (nominal: 'teacher', 'health' care related, civil 'services' (e.g. administrative or police), 'at_home' or 'other') |
| Fjob | Father's job (nominal: 'teacher', 'health' care related, civil 'services' (e.g. administrative or police), 'at_home' or 'other') |
| reason | Reason to choose this school (nominal: close to 'home', school 'reputation', 'course' preference or 'other') |
| guardian | Student's guardian (nominal: 'mother', 'father' or 'other') |
| traveltime| Home to school travel time (numeric: 1 - <15 min., 2 - 15 to 30 min., 3 - 30 min. to 1 hour, or 4 - >1 hour) |
| studytime | Weekly study time (numeric: 1 - <2 hours, 2 - 2 to 5 hours, 3 - 5 to 10 hours, or 4 - >10 hours) |
| failures | Number of past class failures (numeric: n if 1<=n<3, else 4) |
| schoolsup | Extra educational support (binary: yes or no) |
| famsup | Family educational support (binary: yes or no) |
| paid | Extra paid classes within the course subject (Math or Portuguese) (binary: yes or no) |
| activities| Extra-curricular activities (binary: yes or no) |
| nursery | Attended nursery school (binary: yes or no) |
| higher | Wants to take higher education (binary: yes or no) |
| internet | Internet access at home (binary: yes or no) |
| romantic | With a romantic relationship (binary: yes or no) |
| famrel | Quality of family relationships (numeric: from 1 - very bad to 5 - excellent) |
| freetime | Free time after school (numeric: from 1 - very low to 5 - very high) |
| goout | Going out with friends (numeric: from 1 - very low to 5 - very high) |
| Dalc | Workday alcohol consumption (numeric: from 1 - very low to 5 - very high) |
| Walc | Weekend alcohol consumption (numeric: from 1 - very low to 5 - very high) |
| health | Current health status (numeric: from 1 - very bad to 5 - very good) |
| absences | Number of school absences (numeric: from 0 to 93) |
if show_dataset:
st.subheader("Conjunto de Dados")
# Gráficos e tabelas
# Adicionando um gráfico de barras para mostrar a distribuição de gênero dos estudantes
st.subheader("Distribuição de Gênero dos Estudantes")
gender_count = data['sex'].value_counts()
fig, ax = plt.subplots()
if graph1_type == "Pizza":
ax.pie(gender_count.values, labels=gender_count.index, autopct='%1.1f%%')
ax.set_title('Distribuição de Gênero dos Estudantes')
sns.barplot(x=gender_count.index, y=gender_count.values)
ax.set_ylabel('Número de Estudantes')
# Adicionando uma tabela para mostrar a média de idade dos estudantes por escola
st.subheader("Média de Idade dos Estudantes por Escola")
school_mean_age = data.groupby('school')['age'].mean()
# Adicionando um gráfico de dispersão para mostrar a relação entre o tempo de estudo semanal e o número de faltas
st.subheader("Relação entre Tempo de Estudo Semanal e Número de Faltas")
fig, ax = plt.subplots()
sns.scatterplot(x=data['studytime'], y=data['absences'])
ax.set_xlabel('Tempo de Estudo Semanal')
ax.set_ylabel('Número de Faltas')
# Adicionando uma seção para mostrar as estatísticas descritivas dos atributos numéricos do dataset
st.subheader("Estatísticas Descritivas dos Atributos Numéricos")
