Coffee and Tips - Tech Tutorials coffeeandtips-tech

## media.R
# Criando um vetor de números
valores <- c(12, 15, 14, 10, 18, 20, 25, 22)

# Calculando estatísticas básicas
media <- mean(valores)
mediana <- median(valores)
desvio_padrao <- sd(valores)

# Exibindo os resultados
cat("Média:", media, "\n")

## grafico-dispersao.R
# Criando um conjunto de dados
dados <- data.frame(
  x = rnorm(100),
  y = rnorm(100)
)

# Criando o gráfico de dispersão
ggplot(dados, aes(x=x, y=y)) +
  geom_point(color="blue") +
  theme_minimal()

## bar.R
# Carregando a biblioteca ggplot2
library(ggplot2)

# Criando um DataFrame de exemplo
dados <- data.frame(
  Categoria = c("A", "B", "C"),
  Valor = c(10, 20, 15)
)

# Criando o gráfico

## dataframe.R
# Criando um DataFrame
dados <- data.frame(
  Nome = c("Ana", "Bruno", "Carlos"),
  Idade = c(25, 30, 22),
  Salario = c(3000, 4500, 2800)
)

# Exibindo os dados
print(dados)

## streaming-batch.md

      
              1 file
            
          
              0 forks
            
          
                0 comments
              
            
              0 stars
            
          
                coffeeandtips-tech
                / streaming-batch.md
            
            
              Created
              March 3, 2025 18:02
            
          
Característica
Streaming de Dados
Processamento em Lotes


Tempo de resposta
Milissegundos a segundos
Minutos a horas


Volume de dados
Contínuo e infinito
Acumulado em intervalos


Complexidade
Maior
Menor


Casos de uso
Detecção de fraudes, monitoramento de IoT, redes sociais
Relatórios financeiros, análise histórica


## udf-even-odd-result.md

      
              1 file
            
          
              0 forks
            
          
                0 comments
              
            
              0 stars
            
          
                coffeeandtips-tech
                / udf-even-odd-result.md
            
            
              Created
              February 27, 2025 00:55
            
          
numero
par_ou_impar


1
Ímpar


2
Par


3
Ímpar


4
Par


## udf-even-odd.py
# Função para verificar se um número é par ou ímpar
def even_or_odd(num):
    return "Par" if num % 2 == 0 else "Írmpar"

# Registrando a UDF no Spark
even_odd_udf = udf(even_or_odd, StringType())

# Criando DataFrame de exemplo
data = [(1,), (2,), (3,), (4,)]
df = spark.createDataFrame(data, ["numero"])

## udf-double-result.md

      
              1 file
            
          
              0 forks
            
          
                0 comments
              
            
              0 stars
            
          
                coffeeandtips-tech
                / udf-double-result.md
            
            
              Created
              February 27, 2025 00:49
            
          
valor
valor_dobrado


1
2


2
4


3
6


## udf-double.py
from pyspark.sql.types import IntegerType

# Função para dobrar o valor
def double_value(x):
    return x * 2 if x is not None else None

# Registrando a UDF no Spark
double_udf = udf(double_value, IntegerType())

# Criando DataFrame de exemplo

## udf-uppercaseredult.md

      
              1 file
            
          
              0 forks
            
          
                0 comments
              
            
              0 stars
            
          
                coffeeandtips-tech
                / udf-uppercaseredult.md
            
            
              Last active
              February 27, 2025 00:45
            
          
nome
nome_maiusculo


joao
JOAO


maria
MARIA


carlos
CARLOS
	# Criando um vetor de números
	valores <- c(12, 15, 14, 10, 18, 20, 25, 22)

	# Calculando estatísticas básicas
	media <- mean(valores)
	mediana <- median(valores)
	desvio_padrao <- sd(valores)

	# Exibindo os resultados
	cat("Média:", media, "\n")
	# Criando um conjunto de dados
	dados <- data.frame(
	x = rnorm(100),
	y = rnorm(100)
	)

	# Criando o gráfico de dispersão
	ggplot(dados, aes(x=x, y=y)) +
	geom_point(color="blue") +
	theme_minimal()
	# Carregando a biblioteca ggplot2
	library(ggplot2)

	# Criando um DataFrame de exemplo
	dados <- data.frame(
	Categoria = c("A", "B", "C"),
	Valor = c(10, 20, 15)
	)

	# Criando o gráfico
	# Criando um DataFrame
	dados <- data.frame(
	Nome = c("Ana", "Bruno", "Carlos"),
	Idade = c(25, 30, 22),
	Salario = c(3000, 4500, 2800)
	)

	# Exibindo os dados
	print(dados)
Característica	Streaming de Dados	Processamento em Lotes
Tempo de resposta	Milissegundos a segundos	Minutos a horas
Volume de dados	Contínuo e infinito	Acumulado em intervalos
Complexidade	Maior	Menor
Casos de uso	Detecção de fraudes, monitoramento de IoT, redes sociais	Relatórios financeiros, análise histórica
	# Função para verificar se um número é par ou ímpar
	def even_or_odd(num):
	return "Par" if num % 2 == 0 else "Írmpar"

	# Registrando a UDF no Spark
	even_odd_udf = udf(even_or_odd, StringType())

	# Criando DataFrame de exemplo
	data = [(1,), (2,), (3,), (4,)]
	df = spark.createDataFrame(data, ["numero"])
	from pyspark.sql.types import IntegerType

	# Função para dobrar o valor
	def double_value(x):
	return x * 2 if x is not None else None

	# Registrando a UDF no Spark
	double_udf = udf(double_value, IntegerType())

	# Criando DataFrame de exemplo