Skip to content

Instantly share code, notes, and snippets.

@johntheo
Created March 22, 2018 15:11
Show Gist options
  • Save johntheo/0e8df0bc88dd1e72b67bcd52b3184b34 to your computer and use it in GitHub Desktop.
Save johntheo/0e8df0bc88dd1e72b67bcd52b3184b34 to your computer and use it in GitHub Desktop.
My post
date tags thumbnailImage thumbnailImagePosition title categories keywords
2017-06-02T20:00:00-03:00
DEAP
python
evolutionary computing
genetic algorithm
//deap.readthedocs.io/en/master/_images/deap_long.png
left
Tutorial DEAP

Problema da fabricação de garrafas

TL;DR

Neste post eu quero mostrar a utilização de um framework para computação evolucionária chamado DEAP(Distributed Evolutionary Algorithms in Python). Como o nome já diz é uma lib de algoritmos evolucionários que podem ser rodados de forma distribuidas. Ah, e é em Python! =)

Descobri esse framework quando fui buscar uma solução(em Python) que me auxiliasse em alguns trabalhos da disciplina de Computação Evolucionária que estava fazendo no mestrado. Confesso que no inicio demorei para pegar o jeito, pois a biblioteca tem uma forma peculiar de definir os operadores e funções. Porém depois de compreendido, não quis outra vida! se torna natural pensar nas soluções. Just sit and code!

O que coloco abaixo é um Toy Problem sugerido pelo professor da disciplina. O notebook que eu fiz pode ser encontrado nesse link e tem praticamente o conteudo abaixo(que exportei para colocar aqui no blog)

DESCRIÇÂO DO PROBLEMA

Você gerencia uma fábrica de garrafas plásticas que tem apenas uma máquina extrusora. Esta máquina pode funcionar até 60 horas por semanda, isto é, 6 dias por semana com jornada de 10 horas por dia. A máquina é capaz de produzir dois tipos de garrafas plásticas: tipo "leite" e tipo "suco". Toda a produção semanal de garrafas plásticas é armazenada temporariamente num depósito. No domingo toda a produção é despachada para os compradores e o depósito é esvaziado completamente.

A linha de produção leva 6 horas para produzir 100 garrafas tipo leite e 5 horas para produzir 100 garrafas tipo suco. Cada Carrafa tipo leite ocupa 10 unidades cúbicas de espaço no depósito, enquanto que a garrafa de tipo suco ocupa 20 unidades cúbicas. O depósito tem capacidade máxima de 15000 unidades cúbicas.

A contribuição no lucro final da empresa por garrafa tipo leite é de 5 unidades monetárias e por garrafa tipo suco é de 4,5. O departamento de vendas tem contratos de fornecimento capazes de absorver toda a produção possível de garrafas tipo suco, porém tem compradores somente para 800 garrafastipo leite por semana.

Você deve estabelecer qual é o plano de produção mais adequado para maximizar o lucro total da empresa, isto é, quantas garrafas tipo Leite e quantos tipoo Suco devem ser produzidas semanalmente.

Import dos pacotes

O DEAP fornece várias bibliotecas que facilitam o trabalho e deverão ser importadas:

  • base:
  • creator:
  • tools:
  • algorithms:

Outras blibliotecas auxiliares serão utilizadas nesse tutorial:

  • random:
  • numpy:
import random
import numpy
from deap import base
from deap import creator
from deap import tools
from deap import algorithms

# INIT
toolbox = base.Toolbox()

Natureza do problema

Como se trata de um problema de maximização criamos essa função conforme a especificação do DEAP

creator.create("FitnessMax", base.Fitness, weights=(1.0,))

Individuos e população

Cada problema necessita uma forma particular de modelar o individuo, bem como a população deve ser gerada. Sendo assim os passos que devemos fazer no DEAP são:

  • Definir estrutura do individuo(list, set, etc)
  • Definir a função que irá gerar os alelos
  • Definir a função que irá gerar os individuos
  • Definir a função que irá gerar a popuulação
# Definindo a estrutura do indivíduo
IND_SIZE = 20  # Tamanho do individuo - 10 para cada gene
GENES = 2
creator.create("Individual", list, fitness=creator.FitnessMax)

# funcao para gerar o gene com alelos 0 ou 1 randomicamente uniforme
toolbox.register("attr_bool", random.randint, 0, 1)

# funcao para gerar o indivíduo (nome, forma de gerar, Estrutura, funcao geradora, tamanho)
toolbox.register("individual", tools.initRepeat, creator.Individual, toolbox.attr_bool, n=IND_SIZE)

# funcao para gerar a populacao
toolbox.register("population", tools.initRepeat, list, toolbox.individual)

Função de fitness

Essa função ao contrário das outras que são produzidas quase que parametricamente, deve ser impllementada manualmente. Nela é onde o individuo receberá o valor de fitness que corresponde à modelagem funcional do problem. Para o caso deste exemplo em questão temos:

# funcao de fitness
def evaluate(individual):
    l = int("".join(str(i) for i in individual[:int(IND_SIZE/GENES)]), 2)    # gene quantidade de garrafas de leite
    s = int("".join(str(i) for i in individual[int(IND_SIZE/GENES):]), 2)    # gene quantidade de garrafas de suco
    g = (5 * l + 4.5 * s) / 9718.5                                           # funcao objetivo normalizada [0,1]
    h1 = max(0, ((6 * l + 5 * s) / 100 - 60)) / 52.53                        # funcao de restricao 1 normalizada [0,1]
    h2 = max(0, (10 * l + 20 * s - 15000)) / 15690                           # funcao de restricao 2 normalizada [0,1]
    h3 = max(0, (l - 800)) / 223                                             # funcao de restricao 3 normalizada [0,1]
    h4 = max(0, (s - 750)) / 273                                             # funcao de restricao 4 normalizada [0,1]
    return g - 2*(h1+h2+h3+h4)/4,                                            # fitness normalizado [0,1]

Operadores

Para o DEAP são considerados como operadores:

  • evaluate: operador para realizar o cálculo de fitness do indivíduo
  • mate: operador para realizar cross over de indivíduos
  • mutate: operador para realizar a mutação dos
  • select: operador para selecionar os melhores de uma geração para outra

Cada um desses operadores deve ser registrado. Seguindo a documentação do DEAP, damos um nome para o operador, seguido da função que ele irá realizar, seguido dos parametros dessa função

# registra funcao de fitness
toolbox.register("evaluate", evaluate)

# registra crossOver
toolbox.register("mate", tools.cxTwoPoint)

# registra mutacao com probabilidade default de mudar cada gene de 5%
toolbox.register("mutate", tools.mutFlipBit, indpb=0.05)

# registra o metodo de selecao como torneio de tamanho 3
toolbox.register("select", tools.selTournament, tournsize=3)

Funções adicionais

Dependendo de cada caso, podemos desejar mostrar relatórios específicos. Para esse problema, criamos duas funçõs. Uma para imprimir os dados de um indivíduo e outra para plotar o gráfico das evoluções das gerações.

#Imprimir indivíduo
def print_ind(individual):
    l = int("".join(str(i) for i in individual[:int(IND_SIZE / GENES)]), 2)  # gene quantidade de garrafas de leite
    s = int("".join(str(i) for i in individual[int(IND_SIZE / GENES):]), 2)  # gene quantidade de garrafas de suco
    g = 5*l + 4.5*s
    print('Individuo:' + str(individual))
    print('Quantidade de garrafas de leite: ' + str(l))
    print('Quantidade de garrafas de suco: ' + str(s))
    print('Lucro: ' + str(g))

#Plotar Gráfico
def plot_log(logbook):
    gen = logbook.select("gen")
    min = logbook.select("min")
    avg = logbook.select("avg")
    max = logbook.select("max")

    import matplotlib.pyplot as plt

    fig, ax1 = plt.subplots()
    line1 = ax1.plot(gen, min, "b-", label="Minimum Fitness")
    ax1.set_xlabel("Generation")
    ax1.set_ylabel("Fitness", color="b")
    for tl in ax1.get_yticklabels():
        tl.set_color("b")

    ax2 = ax1.twinx()
    line2 = ax2.plot(gen, avg, "g-", label="Average Fitness")
    for tl in ax2.get_yticklabels():
        tl.set_color("g")

    ax3 = ax1.twinx()
    line3 = ax3.plot(gen, max, "y-", label="Maximum Fitness")
    ax3.set_ylabel("Size")
    for tl in ax3.get_yticklabels():
        tl.set_color("y")

    lns = line1 + line2 + line3
    labs = [l.get_label() for l in lns]
    ax1.legend(lns, labs, loc="center right")

    plt.show()

Algoritmo

Depois de definir toda a estrutura do nosso problema e o comportamento, faz-se necessário implementar o algoritmo que irá rodar. Essa implementação é composta dos parametros do Algoritmo Genético e a logica que manipula a população.

No exemplo abaixo utilizamos uma implementação já fornecida pelo DEAP: o eaSimple que é um algoritmos do livro “Evolutionary Computation 1 : Basic Algorithms and Operators”(cap.7). Neste exemplo também optei poro trazer uma implementação mais enxuta sem mostrar os stats monitorados no console, de modo apenas focarmos no processo como um todo do AG.

def main():
    random.seed(94)

    # cria populacao inicial
    pop = toolbox.population(n=70)

    # CXPB - probabilidade de crossover
    # MUTPB - probabilidade de mutacao
    # NGEN - numero de geracoes
    CXPB, MUTPB, NGEN =0.8, 0.02, 60
    
    #stats a serem guardados
    stats = tools.Statistics(key=lambda ind: ind.fitness.values)
    stats.register("std", numpy.std)
    stats.register("min", numpy.min)
    stats.register("avg", numpy.mean)
    stats.register("max", numpy.max)

    #Roda o algoritmo
    pop, logbook = algorithms.eaSimple(pop, toolbox, CXPB, MUTPB, NGEN, stats=stats)

    #Seleciona o melhor individuo da populacao resultante
    best_ind = tools.selSPEA2(pop, 1)

    #Imprime as infromações do melhor individuo
    print_ind(best_ind[0])

    #Plota o Gráfico
    plot_log(logbook)


if __name__ == "__main__":
    main()
gen	nevals	std     	min      	avg     	max   
0  	70    	0.279164	-0.794191	0.222211	0.5251
1  	53    	0.137051	-0.182224	0.365127	0.521669
2  	57    	0.104841	-0.18801 	0.433291	0.527247
3  	62    	0.0855094	-0.102859	0.466715	0.5277  
4  	61    	0.0348315	0.347647 	0.498005	0.527777
5  	58    	0.0463223	0.270386 	0.501738	0.527926
6  	52    	0.0528416	0.130146 	0.498091	0.527926
7  	50    	0.169755 	-0.666382	0.48663 	0.527952
8  	44    	0.0118609	0.458677 	0.524036	0.527952
9  	58    	0.0480039	0.144649 	0.519095	0.527978
10 	61    	0.0011975	0.523538 	0.527375	0.527978
11 	58    	0.000187768	0.527242 	0.527867	0.527978
12 	60    	0.00671136 	0.476925 	0.52684 	0.527978
13 	58    	1.28367e-05	0.527926 	0.527958	0.527978
14 	50    	0.000147406	0.527242 	0.527935	0.527978
15 	62    	1.45458e-05	0.527864 	0.527974	0.527978
16 	46    	1.11022e-16	0.527978 	0.527978	0.527978
17 	53    	1.11022e-16	0.527978 	0.527978	0.527978
18 	58    	5.37505e-05	0.527525 	0.527971	0.527978
19 	52    	0.000526875	0.523538 	0.527914	0.527978
20 	66    	1.11022e-16	0.527978 	0.527978	0.527978
21 	58    	1.11022e-16	0.527978 	0.527978	0.527978
22 	60    	1.11022e-16	0.527978 	0.527978	0.527978
23 	61    	1.11022e-16	0.527978 	0.527978	0.527978
24 	58    	1.11022e-16	0.527978 	0.527978	0.527978
25 	64    	0.000424759	0.524464 	0.527917	0.527978
26 	60    	1.11022e-16	0.527978 	0.527978	0.527978
27 	58    	1.11022e-16	0.527978 	0.527978	0.527978
28 	52    	0.00452791 	0.494315 	0.527231	0.527978
29 	60    	1.11022e-16	0.527978 	0.527978	0.527978
30 	64    	0.0210769  	0.350363 	0.52544 	0.527978
31 	56    	1.11022e-16	0.527978 	0.527978	0.527978
32 	56    	1.11022e-16	0.527978 	0.527978	0.527978
33 	57    	1.11022e-16	0.527978 	0.527978	0.527978
34 	48    	1.11022e-16	0.527978 	0.527978	0.527978
35 	56    	1.11022e-16	0.527978 	0.527978	0.527978
36 	52    	1.11022e-16	0.527978 	0.527978	0.527978
37 	58    	1.11022e-16	0.527978 	0.527978	0.527978
38 	52    	0.0177761  	0.391521 	0.525117	0.527978
39 	62    	1.11022e-16	0.527978 	0.527978	0.527978
40 	56    	1.11022e-16	0.527978 	0.527978	0.527978
41 	52    	1.11022e-16	0.527978 	0.527978	0.527978
42 	62    	0.000416938	0.524464 	0.527927	0.527978
43 	54    	0.000107501	0.527072 	0.527965	0.527978
44 	64    	0.00171128 	0.513557 	0.527772	0.527978
45 	52    	1.11022e-16	0.527978 	0.527978	0.527978
46 	58    	0.00519679 	0.48418  	0.527341	0.527978
47 	54    	0.00133758 	0.516706 	0.527817	0.527978
48 	64    	1.11022e-16	0.527978 	0.527978	0.527978
49 	56    	0.0312358  	0.264753 	0.524217	0.527978
50 	54    	0.0316754  	0.261049 	0.524164	0.527978
51 	52    	1.11022e-16	0.527978 	0.527978	0.527978
52 	50    	1.11022e-16	0.527978 	0.527978	0.527978
53 	54    	1.11022e-16	0.527978 	0.527978	0.527978
54 	56    	1.11022e-16	0.527978 	0.527978	0.527978
55 	66    	1.11022e-16	0.527978 	0.527978	0.527978
56 	56    	1.11022e-16	0.527978 	0.527978	0.527978
57 	54    	1.11022e-16	0.527978 	0.527978	0.527978
58 	52    	0.0140437  	0.409631 	0.526287	0.527978
59 	45    	0.0312358  	0.264753 	0.524217	0.527978
60 	62    	1.11022e-16	0.527978 	0.527978	0.527978
Individuo:[1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0]
Quantidade de garrafas de leite: 672
Quantidade de garrafas de suco: 394
Lucro: 5133.0

png

Por hoje é isso. Espero que essa dica tenha ajudado a facilitar a sua vida.

Até mais!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment