Skip to content

Instantly share code, notes, and snippets.

View ryukinix's full-sized avatar
☢️
IN RESEARCH

Manoel V. Machado ryukinix

☢️
IN RESEARCH
View GitHub Profile
@ryukinix
ryukinix / README.md
Last active August 2, 2017 04:58 — forked from zenorocha/README.md
Simple README.md template for Sublime Text

Project Name

TODO: Write a project description

Installation

TODO: Describe the installation process

Usage

@ryukinix
ryukinix / pygame-guide.md
Last active November 12, 2017 00:28
A mini-guide for introduction to Python + Pygame (PT-BR)

- * - My guide for Pygame Learning - * -

The 2nd Law of Universe

Comment: Sobreviva a luta com o inglês, resista, bata de frente e dê um jeito de ler — nem que tenha que usar o google translator (arrck!). Estou tentando compartilhar o máximo de coisas na nossa língua nativa... mas você, caro pythoneiro, sabe como é, não é? O inglês americano é língua padrão pra desenvolvimento de código, documentação e outras maravilhas do mundo da computação. Dê um jeito no seu inglês! — eu preciso dar um jeito no meu.

Dependency

Comment: Você precisa das dependências do Pygame, inclusive ele, no seu ambiente de desenvolvimento. Pra instalar pode usar pip, apt-get, pacman, yum ou qualquer que seja o gerenciador de pacotes que você usa. Ou você pode baixar o source e instalar por si mesmo (_hard-inst

@ryukinix
ryukinix / sync-fork.sh
Last active August 2, 2017 04:58
A newbie script to fetch commits from a external remote
#!/bin/bash
#
# This script syncronize a repository forked.
#
# Deliright @ Manoel Vilela
#
# The original source: https://help.github.com/articles/syncing-a-fork/
#
# Warning: THIS A UNTESTED SCRIPT! IF YOU HAVE PROBLEMS, TRY READ THE STDOUT!
@ryukinix
ryukinix / git-config-template.sh
Created August 1, 2015 04:43
A template for fast configuration of git on your Environment Linux
#!/bin/bash
#
# Created by Manoel Vilela
#
ssh_setup() {
eval "$(ssh-agent -s)"
ssh-add ~/.ssh/id_rsa
ssh -T git@github.com
}
@ryukinix
ryukinix / get-keycodes.sh
Created August 24, 2015 06:32
A command to get the keycodes of your keyboard and configure your ~/.Xmodmap
#!/usr/bin/env bash
# A command to get the keycodes of your keyboard and configure your ~/.Xmodmap
# I used that for configure my multimedia-keys on XFCE4 @ Manjaro
xev | grep -A2 --line-buffered '^KeyRelease' | sed -n '/keycode /s/^.*keycode \([0-9]*\).* (.*, \(.*\)).*$/\1 \2/p'
# [e.g.: ~/.Xmodmap
# keycode 162 = XF86AudioPlay
# keycode 164 = XF86AudioStop
@ryukinix
ryukinix / filter-username-repo-gits.sh
Created August 28, 2015 22:55
Copy-paste solution to get all the usernames/repository an current path
#!/usr/bin/env bash
#
# Bash Script
#
# Copyright © Manoel Vilela
#
#
find . -iname .git -exec bash -c \
"cat '{}/config' | \
@ryukinix
ryukinix / crispim-algorithm.py
Last active May 21, 2022 19:02
Algoritmo de sumarização automática de textos feito originalmente por Juca Crispim; seu artigo abordando esse método simplista inspirado no TextRank está no link anexado ao código.
#!/usr/bin/env python
#
# Python Script
#
# Copyright © Juca Crispim
#
# original source: https://goo.gl/NhfKET
import math
import nltk
@ryukinix
ryukinix / levenshtein-algorithm.py
Last active September 10, 2015 05:36
Levenhstein algorithm implementation
#!/usr/bin/env python
#
# Python Script
#
# Copyleft © Manoel Vilela
#
#
# complexity time: O(n x m)
@ryukinix
ryukinix / anbient_score.py
Created December 29, 2015 08:37
Lista de animes de www.anbient.net organizados por score
#!/usr/bin/env bash
#
# Bash Script
#
# Copyright © Manoel Vilela
#
#
from requests import get
from bs4 import BeautifulSoup
@ryukinix
ryukinix / resume.md
Last active April 4, 2017 11:38
Uma introspecção a respeito dos últimos métodos e algoritmos utilizados na tentativa de extração de tópicos em NLP

LDA

Descrição: Dado um conjunto de documentos, com esse tipo de algoritmo conseguimos uma distribuição de keywords como tópicos para cada documento individual, na qual é ordenado pela sua probabilidade. Podemos definir que o tópico mais provável daquele post é o que tem maior score após o treinamento do modelo LDA.

Prós: Conseguimos um conjunto de tokens para categorizar um post/comment. Como os tópicos são genérico e um tópico tem a tendência de ser categorizado por um documento mais de uma vez, é possível pensar em clusterização de documentos a partir desses tópicos — muito mais facilmente que abordagem anterior usando expressões regulares capitalizadas. Como a análise de criação de tópicos é global, podemos ter inferências de assuntos, pois não necessariamente as keywords (tokens) do tópico mais provavél estarão todas no documento, pode haver mais. (veja no exemplo)

Contras: Precisamos definir antes de rodar o algoritmo quantos tópicos queremos gerar num conjunto de documentos. Um conjun