Skip to content

Instantly share code, notes, and snippets.

View josefslerka's full-sized avatar

Josef Šlerka josefslerka

View GitHub Profile
@josefslerka
josefslerka / gist:2330505
Created April 7, 2012 17:10
Jak importovat a vykreslit zakladni grafy v R a iGraph (a jak to ulozit)
require("igraph")
g <- read.graph("listalumia.txt", format="ncol", directed=TRUE)
# defaultni graf
plot(g)
# pocet hran
ecount(g)
# pocet nodu
vcount(g)
@josefslerka
josefslerka / gist:2335620
Created April 8, 2012 07:32
Jak zklastrovat uzivatele Twitteru podle podobnosti v siti a jak je vykreslit
require("igraph")
g <- read.graph("listalumia.txt", format="ncol", directed=TRUE)
# funkce similirarity vychazi z stuie Friends and Neighbors on the Web (http://www.hpl.hp.com/research/idl/papers/web10/fnn2.pdf)
m <-similarity.dice(g)
colnames(m)=c(V(g)$name)
rownames(m)=colnames(m)
d <- dist(m, method = "euclidean") # distance matrix
@josefslerka
josefslerka / gist:2335878
Created April 8, 2012 08:03
Jak exportovat sit vztahu z grafu do PDF
require("igraph")
g <- read.graph("listalumia.txt", format="ncol", directed=TRUE)
pdf(file='site.pdf')
plot(g, vertex.size=10, vertex.label=V(g)$name, vertex.label.dist=0.7)
dev.off()
@josefslerka
josefslerka / gist:2336228
Created April 8, 2012 09:20
Zakladni vypis bi-gramu a tri-gramu v Ruby
require 'rubygems'
def words text
text.downcase.scan(/[a-z]+/)
end
$words = words("V knize „Rok devaty“, ktera navazuje na predchazejici, svou strukturou podobne knihy, ktere vychazeji kazdorocne jiz od roku 2004 vzdy v breznu, ve vyroci me prvni prezidentske inaugurace, je pomerne plasticky predstaven devaty rok meho prezidentovani. Kniha obsahuje me publikovane i nepublikovane texty, prednasky, projevy, prohlaseni, vybrane dopisy, stanoviska k zakonum a spoustu dalsich dokumentu, ktere byly napsany ci proneseny v ceskem jazyce. Vynechany byly texty prilis kratke nebo mene vyznamne. Zadny jiny vyber delan nebyl. Je tam prakticky vsechno.
V knize nejsou me texty psane primo v anglictine a nemcine (kterych jsou vsak za rok desitky), pokud nemaji svou ceskou verzi. V knize neni obsazena jina kniha – Evropska integrace bez iluzi – ktera byla take v nakladatelstvi Knizni klub vydana v listopadu (uvadim zde jen jeji predmluvu). V roce 2011 vyslo i nekolik mych zahranicnich publikaci – ma „Modra, nikoli zelena p
@josefslerka
josefslerka / gist:2342124
Created April 9, 2012 07:27
Počítání matice souvýskytů a jejich klastrování
mydata.vectors <- character(0)
mydata.vectors <- c("RT @LukasGren: Mam v telefonu @Vodafone_CZ a v iPadu O2. Temer vzdy a vsude je na tom Vodafone lepe s datovym pokrytim.", mydata.vectors)
mydata.vectors <- c("@LukasGren @Vodafone_CZ Co jsem nedavno presel, tak #O2 ma ve vlaku z Ostravy do Brna pokryti lepsi, a to i na prerovce. ", mydata.vectors)
mydata.vectors <- c("Mam v telefonu @Vodafone_CZ a v iPadu O2. Temer vzdy a vsude je na tom Vodafone lepe s datovym pokrytim.", mydata.vectors)
mydata.vectors <- c("@predraz_volani s timto ted utoci O2, 300min + neomezene sms do vlastni site a 500MB FUP za 350kc (O2 kul), kdyz prejdete!", mydata.vectors)
mydata.vectors <- c("@TheMoleCZ Zmenu je mozne provest na zakaznicke lince 800 020 202, nebo vam ji muzeme zajistit (http://t.co/t3ZH0g5V). Jarda, O2 Guru", mydata.vectors)
mydata.vectors <- c("@dluckyb No nevim, Strakonice nejsou zase tak male. Ale to same co ty jsem mel u o2. To si nevyberes.", mydata.vectors)
mydata.vectors <- c("@mrkvi
@josefslerka
josefslerka / gist:2344144
Created April 9, 2012 15:09
Wordlcloud pro Vodafone
library(tm)
require(wordcloud)
require(RColorBrewer)
# zde je treba vlozit korpus
# mydata.vectors <- character(0)
# mydata.vectors <- c("Dobre dopoledne Mateji,pokud jste pri registraci zvolil Moravskoslezsky kraj, zobrazila se vam v aplikaci informace, ze soutez probehne 30.1. Vcera 31.1. sef gangu navstivil Olomoucky a Zlinsky kraj. Zvoleny kraj naleznete v aplikaci v zalozce "Souboj kraju".Kazdopadne dnes hrajeme o 75 telefonu Samsung GALAXY mini. Online kolo zacina jiz ve 13:00.Drzim palce, Sandra, O2 Guru", mydata.vectors)
corpus <- Corpus(VectorSource(mydata.vectors))
corpus <- tm_map(corpus, tolower)
corpus <- tm_map(corpus, removePunctuation)
@josefslerka
josefslerka / gist:2344148
Created April 9, 2012 15:10
Generování matic souvyskytu
library(tm)
library(corrplot)
# zde je treba vlozit korpus
# mydata.vectors <- character(0)
# mydata.vectors <- c("Dobre dopoledne Mateji,pokud jste pri registraci zvolil Moravskoslezsky kraj, zobrazila se vam v aplikaci informace, ze soutez probehne 30.1. Vcera 31.1. sef gangu navstivil Olomoucky a Zlinsky kraj. Zvoleny kraj naleznete v aplikaci v zalozce "Souboj kraju".Kazdopadne dnes hrajeme o 75 telefonu Samsung GALAXY mini. Online kolo zacina jiz ve 13:00.Drzim palce, Sandra, O2 Guru", mydata.vectors)
corpus <- Corpus(VectorSource(mydata.vectors))
corpus <- tm_map(corpus, tolower)
corpus <- tm_map(corpus, removePunctuation)
@josefslerka
josefslerka / gist:2371016
Created April 12, 2012 21:10
Import dat z Ataxo Social Insideru do R a jejich zbaveni diakritiky a vytazeni subsetu
tbl <- read.csv("tatrabanka.csv")
mydata.vector <- tbl$Content
mydata.vector <- iconv(mydata.vector, from="utf8", to="ASCII//TRANSLIT")
mydata.vector <- gsub("\'", "", mydata.vector)
twitter <- subset(mydata.vector, mydata.vector$Source == "twitter_cs")
@josefslerka
josefslerka / gist:2560539
Created April 30, 2012 18:05
Jednoduchý WikiCounter
=COUNTA(E2:CF2)
=ImportXML(D2, "//div[@id='p-lang']/div/ul")
http://cs.wikipedia.org/wiki/Dominik_Ha%C5%A1ek
http://cs.wikipedia.org/wiki/Jarom%C3%ADr_J%C3%A1gr
http://cs.wikipedia.org/wiki/Karel_Rach%C5%AFnek
http://cs.wikipedia.org/wiki/Jan_Marek
http://cs.wikipedia.org/wiki/Patrik_Eli%C3%A1%C5%A1
http://cs.wikipedia.org/wiki/Ivan_Hlinka
http://cs.wikipedia.org/wiki/Franti%C5%A1ek_Kaberle
@josefslerka
josefslerka / gist:2665941
Created May 12, 2012 11:23
Formule pro Google Refine na ziskani detailu o Twitter followers
Toto je jen demonstrace moznosti, ktere Google Refine nabizi. Drive ci pozdeji narazite na limit.
1. Otverit Google Refine, zvolit vytvorit projekt z Web Addresses (URLs) a zadat
https://api.twitter.com/1/followers/ids.xml?screen_name=josefslerka
po té vybrat import ID po radku.
2. Aplikovat nasledujici formu v sekci UNDO/REDO, tlačítko Apply.