Skip to content

Instantly share code, notes, and snippets.

View mjlassila's full-sized avatar

Matti Lassila mjlassila

View GitHub Profile

README

LaTeX Preamble

Created by Mark Eli Kalderon on 2008-07-30

Introduction

LaTeX preamble and associated files. Meant to be used as a submodule of a Git repository. The file, preamble.tex, needs to be included in the LaTeX document under version control. See the provided template. For more information about keeping your LaTeX preamble in a Git submodule see this blog post.

@mjlassila
mjlassila / data-oriented-xml.xml
Created January 12, 2011 09:34
Harjoitustehtävien esimerkkidokumentit
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE prices SYSTEM "prices.dtd">
<prices>
<book year="1992" id="b1">
<title>Advanced Programming in the Unix environment</title>
<store>
<source>bstore2.example.com</source>
<price>65.95</price>
</store>
<store>
@mjlassila
mjlassila / gist:775951
Created January 12, 2011 09:49
XQuery-koodilistaukset
<results>
{
for $b in /prices/book
return
<result>
{ $b/title }
{ $b//source }
</result>
}
</results>
@mjlassila
mjlassila / planter.rb
Created September 28, 2012 08:17 — forked from ttscoff/planter.rb
Create directory trees from indented text input
#!/usr/bin/ruby
# ruby script to create a directory structure from indented data.
# Three ways to use it:
# - Pipe indented (tabs or 2 spaces) text to the script
# - e.g. `cat "mytemplate" | planter.rb
# - Create template.tpl files in ~/.planter and call them by their base name
# - e.g. Create a text file in ~/.planter/site.tpl
# - `planter.rb site`
# - Call planter.rb without input and it will open your $EDITOR to create the tree on the fly
# You can put %%X%% variables into templates, where X is a number that corresponds to the index
@mjlassila
mjlassila / vko-02-harjoitus-07.py
Created October 1, 2012 12:03
ITIA41 - Viikkoharjoitusten esimerkkiratkaisuja 2--3
# Luodaan FreqDist sanojen pituuksista
freq_of_word_lengths = FreqDist([len(w) for w in text2])
#Katsotaan frekvenssijakaumaa
sorted(freq_of_word_lengths.keys())
# FreqDist:n avaimina on sanojen pituudet.
# Katsotaan kuinka monta sanaa löytyy avaimella 17.
freq_of_word_lengths[17]
@mjlassila
mjlassila / vko-04-02.py
Created October 15, 2012 07:15
ITIA41 - Viikkoharjoitusten esimerkkiratkaisuja 4--
#### Tehtävä 2 ####
# NLTK:n word_tokenize -metodia tulisi käyttää vain yksittäisiin lauseisiin. Työnkulku
# raakatekstistä pilkotuksi tekstiksi voisi olla esimerkiksi tällainen:
from nltk tokenize import *
# Ladataan tajunnanvirtaa.
text = "Vippaa mulle $5,55 ja laula lujaa. Jollen laula, niin et laula."
tokenized_text = [word for sentence in sent_tokenize(text) for word in word_tokenize(sentence)]
@mjlassila
mjlassila / vko-05-02.py
Created October 22, 2012 13:12
ITIA41 - Viikkoharjoitusten esimerkkiratkaisuja 5
#### Tehtävä 2
# Tässä tehtävässä suurimmat hankaluudet liittyivät tulosjoukon saamiseen oikeaan muotoon.
# Kurssin alussa harjoitellut taajuusjakauma-asiat olivat pysyneet mielessä, hyvä!
# Eräs ratkaisu:
from nltk import pprint
from nltk.book import text4
@mjlassila
mjlassila / vko-06-01--05.py
Created October 29, 2012 12:03
ITIA41 - Viikkoharjoitusten esimerkkiratkaisuja 6
#### Tehtävä 1 ####
# Tätä tehtävää ratkaistaessa saattoi aiheuttaa ihmetystä, jollei tiedostoa
# sulkenut kirjoittamisen jälkeen. Tällöin varsinainen kirjoitusoperaatio jää
# tapahtumatta ja tapahtuu vasta silloin, kun Python sulkee automaattisesti
# tiedoston. Auki jäänyt tiedosto näyttäytyi cat-komennolla tarkasteltuna
# tyhjältä, vaikka tiedostoon olisikin kirjoitettu write:llä.
# Eräs ratkaisu
@mjlassila
mjlassila / 08-01.py
Created November 1, 2012 12:32
ITIA41 - Viikkoharjoitukset 08
## Työskentely-ympäristön valmistelut ##
# Otetaan käyttöön Pythonin lokitustyökalu, että myöhemmin dokumentteja indeksoidessamme
# voimme pysymme selvillä, mitä komentojen suorittamisen aikana tapahtuu.
# Jos pidät taukoa tehtävien tekemisessä ja aloitat myöhemmin uudelleen,
# muista ottaa lokitus uudelleen käyttöön lokitus työskentelysi alussa.
# Samalla voidaan ottaa käyttöön pprint -moduuli, joknka avulla saadaan
# tulostettua muuttujien sisältöä tavallista tulostuskomentoa
# helppolukuisemmassa muodossa.
@mjlassila
mjlassila / 07-01--06.py
Created November 5, 2012 14:07
ITIA41 - Viikkoharjoitusten esimerkkiratkaisuja 7
## Tehtävä 1 ##
### ASCII
'''ASCII on 7-bittinen eli 128 merkkiä käsittävä merkistö, joka sisältää
amerikanenglannin suur ja pienaakkoset, numerot, välilyönnin sekä joitain väli-
ja erikoismerkkejä. Merkkien järjestys perustuu englantilaiseen aakkostoon.'''
### UTF-8, hyötyjä ja haittoja