Created
January 7, 2011 21:41
-
-
Save zengargoyle/770157 to your computer and use it in GitHub Desktop.
approximate XML to Anki example.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
att passa någon som handen i handske;to be right up somebody's alley | |
(bildligt) rycka in och hjälpa till, (omedelbart) hjälpa till;step into the breach | |
bli sämre;be losing one's grip | |
bort med tassarna!;take your paws off! | |
brännas på bål;be burnt at the stake | |
bromsa något, hejda något;put the (a) brake on something | |
finnas i alla former och storlekar;come in all shapes and sizes | |
förbarma sig över någon;take pity on somebody | |
för Guds skull! (informellt);for crying out loud! | |
försöka lyckas i världen (särskilt litterärt);seek one's fortune | |
ge någon betalt för gammal ost;have a score to settle with somebody | |
hålla ihop i vått och torrt;through thick and thin | |
hamna i onåd;fall into disfavor | |
inbyggda skåp;built-in cupboards | |
inte ge sig i första taget (bildligt);die hard | |
jag har inte berättat det värsta ännu;you don't know the half of it | |
lägga benen på ryggen (gammaldags; informellt);show a clean pair of heels | |
om jag vore som du, om jag vore i dina kläder;if I were you | |
opinionens;the swing of the pendulum | |
på rak arm, utan närmare eftertanke;on the spur of the moment | |
(skämtsamt) nya jakmarker, nya (friskare) betesmarker;pastures new (greener) | |
spela pajas, larva sig, bära sig dumt åt, göra en tabbe, göra bort sig;act the fool | |
vara beredd på allt;keep one's/a weather eye open (for) | |
vara svårt för någon att acceptera;go hard with someone |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
#!/usr/bin/env perl | |
use strict; | |
use warnings; | |
use String::Approx qw(amatch); | |
$|++; | |
my $source_file = './folkets_public.xml'; | |
binmode STDOUT, ':utf8'; | |
use XML::Twig; | |
my $twig = XML::Twig->new( | |
twig_roots => { | |
# only handle the <word /> elements. | |
'word' => sub { do_word(@_), $_->delete }, | |
}, | |
); | |
$twig->parsefile( $source_file ); | |
exit; | |
sub do_word { | |
my ($twig, $word) = @_; | |
my $english = $word->{att}{value}; | |
my $class = $word->{att}{class} || ''; | |
my @translations = $word->children('translation'); | |
my @examples = $word->children('example'); | |
my @idioms = $word->children('idiom'); | |
# uncomment one of these: | |
# parts_of_speech;swedish_word;english_word;swedish_example | |
#do_example($english, $class, \@examples, \@translations); | |
# swedish_idiom;english_translation | |
do_idioms(\@idioms); | |
}; | |
sub do_idioms { | |
my ($idioms) = @_; | |
for my $i (@$idioms) { | |
my $t = $i->first_child('translation'); | |
print "$i->{att}{value};$t->{att}{value}\n"; | |
} | |
} | |
sub do_example { | |
my ($english, $class, $examples, $translations) = @_; | |
# cross product (@examples X @translations) | |
# works better if you do some pruning before printing | |
for my $e (@$examples) { | |
my $example = $e->{att}{value}; | |
#proper($example); # uncomment for prudishness | |
for my $t (@$translations) { | |
my $comment = $t->{att}{comment} ? " ($t->{att}{comment})" : ''; | |
# uncomment following line to prune by approximate match | |
#next unless amatch( $t->{att}{value}, $e->{att}{value} ); | |
print "$class;$t->{att}{value}$comment;$english;$example\n"; | |
} | |
} | |
} | |
# | |
# enforce formatting | |
# | |
sub proper { | |
# initial caps | |
$_[0] = ucfirst $_[0]; | |
# end with period or other punctuation | |
$_[0] .= '.' unless $_[0] =~ /[[:punct:]]$/; | |
} |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
ab;någonstans;somewhere;Någonstans mellan sju- och åttatusen pund. | |
ab;verkligen;truly;jag är verkligen glad för din skull | |
jj;framlidne;late;hans framlidna hustru | |
jj;full (tabu, slanguttryck);pissed;är du full? | |
jj;genomträngande (om ljud);piercing;hon har en ganska genomträngande röst | |
jj;kinkig;particular;hon är mycket kinkig med vad hon äter | |
jj;makaber;ghoulish;hon tycks finna något slags makabert nöje i att läsa om de här fruktansvärda olyckorna | |
jj;nära förestående;impending;hon oroade sig över den nära förestående operationen | |
jj;psykiatrisk;psychiatric;psykiatrisk vård | |
jj;vederhäftig;reliable;enligt vederhäftiga uppgifter | |
nn;hjärta;heart;mitt hjärta blöder för henne, jag tycker så synd om henne | |
nn;natt;night;i natt drömde jag om dej | |
nn;vik;bay;jag har utsikt över bukten från mitt fönster | |
pn;sig själv;herself;hon var inte sig själv i dag, eller vad tycker du? | |
pp;gånger;by;rummet är två gånger fyra meter stort | |
prefix;o-;non-;jag är icke-rökare | |
vb;gå upp (om ridå på teater eller opera);go up;ridån går upp klockan sju | |
vb;ge;give;hon skrattade till kort och nervöst | |
vb;ha samröre med (nedsättande);collaborate;hur länge har han haft samröre med fienden? | |
vb;hota;threaten;Jag har mottagit ett hotbrev. | |
vb;hota;threaten;Jag har mottagit ett hotbrev. | |
vb;riva sönder;rip;han rev sönder min klänning | |
vb;sänka sig;lower;hon skulle aldrig sänka sig till hans vulgära nivå | |
vb;tugga;gnaw;sluta tugga på naglarna! |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment