Skip to content

Instantly share code, notes, and snippets.

@pdonald
Last active August 29, 2015 13:56
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save pdonald/9227470 to your computer and use it in GitHub Desktop.
Save pdonald/9227470 to your computer and use it in GitHub Desktop.
Formāts: tokens lemma pareizais ~ morpho1 morpho2 morpho3
DJ DJ y ~
Andža Andža n_msn_ ~ n_msg_
pāris pāris a_mpgn_ ~ n_msn_ a______
Piens piens n_msn_ ~ n_mvn_ n_mvv_
putraimi putraimi n_mpn_ ~ n_mdn_ n_mdv_
Mieru miers n_msa_ ~ n_mva_
mieru miers n_msa_ ~ n_mva_
zin' zin i_ ~
tek tecēt v__i___3s__ ~ v__i___30__
mierā miers n_msl_ ~ n_mvl_
šitā šitā r__ ~ v__pdmsl__n v__pdmsg__y v__pdfsl__n v__pdfsn__y v__pdfsv__y v__pd_sg__y n_msl_ n_fsl_ a_msln_ a_msgy_ a_fsln_ a_fsny_ a_fsvy_
šitā šitā r__ ~ v__pdmsl__n v__pdmsg__y v__pdfsl__n v__pdfsn__y v__pdfsv__y v__pd_sg__y n_msl_ n_fsl_ a_msln_ a_msgy_ a_fsln_ a_fsny_ a_fsvy_
feināk feini r__ ~
sasapņojusies sasapņoties v__pdfpn__n ~ v__pdfsn__n v__i___2s__ v__i___30__ v__m___2s__ v__pdmsn__n
nūjā nujā q_ ~ n_fsl_
kino kino n_mva_ ~ n_____
nebūšanas nebūšana n_fsg_ ~ n_fdn_ n_fda_ n_fdv_
Nūja nūja q_ ~ n_fsn_ n_fsv_
Sanī Sanī n_fsa_ ~ n_____
dūmu dūms n_msa_ ~ n_mdg_
Hennessy Hennessy xf ~
Ā Ā i_ ~
Sanī Sanī n_fsn_ ~ n_____
Sanī Sanī n_fsn_ ~ n_____
Labi labi q_ ~ a_mpnn_ r__
Sanī Sanī n_fsn_ ~ n_____
------- ------- xx ~
vairākām vairākas m__fpd_ ~ p_0fpd_
salātus salāti n_mpa_ ~ n_mda_
elsas elsas n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
vakariņās vakariņas n_fpl_ ~ n_fdl_
kuro kura p_0fsa_ ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
re re i_ ~
jāuzliek uzlikt v__d___30__ ~ v__d___00__
miljona miljons n_msg_ ~ m__msg_ m__fsn_
izdedzis izdegt v__pdmsn__n ~ n_msn_
negribu negribēt v__i___1s__ ~ n_fsa_ n_fpg_
vecākiem vecāki n_mpd_ ~ n_mdd_ a_mpdn_
LSD LSD y ~
nomocītāks nomocīts a_msnn_ ~ v__i___30__
dusmas dusmas n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
sāpes sāpes n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
bailes bailes n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
mals malt xt ~ v__i___30__
dusmu dusmas n_fpg_ ~ n_fdg_
dusmas dusmas n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
a a xx ~
sāpēm sāpes n_fpd_ ~ n_fdd_
reizi reizi r__ ~ n_fsa_
sekām sekas n_fpd_ ~ n_fdd_
apaviem apavi n_mpd_ ~ n_mdd_
Vidu Vida n_fsa_ ~ n_mva_ n_mvv_ n_fpg_
Patiesi patiesi q_ ~ a_mpnn_ r__
skuju skujas n_fpg_ ~ n_fdg_ v__i___1s__
āmen āmen i_ ~
drošvien drošvien q_ ~ n_msv_
i i q_ ~
dusmām dusmas n_fpd_ ~ n_fdd_
Ave ave xf ~ n_fsn_ n_fsv_ n_msn_ n_msv_
re re i_ ~
Krist Krists n_msv_ ~ v__n___00__
Zelta zelts n_msg_ ~ v__pdmsg__n v__pdfsn__n n_mvg_ v__i___30__
sažūsi sažūt v__m___2s__ ~ v__i___2s__
i i q_ ~
f-f-a f-f-a xx ~ n_msg_ n_fsn_ n_fsv_ n_msn_ n_msv_ a_msgn_ a_fsnn_ v__i___30__
meitentiņ meitentiņš n_msv_ ~
super super r__ ~
šito šitais p_3mpa_ ~ v__pdmsa__y v__pdmpg__y v__pdfsa__y v__pdfpg__y v__pdmsv__y a_msay_ a_mpgy_ a_fsay_ a_fpgy_
Uzbekija Uzbekija n_fsn_ ~ v__i___30__
toties toties r__ ~ q_
PVN PVN y ~
pamattiesībām pamattiesības n_fpd_ ~ n_fdd_
attiecas attiekties v__i___3s__ ~ v__i___30__
EEK EEK y ~ n_____
tiesību tiesības n_fpg_ ~ n_fdg_
tiesības tiesības n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
tiesības tiesības n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
a a xx ~
tiesību tiesības n_fpg_ ~ n_fdg_
tiesību tiesības n_fpg_ ~ n_fdg_
OV OV xx ~
C C xx ~
E E xx ~
22.5.2002. 22.5.2002 xx ~
LAB LAB y ~
patronesi patronese n_fsa_ ~ v__i___2s__ v__m___2s__
uzsvēra uzsvērt v__i___3s__ ~ v__i___30__
šīs šī p_0fsg_ ~ p_3fpa_ p_3fpn_ p_3fsg_
ir būt v__i___3s__ ~ q_ v__i___30__
iezīmē iezīmēt v__i___3s__ ~ n_fsl_ v__i___2s__ v__i___30__ v__m___2s__
rosināja rosināt v__i___3s__ ~ v__i___30__
šajā šī p_0fsl_ ~ p_3fsl_ p_3msl_
tam tas p_0msd_ ~ p_3msd_
nedrīkst nedrīkstēt v__i___3s__ ~ v__i___30__
neiegūst neiegūt v__i___3s__ ~ v__i___30__
carte carte xf ~ n_fsn_ n_fsv_ n_msn_ n_msv_
de de xf ~
séjour séjour xf ~
līdzinās līdzināties v__i___3s__ ~ v__i___30__
tiesību tiesība n_fpg_ ~ n_fdg_
tiek tikt v__i___3s__ ~ v__i___30__
pagaidu pagaidu a_msan_ ~ a_mpgn_ a_fpgn_ v__i___1s__ a______
tiek tikt v__i___3s__ ~ v__i___30__
pagaidu pagaidu a_msan_ ~ a_mpgn_ a_fpgn_ v__i___1s__ a______
tajā tā p_0fsl_ ~ p_3fsl_ p_3msl_
sekas seka n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
ir būt v__i___3s__ ~ q_ v__i___30__
varētu varēt v__i___0s__ ~ v__pdmsa__n v__pdmpg__n v__pdfsa__n v__pdfpg__n v__c___00__
resursus resurss n_mpa_ ~ n_mda_
ir būt v__i___3s__ ~ q_ v__i___30__
prima prima xf ~ n_msg_ n_fsn_ n_fsv_ n_msn_ n_msv_ a_msgn_ a_fsnn_ v__i___30__
facie facie xf ~ a_mpny_ a_mpvy_ n_fsn_ n_fsv_ n_msn_ n_msv_
var varēt v__i___3s__ ~ v__i___30__
pagaidu pagaidu a_msan_ ~ a_mpgn_ a_fpgn_ v__i___1s__ a______
nenovērš nenovērst v__i___3s__ ~ v__i___30__
pagaidu pagaidu a_msgn_ ~ a_mpgn_ a_fpgn_ v__i___1s__ a______
tiesību tiesība n_fpg_ ~ n_fdg_
pagaidu pagaidu a_msgn_ ~ a_mpgn_ a_fpgn_ v__i___1s__ a______
ir būt v__i___3s__ ~ q_ v__i___30__
pagaidu pagaidu a_msan_ ~ a_mpgn_ a_fpgn_ v__i___1s__ a______
sekām seka n_fpd_ ~ n_fdd_
neveidotos neveidoties v__i___3s__ ~ v__pdmpl__n v__pdmpa__y v__c___00__
tiesību tiesība n_fpg_ ~ n_fdg_
proti proti i_ ~ v__i___2s__ v__m___2s__ q_
ir būt v__i___3s__ ~ q_ v__i___30__
bezstrīdus bezstrīdus a_fsnn_ ~ a______
ir būt v__i___3s__ ~ q_ v__i___30__
pagaidu pagaidu a_msan_ ~ a_mpgn_ a_fpgn_ v__i___1s__ a______
ir būt v__i___3s__ ~ q_ v__i___30__
tiesību tiesība n_fpg_ ~ n_fdg_
šī šis p_0msg_ ~ p_3fsn_ p_3msg_
DL DL y ~
ir būt v__i___3s__ ~ q_ v__i___30__
šī šī p_0fsn_ ~ p_3fsn_ p_3msg_
pieprasa pieprasīt v__i___3s__ ~ v__i___30__
nepieprasa nepieprasīt v__i___3s__ ~ v__i___30__
varētu varēt v__i___3s__ ~ v__pdmsa__n v__pdmpg__n v__pdfsa__n v__pdfpg__n v__c___00__
tam tas p_0msd_ ~ p_3msd_
ir būt v__i___3s__ ~ q_ v__i___30__
ir būt v__i___3s__ ~ q_ v__i___30__
ir būt v__i___3s__ ~ q_ v__i___30__
tiesību tiesība n_fpg_ ~ n_fdg_
neapšaubāmi neapšaubāmi r__ ~ v__pdmpn__n
piemēroja piemērot v__i___3s__ ~ v__i___30__
tiesību tiesība n_fpg_ ~ n_fdg_
piedalījās piedalīties v__i___3p__ ~ v__i___30__
tiesību tiesība n_fpg_ ~ n_fdg_
šis šis p_0msn_ ~ p_3msn_
ir būt v__i___3s__ ~ q_ v__i___30__
tika tikt v__i___3p__ ~ n_msg_ v__i___30__
tiekas tikties v__i___3s__ ~ v__i___30__
vajadzēja vajadzēt v__i___3p__ ~ v__i___30__
tiesības tiesība n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
tai tā p_0fsd_ ~ p_3fsd_ p_3fsl_ p_3msl_
pieguļošo pieguļošs a_mpgn_ ~ v__pdmsa__y v__pdmsv__y v__pdmpg__y v__pdfsa__y v__pdfpg__y a_msay_ a_mpgy_ a_fsay_ a_fpgy_
šī šī p_0fsn_ ~ p_3fsn_ p_3msg_
ir būt v__i___3s__ ~ q_ v__i___30__
tika tikt v__i___3s__ ~ n_msg_ v__i___30__
tiesības tiesība n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
beigu beiga n_fpg_ ~ n_fdg_
ieguvējas ieguvēja n_fpn_ ~ v__i___30__
saņēma saņemt v__i___3p__ ~ v__i___30__
dāvā dāvāt v__i___3s__ ~ v__i___2s__ v__i___30__ v__m___2s__
ir būt v__i___3s__ ~ q_ v__i___30__
civiltiesību civiltiesība n_fpg_ ~ n_fdg_
ir būt v__i___3s__ ~ q_ v__i___30__
nav nebūt v__i___3s__ ~ v__i___30__
ir būt v__i___3s__ ~ q_ v__i___30__
CPL CPL y ~
paredz paredzēt v__i___3s__ ~ v__i___30__
papildu papildu a_msgn_ ~ a_mpgn_ a_fpgn_ a______
rada radīt v__i___3s__ ~ n_fsn_ n_fsv_ v__i___30__
papildu papildu a_mpan_ ~ a_mpgn_ a_fpgn_ a______
palēnina palēnināt v__i___3s__ ~ v__i___30__
ir būt v__i___3p__ ~ q_ v__i___30__
CPL CPL y ~
CPL CPL y ~
nosaka nosacīt v__i___3s__ ~ v__i___30__
nosaka nosacīt v__i___3s__ ~ v__i___30__
tiesības tiesība n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
ir būt v__i___3s__ ~ q_ v__i___30__
ir būt v__i___3s__ ~ q_ v__i___30__
CPL CPL y ~
dod dot v__i___3s__ ~ v__i___30__
piespiedu piespiedu a_fsan_ ~ a______
ir būt v__i___3s__ ~ q_ v__i___30__
TP TP y ~
TP TP y ~
atbalsta atbalstīt v__i___3p__ ~ n_msg_ v__i___30__
uzskata uzskatīt v__i___3s__ ~ n_msg_ v__i___30__
nav nebūt v__i___3s__ ~ v__i___30__
jūsuprāt jūsuprāt r__ ~ v__i___2p__ v__n___00__
šī šī p_0fsn_ ~ p_3fsn_ p_3msg_
varēs varēt v__i___3s__ ~ n_fpl_ v__i___30__
Apsītis Apsītis n_msn_ ~ v__pdmsn__n v__i___30__
ir būt v__i___3s__ ~ q_ v__i___30__
vajadzēs vajadzēt v__i___3s__ ~ v__i___30__
atklāti atklāti r__ ~ v__pdmpn__n
šīs šī p_0fsg_ ~ p_3fpa_ p_3fpn_ p_3fsg_
sāks sākt v__i___3p__ ~ v__i___30__
aizsargā aizsargāt v__i___3s__ ~ n_msl_ v__i___2s__ v__i___30__ v__m___2s__
rūpējas rūpēties v__i___3s__ ~ v__i___30__
šī šis p_0msg_ ~ p_3fsn_ p_3msg_
ir būt v__i___3s__ ~ q_ v__i___30__
galvenais galvenais a_msnn_ ~ a_msny_ a_msvy_
Cilvēktiesību Cilvēktiesība n_fsg_ ~ n_fdg_
šim šis p_0msd_ ~ p_3msd_
ir būt v__i___3s__ ~ q_ v__i___30__
tam tas p_0msd_ ~ p_3msd_
nav nebūt v__i___3s__ ~ v__i___30__
Juridiskās Juridisks a_fsgn_ ~ a_fpln_ a_fsgy_ a_fpny_ a_fpay_ a_fpvy_
Tiesību tiesība n_fpg_ ~ n_fdg_
ES ES y ~ p_10sn_
notika notikt v__i___3s__ ~ v__i___30__
daudzu daudzs a_mpgn_ ~ p_0mpg_ p_0fpg_
kardināli kardināli r__ ~ n_mpn_ n_mpv_
kriminalizē kriminalizēt v__i___30__ ~ n_fsl_ n_msl_
tie tas p_0mpn_ ~ p_3mpn_
tās tā p_0fpa_ ~ p_3fpa_ p_3fpn_ p_3fsg_
sekas seka n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
apdraudot apdraudēt v__r___3p__ ~ v__r___00__ v__pu000__0
nekustamā nekustēt v__pdmsg__y ~ a_msln_ a_msgy_ a_fsln_ a_fsny_ a_fsvy_
šis šis p_0msn_ ~ p_3msn_
īstermiņā īstermiņa n_fsl_ ~ n_msl_
Šos šis p_0mpa_ ~ p_3mpa_
tie tas p_0mpn_ ~ p_3mpn_
intensificējas intensificēties v__i___3s__ ~ v__i___30__ n_fsg_ n_fpn_ n_fpa_ n_fpv_ n_msg_ n_mpn_ n_mpa_ n_mpv_ a_fsgn_ a_fpnn_ a_fpan_ a_msnn_
tās tā p_0fpa_ ~ p_3fpa_ p_3fpn_ p_3fsg_
Šai šis p_0msl_ ~ p_3fsd_ p_3fsl_ p_3msl_
rūpes rūpe n_fpa_ ~ n_fdn_ n_fda_ n_fdv_
SEB SEB y ~
iet iet v__i___3s__ ~ v__n___00__ v__i___30__
vienas viena a_fsgn_ ~ m__fsg_ m__fpn_ m__fpa_
šiem šis p_0mpd_ ~ p_3mpd_
šos šis p_0mpa_ ~ p_3mpa_
VidM VidM y ~
Šā šis p_0msg_ ~ r__ p_3msg_
MK MK y ~
MK MK y ~
Finanšu finanes n_fpg_ ~ n_fdg_
FM FM y ~
nekustamā nekustēt v__pdmsg__y ~ a_msln_ a_msgy_ a_fsln_ a_fsny_ a_fsvy_
nekustamā nekustēt v__pdmsg__y ~ a_msln_ a_msgy_ a_fsln_ a_fsny_ a_fsvy_
nekustamā nekustēt v__pdmsg__y ~ a_msln_ a_msgy_ a_fsln_ a_fsny_ a_fsvy_
atklāti atklāti r__ ~ v__pdmpn__n
ironizē ironizēt v__i___3s__ ~ v__i___2s__ v__i___30__ v__m___2s__
neraugoties neraugoties v__n___00__ ~ v__r___00__ v__pu000__0
Šajā šī p_0fsl_ ~ p_3fsl_ p_3msl_
ES ES y ~ p_10sn_
NVS NVS y ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
ES ES y ~ p_10sn_
daudzpusējās daudzpusējs a_fply_ ~ a_fpln_ a_fsgy_ a_fpny_ a_fpay_ a_fpvy_
ilgtermiņa ilgtermiņa n_fsn_ ~ n_msg_
sabiedrotie sabiedrotais n_mpn_ ~ a_mpny_ a_mpvy_
NVS NVS y ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
ES ES y ~ p_10sn_
pievērsīs pievērst v__i___3s__ ~ v__i___30__
Tikmēr Tikmēr r__ ~
VUGD VUGD y ~
KMC KMC y ~
Liega Liega n_fsn_ ~ a_msgn_ a_fsnn_
VUGD VUGD y ~
šī šī p_0fsn_ ~ p_3fsn_ p_3msg_
lauku lauki n_mdg_ ~ n_msa_ n_mpg_ a_msan_ a_mpgn_ a_fsan_ a_fpgn_
šā šis p_0msg_ ~ r__ p_3msg_
nepārdomāti nepārdomāti r__ ~ v__pdmpn__n
CSN CSN y ~
tam tas p_0msd_ ~ p_3msd_
nepāriet nepāriet v__i___3p__ ~ v__n___00__
šajā šis p_0msl_ ~ p_3fsl_ p_3msl_
tai tā p_0fsd_ ~ p_3fsd_ p_3fsl_ p_3msl_
noslēgts noslēgt v__pdmsn__n ~ a_msnn_
šā šis p_0msg_ ~ r__ p_3msg_
tiesības tiesība n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
tiesības tiesība n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
pieejams pieejams a_msnn_ ~ v__pdmsn__n
pieejamajiem pieejams a_mpdy_ ~ v__pdmpd__y
ĪUMEPLS ĪUMEPLS y ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
padomju padomju n_fps_ ~ n_fpg_ n_fds_
izdevumus izdevumi n_mpa_ ~ n_mda_
padomju padomju n_fps_ ~ n_fpg_ n_fds_
vācu vāci n_mps_ ~ n_mds_ v__i___1s__
skandināvu skandināvi n_mpg_ ~ n_mdg_
mūsdienās mūsdienas n_fpl_ ~ n_fdl_
ļaudīm ļaudis n_mpd_ ~ n_mdd_
pamatiedzīvotājos pamatiedzīvotāji n_mpl_ ~ n_mdl_
patronāta patronāts n_msg_ ~ v__pdmsg__n v__pdfsn__n v__i___30__
tiesības tiesības n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
baltvācu baltvāci n_mps_ ~ n_msa_ n_mpg_ n_msv_ n_fsa_ n_fpg_ a_msan_ a_mpgn_ a_fsan_ a_fpgn_ v__i___1s__
padotie padotais n_mpn_ ~ v__pdmpn__y v__pdmpv__y
vidū vidus n_msl_ ~ n_mvl_
LV LV y ~
Plus Plus r__ ~ n_msv_
protams protams r__ ~ v__pdmsn__n q_
grūtības grūtības n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
protams protams r__ ~ v__pdmsn__n q_
protams protams r__ ~ v__pdmsn__n q_
nākamais nākamais a_msny_ ~ v__pdmsn__y v__pdmsv__y
ES ES y ~ p_10sn_
pieejami pieejams a_mpnn_ ~ v__pdmpn__n
eiro eiro n_mpn_ ~ n_____
baumu baumas n_fpg_ ~ n_fdg_
atskaitīšanās atskaitīšanās n_fsn_ ~ n_fpl_
MK MK y ~
MK MK y ~
ES ES y ~ p_10sn_
desmit desmit m__0p0_ ~ m___p0_
pateicoties pateicoties v__n___00__ ~ v__pu000__0 v__r___00__
ledus ledus n_msg_ ~ n_mvn_ n_mvg_ n_mvv_
svētkus svētki n_mpa_ ~ n_mda_
metro metro n_msn_ ~ n_____
Padomju padomju n_fps_ ~ n_fpg_ n_fds_
divdesmit divdesmit m__mpn_ ~ m__0p0_
O O i_ ~
RP RP y ~
Rāviņu Rāviņš n_msa_ ~ n_fsa_ n_fpg_
ZZS ZZS y ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
Usenko Usenko n_fsn_ ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
LZA LZA y ~ n_msg_ n_fsn_ n_fsv_ n_msn_ n_msv_ a_msgn_ a_fsnn_ v__i___30__
½ ½ xx ~
ST ST y ~
atkārtoti atkārtoti r__ ~ v__pdmpn__n
Latvenergo Latvenergo n_msn_ ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
LETA LETA n_fsn_ ~ y
Latvenergo Latvenergo n_msg_ ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
HES HES y ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
TEC-2 TEC-2 y ~
AF AF xx ~
Colenco Colenco xf ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
Valtiņa Valtiņa n_fsn_ ~ n_msg_
LETA Leta n_fsn_ ~ y
V V y ~
ECOFIN ECOFIN y ~
FM FM y ~
IKP IKP y ~
IKP IKP y ~
Karme Karme n__sg_ ~ n_fsn_ n_fsv_ n_msn_ n_msv_
PF PF y ~
Nordea Nordea n___l_ ~ v__i___30__
Bank Bank xf ~
Finland Finland xf ~
UR UR y ~
ECB ECB y ~
Mario Mario n_msg_ ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
Dragi Dragi n_msg_ ~ n_mpn_ n_mpv_ n_msa_ n_msv_ n_fsa_ a_mpnn_ r__ v__i___2s__ v__m___2s__
pagājušās pagājušā a_fsgy_ ~ v__pdfpl__n v__pdfsg__y v__pdfpn__y v__pdfpa__y v__pdfpv__y
Pedersen Pedersen xf ~
Partners Partners xf ~ v__i___30__
pozicionē pozicionēt v__i___30__ ~ n_fsl_ n_msl_
postpadomju postpadomju n___s_ ~ v__i___1s__ n_msa_ n_mpg_ n_msv_ n_fsa_ n_fpg_ a_msan_ a_mpgn_ a_fsan_ a_fpgn_
Tier Tier xf ~
III III xn ~ n_mpn_ n_mpv_ n_msa_ n_msv_ n_fsa_ a_mpnn_ r__ v__i___2s__ v__m___2s__
Tartačuks Tartačuks y ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
citviet citviet r__ ~ v__m___2p__ v__n___00__
Lattelecom Lattelecom n_msg_ ~
Huawei Huawei n_msg_ ~ n_fsd_ n_mpn_ n_mpv_ n_msa_ n_msv_ n_fsa_ a_mpnn_ r__ v__i___2s__ v__m___2s__
bezšuves bezšuves n_fss_ ~ n_fsg_ n_fpn_ n_fpa_ n_fpv_ n_msg_ n_mpn_ n_mpa_ n_mpv_ n_msn_ n_msv_ n_fsn_ n_fsv_ a_msnn_ v__i___30__
Lattelecom Lattelecom n_msg_ ~
IMS IMS y ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
Lattelecom Lattelecom n_msg_ ~
Lattelecom Lattelecom n_msa_ ~
Tele2 Tele2 n_msl_ ~
Lattelecom Lattelecom n_msg_ ~
Google Google n_msg_ ~ n_fsn_ n_fsv_ n_msn_ n_msv_
Gbps Gbps y ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
Lattelecom Lattelecom n_msg_ ~
Baltic Baltic xf ~
Highway Highway xf ~
Tier Tier xf ~
III III xn ~ n_mpn_ n_mpv_ n_msa_ n_msv_ n_fsa_ a_mpnn_ r__ v__i___2s__ v__m___2s__
Uptime Uptime xf ~ n_fsn_ n_fsv_ n_msn_ n_msv_
Institute Institute xf ~ n_fsn_ n_msn_ n_msv_
M2M M2M y ~
ZAAO ZAAO xx ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
ZAAO Zaao n_fsn_ ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
ZAAO Zaao n_fsn_ ~ a_msay_ a_mpgy_ a_fsay_ a_fpgy_
RDF RDF y ~
esošo būt v__pdmpg___ ~ v__pdmsa__y v__pdmpg__y v__pdfsa__y v__pdfpg__y
dalīti dalīti r__ ~ v__pdmpn__n
savulaik savulaik r__ ~
VAS VAS y ~ a_msnn_ v__i___30__
LDz LDz y ~
Nez Nez q_ ~
Parex Parex n___l_ ~
Ventspils Ventspils n_msg_ ~ n_fsn_ n_fsg_ n_fsv_
Re Re xx ~
Re Re xx ~
Nozare.lv nozare n_fsn_ ~ xu
.lv . zs ~
lv lv y ~
Re Re xx ~
Re Re xx ~
Grindeks Grindeks n__sg_ ~ n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
Nozare.lv nozare.lv xx ~ xu
Aparts Aparts n_msn_ ~ v__pdmsn__n
Dinaz Dinaz n__sg_ ~
Nozare.lv Nozare.lv xx ~ xu
Doriland Doriland xf ~
Investments Investments xf ~ v__pdmsn__n n_msn_ n_msv_ n_fsn_ n_fsg_ n_fsv_ a_msnn_ v__i___30__
LLC LLC xx ~ y
DUS DUS y ~ v__i___30__
Roze Roze n_msn_ ~ n_fsn_ n_fsv_
Pillar pillar xf ~
Management managment xf ~ v__n___00__
NOZARE.LV Nozare.lv n___n_ ~ xu
Imprimatur Imprimatur n_msg_ ~
Imprimatur Imprimatur xf ~
Capital Capital xf ~
Management Management xf ~ v__n___00__
piecdesmitnieku piecdesmitnieks n_msa_ ~ v__i___1s__
!!! !!! zx ~
Neiburga Neiburga n_fsn_ ~ v__i___30__
nākamajai nākamā a_fsdy_ ~ v__pdfsd__y
beigās beigas n_fpl_ ~ n_fdl_
nodarbei nodarbe n_fsd_ ~ v__i___2s__ v__m___2s__
Orlovskij Orlovskij n_____ ~ n_fsd_
ES ES y ~ p_10sn_
centieniem centieni n_mpd_ ~ n_mdd_
Conservation conservation xf ~
Biology biology xf ~
Kopumā kopumā r__ ~ n_msl_
Balvu Balvs n_mpg_ ~ n_mdg_ n_fsa_ n_fpg_
reizēm reizēm r__ ~ n_fpd_
Reizēm reizēm r__ ~ n_fpd_
Dziesmusvētku dziesmusvētki n_mdg_ ~ n_msa_ n_mpg_ n_msv_ n_fsa_ n_fpg_ a_msan_ a_mpgn_ a_fsan_ a_fpgn_ v__i___1s__
padomju padomju n_fps_ ~ n_fpg_ n_fds_
mūsdienās mūsdienas n_fpl_ ~ n_fdl_
jūtas jūtas n_fpn_ ~ n_fdn_ n_fda_ n_fdv_ v__i___30__
nostalģiskas nostalģiska a_fpnn_ ~ v__i___30__
reizēm reizēm r__ ~ n_fpd_
a a xx ~
reizēm reizēm r__ ~ n_fpd_
trepēm trepes n_fpd_ ~ n_fdd_
durvis durvis n_fpa_ ~ n_fdn_ n_fda_ n_fdv_ n_fsn_ n_fsg_ n_fsv_
patiešām patiešām r__ ~ q_
pāris pāris a_mpan_ ~ n_msn_ a______
Ka ka q_ ~ c__
durvīm durvis n_fpd_ ~ n_fdd_
Oto Oto n_msn_ ~ n_____
durvju durvis n_fpg_ ~ n_fdg_
dūmu dūms n_msa_ ~ n_mdg_
plaušās plaušas n_fpl_ ~ n_fdl_
brokastu brokastis n_mpg_ ~ n_fdg_
priekšdarbi priekšdarbi n_mpn_ ~ n_mdn_ n_mdv_
jukas jukas n_fpn_ ~ n_fdn_ n_fda_ n_fdv_
VZ VZ y ~
papildporcijas papildporcija n_fpa_ ~ v__i___30__
pienā piens n_msl_ ~ n_mvl_
gaļā gaļa n_fsl_ ~ n_fvl_
mājputnu mājputni n_mpg_ ~ n_mdg_
TEMPUS Tempus n_____ ~ n_mpa_
ZC ZC y ~
LLMZA LLMZA y ~ n_msg_ n_fsn_ n_fsv_ n_msn_ n_msv_ a_msgn_ a_fsnn_ v__i___30__
resursu resursi n_mpg_ ~ n_mdg_
Kenzyme Kenzyme xf ~ n_fsn_ n_fsv_ n_msn_ n_msv_
N N xx ~
dati dati n_mpn_ ~ n_mdn_ n_mdv_
Swednet Swednet n_____ ~ v__n___00__
dati dati n_mpn_ ~ n_mdn_ n_mdv_
beigām beigas n_fpd_ ~ n_fdd_
grūtībām grūtības n_fpd_ ~ n_fdd_
Department Department xf ~ v__n___00__
of of xf ~
Education Education xf ~
Dolton Dolton xf ~
Tremayne Tremayne xf ~ n_fsn_ n_fsv_ n_msn_ n_msv_
Chung Chung xf ~
Dolton Dolton xf ~
ČCGK ČCGK y ~
// Copyright (C) 2014 Pēteris Ņikiforovs
//
// This program is free software: you can redistribute it and/or modify
// it under the terms of the GNU General Public License as published by
// the Free Software Foundation, either version 3 of the License, or
// (at your option) any later version.
//
// This program is distributed in the hope that it will be useful,
// but WITHOUT ANY WARRANTY; without even the implied warranty of
// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
// GNU General Public License for more details.
//
// You should have received a copy of the GNU General Public License
// along with this program. If not, see <http://www.gnu.org/licenses/>.
using System.Collections.Generic;
using System.IO;
using System.IO.Compression;
using lv.semti.morphology.analyzer;
using lv.semti.morphology.attributes;
using ikvm.io;
namespace Latvian.Morphology
{
public class LuMiiMorphology
{
internal Analyzer analyzer;
public LuMiiMorphology()
{
using (InputStreamWrapper lexicon = LoadResource("Latvian.LuMii.Morphology.Resources.Lexicon.xml.gz"))
using (InputStreamWrapper lexiconCore = LoadResource("Latvian.LuMii.Morphology.Resources.Lexicon_core.xml.gz"))
using (InputStreamWrapper lexiconValerijs = LoadResource("Latvian.LuMii.Morphology.Resources.Lexicon_valerijs.xml.gz"))
using (InputStreamWrapper lexiconVietas = LoadResource("Latvian.LuMii.Morphology.Resources.Lexicon_vietas.xml.gz"))
//using (InputStreamWrapper lexiconOnomasticaWrapper = LoadResource("Latvian.LuMii.Morphology.Resources.Lexicon_onomastica.xml.gz"))
using (InputStreamWrapper exceptions = LoadResource("Latvian.LuMii.Morphology.Resources.Exceptions.txt", compressed: false))
{
analyzer = new Analyzer(lexicon, new[] { lexiconCore, lexiconValerijs, lexiconVietas, /* lexiconOnomastica */ }, exceptions);
analyzer.enableVocative = true;
analyzer.enableGuessing = true;
analyzer.enablePrefixes = true;
analyzer.enableAllGuesses = true;
}
}
private static InputStreamWrapper LoadResource(string name, bool compressed = true)
{
Stream resource = typeof(LuMiiMorphology).Assembly.GetManifestResourceStream(name);
Stream stream = compressed ? new GZipStream(resource, CompressionMode.Decompress) : resource;
InputStreamWrapper wrapper = new InputStreamWrapper(stream);
return wrapper;
}
public IEnumerable<LuMiiTag> Analyze(string word)
{
foreach (AttributeValues form in analyzer.analyze(word).wordforms)
{
form.removeNonlexicalAttributes();
yield return new LuMiiTag(MarkupConverter.toKamolsMarkup(form), form.getValue(AttributeNames.i_Lemma));
}
}
}
}
@pdonald
Copy link
Author

pdonald commented Feb 26, 2014

Ignorējot teikumus, kuros ir tokens bez pareizā taga no morfoloģiskā analizatora:

Train: 3789 sentences, 46742 tokens
Test: 490 sentences, 5615 tokens
Accuracy: 94.50%

Neignorējot teikumus, kuros morfoloģiskais analizators nedod pareizo tagu ārā:

Train: 5654 sentences, 88584 tokens
Test: 743 sentences, 11417 tokens
Accuracy: 89.66%

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment