Skip to content

Instantly share code, notes, and snippets.

Linux 0
Таблица МФА для английского языка 1
Международный фонетический алфавит 2
Английский язык 3
Англо-фризские языки 4
Западногерманские языки 5
Германские языки 6
Индоевропейские языки 7
Языковая семья 8
Язык 9
@GreenRiverRUS
GreenRiverRUS / convert.py
Created November 25, 2017 20:41
Simple converter to ConLL-2003 NER format for spaCy model training
DATA = [
[
[['Who', 'is', 'Shaka', 'Khan', '?'], ['O', 'O', 'I-PER', 'I-PER', 'O']]
],
[
[['I', 'like', 'London', 'and', 'Berlin', '.'], ['O', 'O', 'I-LOC', 'O', 'I-LOC', 'O']]
]
]
with open('output.conll', 'w') as f:
@GreenRiverRUS
GreenRiverRUS / model.py
Created November 23, 2017 23:42
spaCy model builder
# coding: utf8
from __future__ import unicode_literals
import gzip
import plac
import math
from tqdm import tqdm
import spacy