Skip to content

Instantly share code, notes, and snippets.

@miz21358
Created January 16, 2018 06:35
Show Gist options
  • Star 5 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save miz21358/ef37c0c0ae0b16d6a4b5382bd816342a to your computer and use it in GitHub Desktop.
Save miz21358/ef37c0c0ae0b16d6a4b5382bd816342a to your computer and use it in GitHub Desktop.
Elasticsearch+kuromoji-neologd で品詞分解アナライザを設定したテンプレート設定用JSONファイル
{
"sample-analyze": {
"order": 0,
"template": "sample-analyze-*",
"settings": {
"index": {
"analysis": {
"filter": {
"greek_lowercase_filter": {
"type": "lowercase",
"language": "greek"
},
"ja_neologd_pos_meishi_filter": {
"type": "kuromoji_neologd_part_of_speech",
"stoptags": [
"名詞-代名詞",
"名詞-代名詞-一般",
"名詞-代名詞-縮約",
"名詞-数",
"名詞-非自立",
"名詞-非自立-一般",
"名詞-非自立-副詞可能",
"名詞-非自立-助動詞語幹",
"名詞-非自立-形容動詞語幹",
"名詞-特殊-助動詞語幹",
"名詞-接尾",
"名詞-接尾-一般",
"名詞-接尾-人名",
"名詞-接尾-地域",
"名詞-接尾-サ変接続",
"名詞-接尾-助動詞語幹",
"名詞-接尾-形容動詞語幹",
"名詞-接尾-副詞可能",
"名詞-接尾-助数詞",
"名詞-接尾-特殊",
"名詞-接続詞的",
"名詞-動詞非自立的",
"名詞-引用文字列",
"名詞-ナイ形容詞語幹",
"接頭詞",
"接頭詞-名詞接続",
"接頭詞-動詞接続",
"接頭詞-形容詞接続",
"接頭詞-数接続",
"動詞",
"動詞-自立",
"動詞-非自立",
"動詞-接尾",
"形容詞",
"形容詞-自立",
"形容詞-非自立",
"形容詞-接尾",
"副詞",
"副詞-一般",
"副詞-助詞類接続",
"連体詞",
"接続詞",
"助詞",
"助詞-格助詞",
"助詞-格助詞-一般",
"助詞-格助詞-引用",
"助詞-格助詞-連語",
"助詞-接続助詞",
"助詞-係助詞",
"助詞-副助詞",
"助詞-間投助詞",
"助詞-並立助詞",
"助詞-終助詞",
"助詞-副助詞/並立助詞/終助詞",
"助詞-連体化",
"助詞-副詞化",
"助詞-特殊",
"助動詞",
"感動詞",
"記号",
"記号-一般",
"記号-読点",
"記号-句点",
"記号-空白",
"記号-括弧開",
"記号-括弧閉",
"記号-アルファベット",
"その他",
"その他-間投",
"フィラー",
"非言語音",
"語断片",
"未知語"
]
},
"ja_neologd_pos_doushi_filter": {
"type": "kuromoji_neologd_part_of_speech",
"stoptags": [
"名詞",
"名詞-一般",
"名詞-固有名詞",
"名詞-固有名詞-一般",
"名詞-固有名詞-人名",
"名詞-固有名詞-人名-一般",
"名詞-固有名詞-人名-姓",
"名詞-固有名詞-人名-名",
"名詞-固有名詞-組織",
"名詞-固有名詞-地域",
"名詞-固有名詞-地域-一般",
"名詞-固有名詞-地域-国",
"名詞-代名詞",
"名詞-代名詞-一般",
"名詞-代名詞-縮約",
"名詞-副詞可能",
"名詞-サ変接続",
"名詞-形容動詞語幹",
"名詞-数",
"名詞-非自立",
"名詞-非自立-一般",
"名詞-非自立-副詞可能",
"名詞-非自立-助動詞語幹",
"名詞-非自立-形容動詞語幹",
"名詞-特殊",
"名詞-特殊-助動詞語幹",
"名詞-接尾",
"名詞-接尾-一般",
"名詞-接尾-人名",
"名詞-接尾-地域",
"名詞-接尾-サ変接続",
"名詞-接尾-助動詞語幹",
"名詞-接尾-形容動詞語幹",
"名詞-接尾-副詞可能",
"名詞-接尾-助数詞",
"名詞-接尾-特殊",
"名詞-接続詞的",
"名詞-動詞非自立的",
"名詞-引用文字列",
"名詞-ナイ形容詞語幹",
"接頭詞",
"接頭詞-名詞接続",
"接頭詞-動詞接続",
"接頭詞-形容詞接続",
"接頭詞-数接続",
"動詞-非自立",
"動詞-接尾",
"形容詞",
"形容詞-自立",
"形容詞-非自立",
"形容詞-接尾",
"副詞",
"副詞-一般",
"副詞-助詞類接続",
"連体詞",
"接続詞",
"助詞",
"助詞-格助詞",
"助詞-格助詞-一般",
"助詞-格助詞-引用",
"助詞-格助詞-連語",
"助詞-接続助詞",
"助詞-係助詞",
"助詞-副助詞",
"助詞-間投助詞",
"助詞-並立助詞",
"助詞-終助詞",
"助詞-副助詞/並立助詞/終助詞",
"助詞-連体化",
"助詞-副詞化",
"助詞-特殊",
"助動詞",
"記号",
"記号-一般",
"記号-読点",
"記号-句点",
"記号-空白",
"記号-括弧開",
"記号-括弧閉",
"記号-アルファベット",
"その他",
"その他-間投",
"フィラー",
"非言語音",
"語断片",
"未知語"
]
},
"ja_neologd_pos_keiyoushi_filter": {
"type": "kuromoji_neologd_part_of_speech",
"stoptags": [
"名詞",
"名詞-一般",
"名詞-固有名詞",
"名詞-固有名詞-一般",
"名詞-固有名詞-人名",
"名詞-固有名詞-人名-一般",
"名詞-固有名詞-人名-姓",
"名詞-固有名詞-人名-名",
"名詞-固有名詞-組織",
"名詞-固有名詞-地域",
"名詞-固有名詞-地域-一般",
"名詞-固有名詞-地域-国",
"名詞-代名詞",
"名詞-代名詞-一般",
"名詞-代名詞-縮約",
"名詞-副詞可能",
"名詞-サ変接続",
"名詞-形容動詞語幹",
"名詞-数",
"名詞-非自立",
"名詞-非自立-一般",
"名詞-非自立-副詞可能",
"名詞-非自立-助動詞語幹",
"名詞-非自立-形容動詞語幹",
"名詞-特殊",
"名詞-特殊-助動詞語幹",
"名詞-接尾",
"名詞-接尾-一般",
"名詞-接尾-人名",
"名詞-接尾-地域",
"名詞-接尾-サ変接続",
"名詞-接尾-助動詞語幹",
"名詞-接尾-形容動詞語幹",
"名詞-接尾-副詞可能",
"名詞-接尾-助数詞",
"名詞-接尾-特殊",
"名詞-接続詞的",
"名詞-動詞非自立的",
"名詞-引用文字列",
"名詞-ナイ形容詞語幹",
"接頭詞",
"接頭詞-名詞接続",
"接頭詞-動詞接続",
"接頭詞-形容詞接続",
"接頭詞-数接続",
"動詞",
"動詞-自立",
"動詞-非自立",
"動詞-接尾",
"形容詞-非自立",
"形容詞-接尾",
"副詞",
"副詞-一般",
"副詞-助詞類接続",
"連体詞",
"接続詞",
"助詞",
"助詞-格助詞",
"助詞-格助詞-一般",
"助詞-格助詞-引用",
"助詞-格助詞-連語",
"助詞-接続助詞",
"助詞-係助詞",
"助詞-副助詞",
"助詞-間投助詞",
"助詞-並立助詞",
"助詞-終助詞",
"助詞-副助詞/並立助詞/終助詞",
"助詞-連体化",
"助詞-副詞化",
"助詞-特殊",
"助動詞",
"感動詞",
"記号",
"記号-一般",
"記号-読点",
"記号-句点",
"記号-空白",
"記号-括弧開",
"記号-括弧閉",
"記号-アルファベット",
"その他",
"その他-間投",
"フィラー",
"非言語音",
"語断片",
"未知語"
]
},
"ja_neologd_pos_fukushi_filter": {
"type": "kuromoji_neologd_part_of_speech",
"stoptags": [
"名詞",
"名詞-一般",
"名詞-固有名詞",
"名詞-固有名詞-一般",
"名詞-固有名詞-人名",
"名詞-固有名詞-人名-一般",
"名詞-固有名詞-人名-姓",
"名詞-固有名詞-人名-名",
"名詞-固有名詞-組織",
"名詞-固有名詞-地域",
"名詞-固有名詞-地域-一般",
"名詞-固有名詞-地域-国",
"名詞-代名詞",
"名詞-代名詞-一般",
"名詞-代名詞-縮約",
"名詞-副詞可能",
"名詞-サ変接続",
"名詞-形容動詞語幹",
"名詞-数",
"名詞-非自立",
"名詞-非自立-一般",
"名詞-非自立-副詞可能",
"名詞-非自立-助動詞語幹",
"名詞-非自立-形容動詞語幹",
"名詞-特殊",
"名詞-特殊-助動詞語幹",
"名詞-接尾",
"名詞-接尾-一般",
"名詞-接尾-人名",
"名詞-接尾-地域",
"名詞-接尾-サ変接続",
"名詞-接尾-助動詞語幹",
"名詞-接尾-形容動詞語幹",
"名詞-接尾-副詞可能",
"名詞-接尾-助数詞",
"名詞-接尾-特殊",
"名詞-接続詞的",
"名詞-動詞非自立的",
"名詞-引用文字列",
"名詞-ナイ形容詞語幹",
"接頭詞",
"接頭詞-名詞接続",
"接頭詞-動詞接続",
"接頭詞-形容詞接続",
"接頭詞-数接続",
"動詞",
"動詞-自立",
"動詞-非自立",
"動詞-接尾",
"形容詞",
"形容詞-自立",
"形容詞-非自立",
"形容詞-接尾",
"副詞-助詞類接続",
"連体詞",
"接続詞",
"助詞",
"助詞-格助詞",
"助詞-格助詞-一般",
"助詞-格助詞-引用",
"助詞-格助詞-連語",
"助詞-接続助詞",
"助詞-係助詞",
"助詞-副助詞",
"助詞-間投助詞",
"助詞-並立助詞",
"助詞-終助詞",
"助詞-副助詞/並立助詞/終助詞",
"助詞-連体化",
"助詞-副詞化",
"助詞-特殊",
"助動詞",
"感動詞",
"記号",
"記号-一般",
"記号-読点",
"記号-句点",
"記号-空白",
"記号-括弧開",
"記号-括弧閉",
"記号-アルファベット",
"その他",
"その他-間投",
"フィラー",
"非言語音",
"語断片",
"未知語"
]
}
},
"analyzer": {
"ja_neologd_analyzer": {
"filter": [
"greek_lowercase_filter",
"cjk_width"
],
"char_filter": [
"icu_normalizer"
],
"type": "custom",
"tokenizer": "ja_neologd_tokenizer"
},
"ja_neologd_meishi_analyzer": {
"filter": [
"greek_lowercase_filter",
"cjk_width",
"ja_neologd_pos_meishi_filter",
"kuromoji_neologd_baseform"
],
"char_filter": [
"icu_normalizer"
],
"type": "custom",
"tokenizer": "ja_neologd_tokenizer"
},
"ja_neologd_doushi_analyzer": {
"filter": [
"greek_lowercase_filter",
"cjk_width",
"ja_neologd_pos_doushi_filter",
"kuromoji_neologd_baseform"
],
"char_filter": [
"icu_normalizer"
],
"type": "custom",
"tokenizer": "ja_neologd_tokenizer"
},
"ja_neologd_keiyoushi_analyzer": {
"filter": [
"greek_lowercase_filter",
"cjk_width",
"ja_neologd_pos_keiyoushi_filter",
"kuromoji_neologd_baseform"
],
"char_filter": [
"icu_normalizer"
],
"type": "custom",
"tokenizer": "ja_neologd_tokenizer"
},
"ja_neologd_fukushi_analyzer": {
"filter": [
"greek_lowercase_filter",
"cjk_width",
"ja_neologd_pos_fukushi_filter",
"kuromoji_neologd_baseform"
],
"char_filter": [
"icu_normalizer"
],
"type": "custom",
"tokenizer": "ja_neologd_tokenizer"
}
},
"tokenizer": {
"ja_neologd_tokenizer": {
"mode": "search",
"type": "kuromoji_neologd_tokenizer"
}
}
}
}
},
"mappings": {
"_default_": {
"dynamic_templates": [
{
"integer_fields": {
"mapping": {
"fielddata": true,
"type": "integer"
},
"match_mapping_type": "string",
"match": "ranking||rate"
}
},
{
"string_fields": {
"match_mapping_type": "string",
"match": "*_txt",
"mapping": {
"type": "text",
"fields": {
"analyzed": {
"type": "text",
"fielddata": true,
"store": true,
"analyzer": "ja_neologd_analyzer",
"search_analyzer": "ja_neologd_analyzer"
},
"analyzed-meishi": {
"type": "text",
"fielddata": true,
"store": true,
"analyzer": "ja_neologd_meishi_analyzer",
"search_analyzer": "ja_neologd_meishi_analyzer"
},
"analyzed-doushi": {
"type": "text",
"fielddata": true,
"store": true,
"analyzer": "ja_neologd_doushi_analyzer",
"search_analyzer": "ja_neologd_doushi_analyzer"
},
"analyzed-keiyoushi": {
"type": "text",
"fielddata": true,
"store": true,
"analyzer": "ja_neologd_keiyoushi_analyzer",
"search_analyzer": "ja_neologd_keiyoushi_analyzer"
},
"analyzed-fukushi": {
"type": "text",
"fielddata": true,
"store": true,
"analyzer": "ja_neologd_fukushi_analyzer",
"search_analyzer": "ja_neologd_fukushi_analyzer"
},
"keyword": {
"type": "keyword",
"ignore_above": 256
},
"full": {
"type": "text"
}
}
}
}
}
],
"properties": {
"execDate": {
"type": "date",
"format": "yyyy/MM/dd'T'HH:mm:ssZ"
}
}
}
}
}
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment