分類をユークリッド距離ではなく、相関係数クラスタリングしています。 時系列データの時間による量の変化の形で分類します。
| データ1 | データ2 | 判定 |
|---|---|---|
| {1.0, 2.0} | {10.0, 20.0} | 同じクラスター(どちらも2倍に増えている) |
| {1.0, 1.1} | {1.0, 5.0} | 同じクラスター(増え幅は違うが、どちらも増えている) |
python で マルコフ連鎖を使って文章を作れる
import os
marcov = marcov()
marcov.loadCsv(os.path.dirname(__file__) + r"\wakatigaki\after.csv")
print(marcov.makeSentence())MeCabの開発者工藤さんがJavascriptで作成したTinySegmenterを、Pythonで作成したもの。
サンプル
from TinySegmenter import TinySegmenter
sentence = "私は元気です。"
segmenter = TinySegmenter()
print( segmenter.segment(sentence) )