Skip to content

Instantly share code, notes, and snippets.

View utonesm's full-sized avatar

Yusuke utonesm

  • Novena, Singapore
View GitHub Profile
@ultraist
ultraist / zch_sentence.rb
Created February 2, 2012 15:49
句読点のない文字列を文単位に区切る
# -*- coding: utf-8 -*-
# 句読点のない文字列を文単位に区切る
#
# 基本的にはルールベースでルールが適用できない場合は機械学習器で判定する。
# これは青空文庫のデータ( http://www.udp.jp/misc/aozora-data/ )から学習した。
# * ruby 1.8の場合は $KCODE='u'としないと動かない
=begin
s = <<TEXT
昼飯のスパゲティナポリタンを眺めながら