Skip to content

Instantly share code, notes, and snippets.

View shun91's full-sized avatar

Shun Kawahara shun91

View GitHub Profile
@shun91
shun91 / all_line_replace.py
Created January 14, 2015 09:18
テキストファイルの全ての行に共通の置換処理を行う.
#! /usr/bin/python
# -*- coding: utf-8 -*-
############################################################
#
# テキストファイルの全ての行に共通の置換処理を行うスクリプト.
#
# 使い方:
# ・19,22行目付近の「置換対象の文字列」「置換後の文字列」を設定.
# ・下記コマンドで実行.
@shun91
shun91 / libsvm_gaussian_scaler.py
Last active August 29, 2015 14:13
LIBSVMの学習データのスケーリングを行う.
#! /usr/bin/python
# -*- coding: utf-8 -*-
###############################################################################
# LIBSVM(LIBLINEAR)の学習データのスケーリング(標準化)を行う.
# 各素性が平均0,分散1の正規分布に従うようにスケーリングする.
#
# 次のコマンドで実行できる.
# $ python libsvm_gaussian_scaler.py [options]
# [options]
@shun91
shun91 / NgramCreator.java
Last active August 29, 2015 14:13
テキストからn-gramを生成するNgramCreator.java
import java.util.HashMap;
import java.util.Map;
public class NgramCreator {
/**
* 入力したtextからn-gramを生成.
* n-gramとその出現回数を格納したMapを返す.
* 生成時,半角スペースでsplitして1単語とみなす.
*
* @param text