shirayuca/data.csv

## data.csv

          
            アイテム名
            2392
            2461
            2739
            3178

            
              【アサヒ飲料】十六茶
              0
              0
              0
              0

            
              【伊藤園】お～いお茶　濃い味
              0
              0
              0
              0

            
              【伊藤園】お～いお茶　緑茶
              0
              0
              0
              0

            
              【キリン】生茶
              0
              0
              0
              0

            
              【コカ・コーラ】綾鷹
              0
              0
              0
              1

            
              【コカ・コーラ】爽健美茶
              0
              0
              1
              0

            
              【サントリー】伊右衛門
              0
              0
              0
              1

            
              【大塚製薬】ポカリスエット
              0
              0
              0
              0

            
              【コカ・コーラ】コカ・コーラ
              1
              1
              0
              0

## k-means.R
### k-means関数でクラスタリング
data <- read.csv("data.csv", sep=",", header=T, row.names=1)
data.sc <- scale(data)  #データを標準化（各変量の単位が異なる場合）
km <- kmeans(data.sc, 10, iter.max = 10000, nstart=1)
#引数は、データ、クラスタ数、繰り返しの最大回数（デフォルトは N=10）、nstart（ランダムに初期値を設定する場合のパラメータ。初期値を変更したい場合に用いる）、algorithm（デフォルトは"Hartigan-Wong"）

tapply(names(km$cluster), km$cluster, "unique") #クラスタ別に表示
write.table(km$cluster, sep=",", "km.csv")  #クラスタリング結果を出力
アイテム名	2392	2461	2739	3178
【アサヒ飲料】十六茶	0	0	0	0
【伊藤園】お～いお茶　濃い味	0	0	0	0
【伊藤園】お～いお茶　緑茶	0	0	0	0
【キリン】生茶	0	0	0	0
【コカ・コーラ】綾鷹	0	0	0	1
【コカ・コーラ】爽健美茶	0	0	1	0
【サントリー】伊右衛門	0	0	0	1
【大塚製薬】ポカリスエット	0	0	0	0
【コカ・コーラ】コカ・コーラ	1	1	0	0
	### k-means関数でクラスタリング
	data <- read.csv("data.csv", sep=",", header=T, row.names=1)
	data.sc <- scale(data) #データを標準化（各変量の単位が異なる場合）
	km <- kmeans(data.sc, 10, iter.max = 10000, nstart=1)
	#引数は、データ、クラスタ数、繰り返しの最大回数（デフォルトは N=10）、nstart（ランダムに初期値を設定する場合のパラメータ。初期値を変更したい場合に用いる）、algorithm（デフォルトは"Hartigan-Wong"）

	tapply(names(km$cluster), km$cluster, "unique") #クラスタ別に表示
	write.table(km$cluster, sep=",", "km.csv") #クラスタリング結果を出力