Skip to content

Instantly share code, notes, and snippets.

View KenshoFujisaki's full-sized avatar

藤崎 顕彰 KenshoFujisaki

View GitHub Profile
@KenshoFujisaki
KenshoFujisaki / printer.rb
Last active August 29, 2015 14:22 — forked from zakuroishikuro/printer.rb
Googleからダウンロードできる検索履歴のjsonを月ごとの検索単語でヒストグラム化
# https://history.google.com/history/
# 上のリンクのギアアイコンからダウンロードできる検索履歴のzipを全て表示するやつ
require 'kconv'
require 'json'
require 'cgi'
zip_path = ARGV[0]
raise "Googleからダウンロードした.zipファイルを指定してください。" unless /検索-20.*\.zip/ === zip_path
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import logging
import sys
import os.path
import bz2
from gensim.corpora import WikiCorpus
from gensim.corpora.wikicorpus import filterWiki