Skip to content

Instantly share code, notes, and snippets.

@nezuQ
nezuQ / ドキュメントのWebを泳ぐ。Rで始めるBADデータ・ダイビング!.ipynb
Last active August 29, 2015 14:01
第39回R勉強会@東京 LT発表資料。Webスクレイピングのススメ。#TokyoR
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
@nezuQ
nezuQ / GetSyosetuList.R
Created May 25, 2014 01:27
Rでクローリング。FirefoxをR経由で自動操作する。 ref: http://qiita.com/nezuq/items/550ed145421a5c551eaa
#GetSyosetuList.R
#Copyright (c) 2014 nezuq
#This software is released under the MIT License.
#http://opensource.org/licenses/mit-license.php
#依存パッケージのインストール
install.packages("rJava")
install.packages("devtools")
library(devtools)
install_github('seleniumJars', 'LluisRamon')
@nezuQ
nezuQ / TwitHoursHist.R
Created May 18, 2014 06:35
RでTwitter分析。指定キーワードの時間帯別ツイート数を可視化する。 ref: http://qiita.com/nezuq/items/7b2d2ef7b662d1534e83
#【本処理】
#Twitter検索キーワード
keyword.tgt <- '"島風くん"'
#Twitter検索対象日付
date.tgt <- "2014-05-17"
#Twitterで検索
date.next <- format(as.POSIXct(date.tgt) - 1, "%Y-%m-%d")
twt.raw <- searchTwitter(keyword.tgt, n = 1500, since = date.next, cainfo = cacert.name)
twt <- twListToDF(twt.raw)
@nezuQ
nezuQ / CountTags.sql
Created May 14, 2014 13:55
SQL-Tips。複数の条件のCountを一回で取得する。 ref: http://qiita.com/nezuq/items/9fbb2eee0f722269418b
SELECT
COUNT(*),
COUNT(gender = 'm' OR null),
COUNT(gender = 'f' OR null)
FROM
m_user
;
@nezuQ
nezuQ / CreateTable_user.sql
Created May 11, 2014 04:43
Rubyで前処理。PixivのユーザープロフィールをCSV形式で取得する。 ref: http://qiita.com/nezuq/items/b076d7e6ea6deecfc3ce
create table user(
user_id INTEGER PRIMARY KEY,
nick TEXT ,
hp_url TEXT ,
gender TEXT ,
blood_type TEXT ,
age INTEGER ,
birthday TEXT ,
job TEXT ,
introduction TEXT ,
@nezuQ
nezuQ / CreateIllustTable.sql
Created May 10, 2014 14:31
Pixivイラスト検索APIの取得結果のデータ構造を調べる ref: http://qiita.com/nezuq/items/e4c55bb9c68bf5785e73
CREATE TABLE illust(illust_id INTEGER PRIMARY KEY, user_id INTEGER, extension TEXT, title TEXT, server_no INTEGER, user_name TEXT, illust_128_url TEXT, x1 TEXT, x2 TEXT, illust_480mw_url TEXT, x3 TEXT, x4 TEXT, illust_entry_dt TEXT, tags TEXT, tool_name TEXT, evaluate_cnt INTEGER, evaluate_sum INTEGER, view_cnt INTEGER, caption TEXT, page_cnt INTEGER, x5 TEXT, x6 TEXT, x7 TEXT, x8 TEXT, user_disp_id TEXT, x9 TEXT, r18_flg INTEGER, x10 TEXT, x11 TEXT, user_url TEXT);
@nezuQ
nezuQ / twitnet.R
Created May 10, 2014 08:19
Rでネットワーク分析。指定Twitterユーザーのフォロー関係を可視化する。 ref: http://qiita.com/nezuq/items/75235f2139370cd8166c
library(ROAuth)
library(twitteR)
library(igraph)
#【認証処理】
# 設定情報を取得
twit.consumerKey <- "<あなたのTwitter-API key>"
twit.consumerSecret <- "<あなたのTwitter-API secret>"
@nezuQ
nezuQ / Cabochaを呼び出す.py
Created May 5, 2014 23:11
Ubuntu環境へCaboChaをインストールし、Pythonで呼び出す。 ref: http://qiita.com/nezuq/items/e1ae073b77d966a27f3c
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import CaboCha
c = CaboCha.Parser()
sent = '国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。'
print c.parseToString(sent)
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('UTF-8')
import MeCab
import nltk
from numpy import *
@nezuQ
nezuQ / ncxml2csv.py
Created May 1, 2014 21:45
Pythonで前処理。ニコニコ動画のタグ検索結果をCSV形式に変換する ref: http://qiita.com/nezuq/items/eedfce32ade1bab8f94f
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# ncxml2csv.py
# Copyright (c) 2014 nezuq
# This software is released under the MIT License.
# http://opensource.org/licenses/mit-license.php
from __future__ import unicode_literals
import sys