Skip to content

Instantly share code, notes, and snippets.

View syu-id's full-sized avatar

Shaoyun Yu syu-id

  • The Hong Kong Polytechnic University
  • Hong Kong SAR
View GitHub Profile
@syu-id
syu-id / questionnaire.log
Created May 8, 2015 07:18
Stamp fails when using the \makenodeinlasttextbox hack
This is pdfTeX, Version 3.1415926-2.5-1.40.14 (TeX Live 2013/Debian) (format=pdflatex 2015.1.1) 8 MAY 2015 16:09
entering extended mode
restricted \write18 enabled.
%&-line parsing enabled.
**questionnaire.tex
(/mnt/data/tmp/q3/t/questionnaire.tex
LaTeX2e <2011/06/27>
Babel <3.9h> and hyphenation patterns for 78 languages loaded.
(/mnt/data/tmp/q3/t/sdaps.cls
Document Class: sdaps 2013/03/10v1.0 Class for composing questionairs for SDAPS
@syu-id
syu-id / LC-2015.11.13.R
Last active November 26, 2015 13:54
学習者コーパス論 2015.11.13 宿題
library(magrittr)
library(stringr)
# read in all the files
files_nns <- list.files('NICE3.0/NICE-NNS', full = TRUE)
files_ns <- list.files('NICE3.0/NICE-NS', full = TRUE)
nns <- lapply(files_nns, scan, what = 'char', sep = '\n', fileEnc = 'cp932')
ns <- lapply(files_ns, scan, what = 'char', sep = '\n', fileEnc = 'cp932')
@syu-id
syu-id / LC-2015.11.20.R
Last active November 27, 2015 02:02
学習者コーパス論宿題 2015.11.20
library(tidyr)
library(dplyr)
library(stringr)
dirs <- c(
'NICE3.0/NICE-NNS',
'NICE3.0/NICE-NS'
)
data_raw <- dirs %>%
@syu-id
syu-id / 2015.11.30-nishizaka
Last active November 30, 2015 11:17
2015.11.30-nishizaka
## 効果量について
### 分散分析の効果量
被験者内計画の分散分析の効果量である「一般化オメガ二乗($\omega_G^2$)」と「一般化イータ二乗($\eta_G^2$)」の解釈は、水本篤・竹内理 (2008)「研究論文における効果量の報告のために―基本的概念と注意点」『英語教育研究』31, 57–66. (http://www.mizumot.com/files/EffectSize_KELES31.pdf ) の表1(p. 62)に従いました。後の説明の部分では、$\omega_G^2$ を使いました。
サイズ | $\eta_G^2$ | $\omega_G^2$
------|------------|-------------
小 | $.01$ | $.01$
中 | $.06$ | $.09$
library(dplyr)
tokens <- read.csv('data/tokens.csv')
result <- tokens %>%
group_by(native, id) %>%
summarise(
n_token = length(token),
n_type = length(unique(token)),
ttr = n_type / n_token,
@syu-id
syu-id / LC-2015.11.27-ttr_gi.csv
Last active December 4, 2015 12:38
学習者コーパス論 2015.11.27 結果のCSV
native id n_token n_type ttr gi
591 365 144 0.394520547945205 7.53730448529908
en 501 738 361 0.489159891598916 13.2885936376732
en 502 636 340 0.534591194968553 13.4818769572084
en 503 834 353 0.42326139088729 12.2233903227874
en 504 824 336 0.407766990291262 11.7051146400992
en 505 898 393 0.437639198218263 13.1145798598269
en 506 834 341 0.408872901678657 11.8078643061488
en 507 600 264 0.44 10.777754868246
en 508 848 332 0.391509433962264 11.4009268077412
library(tidyr)
library(dplyr)
library(stringr)
# preparations ----
dirs <- list.files('NICE/NICE_3.0.1b', full = TRUE)
files <- dirs %>% list.files(full = TRUE)
writers <- dirs %>% list.files() %>% str_replace('\\.txt$', '')
@syu-id
syu-id / LC-2015.12.04-awl_asl.R
Created December 5, 2015 06:33
学習者コーパス論 2015.12.04 AWL と ASL の計算
library(dplyr)
tokens <- read.csv('data/tokens.csv', as.is = TRUE)
result <- tokens %>%
group_by(native, id) %>%
summarise(
n_token = n(),
n_type = n_distinct(token),
@syu-id
syu-id / 2015.12.04-learner_corpus-2
Created December 5, 2015 17:57
2015.12.04-learner_corpus-2
トークン数と TTR について少し数学的に考えてみると、プロットの結果が当たり前のことです。
トークン数とタイプ数は線形的な関係にあると仮定します。
$$
type = \beta_0 + \beta_1 \cdot token
$$
$token = 1$ の場合、$type=1$ になるので、$\beta_0$ と $\beta_1$ の和が $1$ に決まっています。
@syu-id
syu-id / mi-zsh-prpt.zsh
Created May 10, 2013 01:38
A minimalistic Zsh prompt, with a reverse ordered current working directory on the right-hand side, and a vi normal mode indicator.
# load colors
autoload -U colors
colors
PROMPT="%{$fg_bold[white]%}%#%{$reset_color%} "
# RPROMPT vi mode indicator
VI_INDICATOR="%{$fg_bold[blue]%}vi%{$reset_color%}"
revpwd() {