Skip to content

Instantly share code, notes, and snippets.

@kosugitti
Created October 17, 2016 01:02
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save kosugitti/647d78a8d7a3f86160a3db39efb353da to your computer and use it in GitHub Desktop.
Save kosugitti/647d78a8d7a3f86160a3db39efb353da to your computer and use it in GitHub Desktop.
---
title: "心理学統計法レポート課題2016"
output:
bookdown::pdf_book:
toc: false
latex_engine: xelatex
mainfont: Hiragino Kaku Gothic Pro
---
\begin{center}
\underline{学籍番号;                          }
\underline{氏名;                          }
\end{center}
```{r,echo=FALSE}
set.seed(2016)
source("anovakun_480.txt")
```
# 記述統計
1. 名義尺度水準,順序尺度水準,間隔尺度水準,比率尺度水準の例を一つずつ挙げなさい。
+ 名義尺度水準;\vspace{1cm}
+ 順序尺度水準;\vspace{1cm}
+ 間隔尺度水準;\vspace{1cm}
+ 比率尺度水準;\vspace{1cm}
2.\@ref(tab:tbl1)の五人の身長データについて,平均,分散,標準偏差,中央値,最小値を算出しなさい。
```{r tbl1,echo=FALSE}
dat <- matrix(round(rnorm(5,150,20)))
rownames(dat) <- letters[1:5]
colnames(dat) <- "height"
knitr::kable(dat,align="c",caption="五人の身長",booktabs=T)
# mean(dat)
# mean((dat-mean(dat))^2)
# sqrt(mean((dat-mean(dat))^2))
# median(dat)
# min(dat)
```
# 推測統計
## 理論編
1. 第一種の誤りと第二種の誤りを説明しなさい。\vspace{3cm}
2. Zが標準正規分布$N(0,1)$に従うとき,次の値を求めなさい。
+ $P(0 \le Z \le 1.00)$\vspace{1cm}
+ $P(Z \le 0.50)$\vspace{1cm}
+ $P(|Z|\le 1.96)$\vspace{1cm}
3. $2 \times 2$のクロス集計表に対して二変数の独立性を検定したい。検定に使う統計量と帰無仮説を述べなさい。\vspace{3cm}
4. 実験前と実験後で被験者の体重の変化に統計的な差があるかどうかを検定したい。検定に使う統計量と帰無仮説を述べなさい。\vspace{3cm}
5. 今年度のある学校で行った身体測定の結果から,一年生と二年生と三年生の平均身長に差があるかどうかを検定したい。
検定に使う統計量と危険率,帰無仮説を述べなさい。\vspace{3cm}
## 実践編
1. $N=100$のサンプルからピアソンの相関係数$r=0.25$を得た。このとき,$H_0;\rho=0.0$の両側検定をしなさい。有意水準は5\% とする。\vspace{3cm}
2. 大学一年生60人($a_1$)と二年生60人($a_2$)を選び,支持政党について質問したところ、表\@ref(tab:chisq)のデータを得た。このデータを$\chi^2$検定して($\alpha=0.01$),結果を解釈しなさい。
```{r chisq,echo=FALSE}
dat <- matrix(c(31,25,29,35),nrow=2)
colnames(dat) <-c("自民党","民進党")
rownames(dat) <-c("一年生","二年生")
knitr::kable(dat,caption="学年と支持政党の関係",booktabs=T)
# chisq.test(dat)
```
\vspace{4cm}
3. 次の実験計画を間(2)$\times$内(3),のように,要因と水準数,間内の違いがわかるように,記述しなさい。
1. ひまわりの種の成長を,1.水を毎日あたえる,三日おきにあたえる,あたえない,の群と2.肥料をあたえる,与えない,
の群にわけ,それぞれ5つずつ,合計30個のサンプルで測定して,成長の違いを比較する。\vspace{2cm}
2. 各被験者に三つの画像刺激をみせ,映された画像の情報をどれほど記憶しているかどうかのテストをし,その成績の
平均点を比較する\vspace{2cm}
3. ある中学校において,前期,中期,後期の試験成績が伸びるかどうか,また伸びに性別と学年の差はあるかどうかを
比較する。\vspace{2cm}
4. ある授業で10名の学生の学力に差があるかどうかを測るため,二つのクラスでテストを行なった。結果は次の表\@ref(tab:ttest)の通りである。
差があったと言ってよいかどうか,統計的に検定しなさい。検定統計量を記載して報告すること。
```{r ttest,echo=F}
n <- 10
x1 <- round(rnorm(n,50,10))
x2 <- round(rnorm(n,60,5))
# t.test(x1,x2)
tbl<- matrix(rbind(x1,x2),nrow=2,byrow=F)
rownames(tbl) <- c("Group 1","Group 2")
colnames(tbl) <- 1:n
knitr::kable(tbl,caption="二群の比較",booktabs=T)
```
5. ある授業で10名の学生の学力が向上したかどうかを測るため,授業の前後でテストを行なった。\
結果は次の表\@ref(tab:prepost)の通りである。\
授業の効果があったと言ってよいかどうか,統計的に検定しなさい。検定統計量を記載して報告すること。
```{r prepost,echo=F}
library(MASS)
n <- 10
cov = matrix(c(3,2,2,8),nrow=2) # 共分散の設定
dat <- mvrnorm(n,mu=c(32,33),cov) # 共分散と平均値に基づく乱数
pre <- round(dat[,1])
post <- round(dat[,2])
# t.test(pre,post,paired=TRUE,alternative = "greater")
tbl<- matrix(rbind(pre,post),nrow=2,byrow=F)
rownames(tbl) <- c("pre","post")
colnames(tbl) <- rep(paste0("S",1:n))
knitr::kable(tbl,caption="授業の効果",booktabs=T)
```
6. とあるスナック菓子を三人のこどもそれぞれに買い与えたが,お菓子の長さに差があると言って喧嘩を始めた。\
彼らの主張が妥当かどうか検証するために,それぞれの菓子袋から棒状のお菓子10本ずつをサンプリンングし,\
長さを測定したのが次の表\@ref(tab:anova1)である。
三つの菓子袋に含まれるお菓子の長さに差があると言って良いかどうか,統計的に検定しなさい。
検定統計量並びに効果量も報告すること。
```{r anova1,echo=F}
# As
n <- 5
x1 <- round(rnorm(n,10,3))
x2 <- round(rnorm(n,15,3))
x3 <- round(rnorm(n,12,3))
dat <- data.frame(id=1:(3*n),袋=c(rep("A",n),rep("B",n),rep("C",n)),長さ=c(x1,x2,x3))
# anovakun(dat[,-1],"As",3)
knitr::kable(dat,caption="お菓子の長さ",booktabs=T)
```
7. 自分の学級で前期,中期,後期に学力テストを行った。
三回の学力テストは異なる設問だが難易度は同じぐらいであったとする。\
結果を表\@ref(tab:anova2)に示す。三つの時期で学力に違いがあると言って良いか,統計的に検定しなさい。\
検定統計量並びに効果量も報告すること。
```{r anova2,echo=F}
# sA
n <- 10
mu <- c(60,70,80)
sd <- c(10,8,5)
cor = 0.3
cov <- sd %*% t(sd) * cor
diag(cov) <- sd^2
dat <- round(mvrnorm(n,mu,cov))
# anovakun(dat,"sA",3,peta=T)
rownames(dat) <- 1:n
colnames(dat) <- c("前","中","後")
knitr::kable(dat,caption="成績の変化",booktabs=T)
```
\newpage
8. ある学校では二種類のテキストを使って,どちらが成績に良い影響を与えるか検証した。\
テキストはA1,A2の二種類であり,成績は前後の二回で比較する。
5人ずつの学級で検証したところ,表\@ref(tab:anova3)のような結果になった。\
テキストの効果,成績の上昇はあると言って良いか統計的に検定し,どこにどのような効果があったか考察しなさい。
検定統計量並びに効果料も報告すること。
```{r anova3,echo=F}
#AsB
n <- 5 # サンプルサイズ
mu <- c(50,50) # 両群の平均値。最初は同じにしておく
sd <- c(10,10) # 間要因の標準偏差
cor <- 0.5          # 内要因の相関係数
cov <- sd %*% t(sd) * cor # 相関係数を分散に換算して
diag(cov) <- sd^2 # 対角は分散にして
effectA <- 0 # 間要因の効果
effectB <- 0 # 内要因の効果
effectAB <- 15 # 交互作用
mu[1] <- mu[1] + effectB # 内要因(B)の効果が平均に
mu[2] <- mu[2] - effectB # 効果はプラマイゼロになるように
dat1 <- mvrnorm(n,mu,cov)+effectA # それに間要因(A)の効果が入る
dat2 <- mvrnorm(n,mu,cov)-effectA # 効果はプラマイゼロになるように
# 交互作用
dat1[1:n] <- dat1[1:n] + effectAB 
dat2[(n+1):(n*2)] <- dat2[(n+1):(n*2)] + effectAB
dat1[(n+1):(n*2)] <- dat1[(n+1):(n*2)] - effectAB
dat2[1:n] <- dat2[1:n] - effectAB
# まとめあげ
dat <- rbind(dat1,dat2)
dat <- round(dat)
colnames(dat) <- c("前","後")
dat <- data.frame(id=1:(n*2),テキスト=c(rep("A1",n),rep("A2",n)),dat)
# anovakun(dat[,-1],"AsB",2,2)
knitr::kable(dat,caption="テキストと成績の変化",booktabs=T)
```
\newpage
9. ある学級で国語と算数の試験を行った。成績は次の表\@ref(tab:reg)の通りである。このデータに基づいて,各問いに答えなさい。
```{r reg,echo=F}
n <- 20
x1 <- round(rnorm(n,50,10))
y <- round(0.8 * x1 + rnorm(n,0,10))
dat <- data.frame(国語=y,算数=x1)
# summary(lm(国語~算数,data=dat))
knitr::kable(dat,caption="国語と算数の成績",booktabs=T)
```
* 国語と算数の成績の相関係数を求めなさい
* 算数の成績で国語の成績を予測する式を書きなさい
* 算数の成績で国語の成績の分散の何割を説明できるか答えなさい。
* 国語の試験を早退して受けられなかった生徒がいた。この生徒の算数の得点は58点である。回帰式を使ってこの生徒の成績を予測しなさい。
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment