Skip to content

Instantly share code, notes, and snippets.

@hirokihello
Last active May 8, 2020 07:41
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save hirokihello/3ba0ce9926614d82b524ba34c8eecdda to your computer and use it in GitHub Desktop.
Save hirokihello/3ba0ce9926614d82b524ba34c8eecdda to your computer and use it in GitHub Desktop.
* 分布の中心的な位置を表す代表値(平均値など)
* 分布の広がりの程度を表す散布度(偏差など)
#### 分布の代表値
代表値・・・その分布の特徴を表す記述的指標として最も基本
代表値に何を使うか→代表値としての適切さをどのようにするのかで左右sれる。
中央値→分布に含まれる各値に最も近い値(Med)
平均値→外れ値の影響を受けやすい指標
分布の両端から行って数の値を除いた上で求める調整平均
#### 散布度
分布の広がりの程度を表す散布度
<img src="https://latex.codecogs.com/gif.latex?\int_a^bf(x)dx" />
観測項目(変量・変数)
通常数値で表される。または数値に変換する。
変数の種類
* 物差し場の違い=質量変数(数量型データ・量的データ・量的変数)
* ラベルの違い=質的変数(カテゴリー型データ・質的データ・質的変数)
量的変数→観測対象の特徴を感覚が等しい数値で表したもの(身長体重温度など)
質的変数→観測対象の特徴を分類によって表したもの(性別など)
独立変数と従属変数
独立変数(影響を与える変数)→従属変数(独立変数の変化によって影響を受ける変数)
データフレーム
→Rのデータの形式
Rのリスト(ベクトルの集まり)の特殊な形式
Rのリストは文字列・数値を混在させることが可能
リストは
リストとベクトルは違うのか...
なるほどここをごちゃごちゃにしていたからだめだった。
as.data.frame(list(数字=c(2, 7), 文字=("a", "f")))
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment