標準偏差 Ver. 7

2024.05.192024.06.04

標準偏差はデータのばらつき程度を示す指標となる基本統計量である⁽¹⁾．標準偏差は正規分布していないデータでも使用することができる⁽²⁾．私自身も『正規分布していない可能性のあるデータには標準偏差は使えない』と誤解していた．

⁽¹⁾Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学　1983 共立出版　P.49

⁽²⁾石居　進生物統計学入門 1975 培風館 P.23

上述の誤解は，データが正規分布しているときには，データの約68%が平均から1標準偏差以内、約95%が2標準偏差以内、約99.7%が3標準偏差以内に収まる ^{(1),(2),(3),(4),(5),(6)}ということが，必ず統計解析の書籍には示されていることによると考えている．

⁽¹⁾Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学1983 共立出版 P.61 – 115

⁽²⁾ 生物統計学入門　　培風館　1975 年　P.36 – 64

⁽³⁾清水信博もう悩まない！論文が書ける統計 2004 オーエムエス出版 P.13 -28

⁽⁴⁾池田郁男改訂増補版：統計検定を理解せずに使っている人のために Ⅰ　2019 化学と生物 57(8)

⁽⁵⁾上田鋼平　第 7 回　推測の基準　2023 監修・執筆　板巻顕太郎　篠崎智大生物統計学の道標　研究デザインから論文報告までをより深く理解するための24 講一般社団法人厚生労働統計協会 P.56 – 67

⁽⁶⁾ 川瀬雅也・松田史生生命科学・生物工学のための間違いから学ぶ実践統計解析　R・Python によるデータ処理事始め　2024 日本生物工学会編近代科学社 Digital 2021 年 P.18- 39

標準偏差は各データの平均からのばらつきを示す指標である．標準偏差が大きいほどデータが平均値から広くばらついていることを示す．

# R による標準偏差

library(readxl)

library(writexl)

# エクセルファイルのパスを設定（デスクトップにある “data.xlsx” ファイルを想定）

file_path <-“C:/Users/a56f3/Desktop/data.xlsx”

# エクセルファイルの読み込み

df <- read_excel(file_path)

# 最初の列のデータを使用して標準偏差と平均を計算

data <- df[[1]] # 最初の列を使用

std_dev <- sd(data)

mean_val <- mean(data)

# 結果をデータフレームにまとめる

result_df <- data.frame(Metric = c(“Standard Deviation”, “Mean”), Value = c(std_dev, mean_val))

# 結果を新しいシートに書き込む

write_xlsx(list(“Results” = result_df), path = file_path, col_names = TRUE)

print(“標準偏差と平均がエクセルファイルに書き込まれました。”)

標準偏差は平均 ± 標準偏差　で表す．

今回の結果はエクセルの sheet2 に以下のように表示される．

したがって，48.6 ± 3.5 と表記することになる．なお，標準偏差は SD と略して示される．

(1) 標準偏差はデータのばらつき程度を示す指標となる基本統計量である．

(2) 標準偏差は正規分布していないデータでも利用できる．

(3) 標準偏差は SD として略され，平均 ± 標準偏差で表記される．例 48.6 ± 3.5