標準誤差 Ver. 8

多くの統計解析に関する書籍あるいはネットでの解説において,標準誤差はあいまいな表現がされている.その原因は,数学的に正確な表現をしているからである.このブログでは生物統計学を基礎としての標準誤差の解説していく.

生物統計学として標準誤差の解説

① 対象とする集団からデータをとるサンプルを たとえば 10 個選ぶ.

② この 10 個のサンプルを分析してそれぞれのデータを得る.

③ これら 10 個のデータから平均を算出する.

④ ① ~ ③ の操作を たとえば 5 回 繰り返す.

⑤ 平均が 5 つ 得られる.この 5 つの平均から標準偏差を算出する.

⑥ 得られた 標準偏差 が 標準誤差になる.

標準誤差はサンプルサイズ を同じにして平均を算出し,その平均が母集団の平均からどれだけばらつくかを表した基本統計量ということになる(1).これに対して標準偏差は,母集団の平均からデータが どれだけ ばらついているか を表す.

(1) Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学 1983 共立出版 P125

処理によってどれだけの影響があったかを示す場合は,(1)処理のデータを分析することを,(2)反復し,(3)得られた複数の平均から,(4)標準偏差を算出することにより,その分析の精度を示す必要がある.この操作は標準誤差を算出する操作と同じことになる.

生物統計学的にいえば,標準誤差は分析・観察の精度を示す基本統計量ということになる(1)標準偏差は 母集団の平均からデータが どれだけ ばらついているか を示すものであるから,母集団がどれくらいばらついているかを示したいときに利用する基本統計量ということになる.

(1) 池田郁男 改訂増補版:統計検定を理解せずに使っている人のために Ⅱ 化学と生物 57(9)

いまだに標準誤差あるいは標準偏差を示さない研究者がいる

ゼミでの研究成果の発表でも標準誤差あるいは標準偏差を示す必要がある.大企業の研究者が 標準誤差くらいは表記せよ と学会発表の座長から指導された現場に遭遇したこと がある.私が属していた農学系の学会は統計解析をすることを当然としているが,それでもこのような事態を経験することもあった.

最近は,ビックデータあるいは 生成 AI が話題になっていることもあり,ネットを検索するとこのブログのように統計解析に関するものがたくさんかかってくるようになった.統計解析が広く社会に知られ,すべての分野で統計解析の結果から考察がなされるようになることは筆者にとっての願いである.しかし,統計解析が社会に認知されているとは言えない現実があると考えている.

R スクリプトによる標準誤差の算出

# R による標準誤差の算出

library(readxl)

library(openxlsx)

# エクセルファイルのパスを設定(デスクトップにある “data.xlsx” ファイルを想定)

file_path <- “C:/Users/あなたのファイル/Desktop/data.xlsx”

# エクセルファイルの読み込み

df <- read_excel(file_path)

# 最初の列のデータを使用して標準偏差、平均、および標準誤差を計算

data <- df[[1]]  # 最初の列を使用

std_dev <- sd(data)

mean_val <- mean(data)

std_err <- std_dev / sqrt(length(data))

# 結果をデータフレームにまとめる

result_df <- data.frame(Metric = c(“Mean”, “Standard Deviation”, “Standard Error”),

                        Value = c(mean_val, std_dev, std_err))

# 既存のエクセルファイルを読み込む

wb <- loadWorkbook(file_path)

# 新しいシートを追加して結果を書き込む

addWorksheet(wb, “Results”)

writeData(wb, sheet = “Results”, x = result_df)

# ファイルを保存

saveWorkbook(wb, file_path, overwrite = TRUE)

print(“平均、標準偏差、および標準誤差がエクセルファイルに書き込まれました。”)

▶ R スクリプトで算出された結果を以下に示す.

標準誤差は SE と略することが多い.上の結果では誤差は 48.6 ± 3.4 と表記することになる.

まとめ

(1) 標準誤差は処理の影響など分析・観察の精度を示したいときに用いる.

(2) 標準誤差は 平均 ± 標準誤差 で示す.例 48.6 ± 3.4

(3) 標準誤差と標準偏差のちがいを説明できる研究者・技術者はすくない

このブログを書いている人

●元●●●大学大学院 ●●研究科 講師  博士(農学)
●生物統計学・情報処理演習を 20 年くらい 担当.
●専門分野 野菜園芸学 生物統計学
・植物組織培養を用いた苗生産
・リアルタイム PCR を用いた遺伝子発現解析
・ドローン撮影画像を用いた識別 AI 構築
・Python・R・エクセル・パワーポイント を用いた統計解析

生物統計学のひとをフォローする
解説