グラフを用いる意味 Ver. 5

表を用いて統計解析の結果を示すと テキストベースになるため,データ全体をすばやく理解することは困難である.わかりづらいという欠点から,表は エビデンス(科学的な証拠)を示す方法としてとても弱い方法ということになる.テキストでデータを示す表と比べて,イラストで示すグラフを使ったほうが,統計解析結果を理解しやすくなります.

多重検定の結果をグラフで示す

生データとともに Tukey – Kramer 多重検定の結果を示した表を示す.

次に,Tukey – Kramer 多重検定の結果をグラフで示す.

グラフのほうが対照,処理 A,処理 B の平均,標準誤差および多重検定の結果を可視的にとられることができる.なお,このグラフは生物学の古典的な形式で書いている.ビジネスではグラフの説明は簡略化して示すことが多いのであるが,統計解析の結果については,このグラフにように必要なすべての情報を示しすほうがよい.

標準誤差と標準偏差の誤差線についての問題

上の左のグラフは誤差線として標準誤差を使っている.標準誤差は統計解析した結果の精度を示している.標準誤差は対象とする集団からデータを複数取り平均を算出することを反復し,平均の標準偏差を算出する方法である.つまり,平均値の標準偏差になるのであるから,標準誤差は標準偏差よりも小さくなる.標準誤差を用いたグラフと比べると,標準偏差を用いたグラフでは誤差線が短いため精度の高いデータであるように見える.

精度が高く見えるグラフを作成するためだけに,標準誤差を誤差線として選択するのは,正しい行為ではない.そのような理由だけで,標準偏差でなく標準誤差を選択している,論文もあることは事実である.対象とする集団そのもののばらつきを示す場合には,見栄えが悪くとも標準偏差を選ぶべきである.

まとめ

(1) 統計解析の結果はグラフで示す.

(2) グラフには,データの数,統計解析法,算出した統計量などを可能な限り示す.

(3) 標準誤差は標準偏差よりも小さい値を示すので,誤差線として標準誤差を使用すると信頼性があるように見えてしまう.

このブログを書いている人

●元●●●大学大学院 ●●研究科 講師  博士(農学)
●生物統計学・情報処理演習を 20 年くらい 担当.
●専門分野 野菜園芸学 生物統計学
・植物組織培養を用いた苗生産
・リアルタイム PCR を用いた遺伝子発現解析
・ドローン撮影画像を用いた識別 AI 構築
・Python・R・エクセル・パワーポイント を用いた統計解析

生物統計学のひとをフォローする
解説