正規分布であることの検定 Ver. 9

2024.05.142024.06.04

分析・観察して得たデータが『正規分布しているかどうかを確かめること』⁽¹⁾ ^,(2)は統計解析のステップ 3 である．ステップ 1 は『特性が均一の個体を選ぶこと』，ステップ 2 は『外れ値を除去すること』になる．

⁽¹⁾ Robert R. Sokal, F. James Rohlf 藤井宏一(訳) 生物統計学　1983 共立出版 P.106

⁽²⁾ 池田郁男改訂増補版：統計検定を理解せずに使っている人のために Ⅰ2019 化学と生物 57(8) P.498

正規分布しているかどうかを検定する主なものには，シャピロ・ウィルクス検定，コスモゴロフ・スミルノフ検定，アンダーソン・ダーリング検定などがある．これらの特性を以下に示す．

# Python によるコルモゴロフ・スミルノフ検定

import pandas as pd

from scipy.stats import kstest

from openpyxl import load_workbook

# エクセルファイルのパスを指定

file_path = ‘C:/Users/あなたのファイル/Desktop /data.xlsx’

# エクセルファイルの読み込み

df = pd.read_excel(file_path)

# コルモゴロフ・スミルノフ検定の実行

data = df.iloc[:, 0] # 最初の列を使用

stat, p_value = kstest(data, ‘norm’)

# 検定結果の作成

result_df = pd.DataFrame({

‘Test’: [‘Kolmogorov-Smirnov’],

‘Statistic’: [stat],

‘p-value’: [p_value]

})

# 正規性の判断

if p_value < 0.05:

conclusion = “データは正規分布に従っていないと判断されます。”

else:

conclusion = “データは正規分布に従っていると判断されます。”

# 検定結果に判断を追加

result_df[‘Conclusion’] = [conclusion]

# 結果を新しいシートに書き込む

with pd.ExcelWriter(file_path, engine=’openpyxl’, mode=’a’) as writer:

result_df.to_excel(writer, sheet_name=’KS_Test_Result’, index=False)

print(“コルモゴロフ・スミルノフ検定の結果がエクセルファイルに書き込まれました。”)

●検定結果のエクセル sheet を以下に示す．

ステップ 1 『特性が均一の個体を選ぶ』

ステップ 2 『得られたデータから外れ値を除去する』

ステップ 3 『データに対して正規分布であるかの検定をし，データが正規分布をするかどうかを判断する』

これらの後に統計解析をおこなうこと．