学生係数の計算。 古典的な統計手法: スチューデントの t 検定

テスト結果を解釈するための同等のアプローチは、帰無仮説が真であると仮定することです。どの程度の大きさであるかを計算できます。 確率得る t- 利用可能なサンプル データから計算した実際の値以上の基準。 この確率が以前に受け入れられた有意水準 (たとえば、P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

11 人の女性の 1 日の食事からのエネルギー摂取量 (kJ/日) に関するデータがあるとします (書籍からの例) Altman D. G. (1981) 医学研究のための実践統計、チャップマン & ホール、ロンドン):


これら 11 個の観測値の平均は次のとおりです。


質問: このサンプルの平均は、確立された基準である 7725 kJ/日とは異なりますか? 私たちのサンプル値とこの標準との差は非常に大きく、7725 - 6753.6 = 971.4 です。 しかし、この違いは統計的にどれくらい大きいのでしょうか? 1 つのサンプルがこの質問の答えに役立ちます。 t-テスト。 他のオプションと同様に t-test、t.test() 関数を使用して、R で 1 サンプルの t テストが実行されます。


質問: これらの平均は統計的に異なりますか? を使って差がないという仮説を検証してみましょう t-テスト:

しかし、そのような場合、介入による効果の有無を統計的にどのように評価すればよいのでしょうか? 一般に、Student の t 検定は次のように表すことができます。

学生分布表

確率積分テーブルは、無限に大きな母集団からの大きなサンプルに使用されます。 でもすでに (n)< 100 получается Несоответствие между

表形式のデータと限界確率。 (n)で< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

大規模なサンプルの一般的な特性からのサンプル指標の偏差の分布は常に正規であることが判明するため、一般母集団は重要ではありません。

名目。 サンプル数が少ない場合 (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

正規分布を持つ人口。 少数サンプルの理論は、20 世紀初頭にイギリスの統計学者 W. ゴセット (スチューデントというペンネームで執筆) によって開発されました。 で

1908 年に、彼はサンプルが小さい場合でも (t) と信頼確率 F(t) を相関させることができる特別な分布を構築しました。 (n) > 100 の場合、スチューデント分布表は 30 のラプラス確率積分表と同じ結果を返します。< (n ) <

100 個の違いは無視できる程度です。 したがって、実質的に小さいサンプルには、体積が 30 単位未満のサンプルが含まれます (もちろん、体積が 100 単位を超えるサンプルは大きいとみなされます)。

調査対象となる母集団の性質により、少数のサンプルが使用される場合があります。 したがって、繁殖作業では、少数の数で「純粋な」経験を達成するのが簡単です

プロット。 経済的コストに関連する生産および経済実験も少数の試行で実行されます。 すでに述べたように、サンプルが小さい場合、一般平均の信頼確率と信頼限界の両方は、正規分布した母集団についてのみ計算できます。

スチューデント分布の確率密度は関数で記述されます。

1 + t2

f (t ,n) := Bn

n − 1

t - 現在の変数; n - サンプルサイズ。

B は (n) のみに依存する量です。

スチューデント分布にはパラメータが 1 つだけあります: (d.f.) - 自由度の数 ((k) と表記されることもあります)。 この分布は、通常の分布と同様、点 (t) = 0 に関して対称ですが、より平坦です。 サンプルサイズが増加し、その結果として自由度の数が増加すると、スチューデント分布は急速に正規分布に近づきます。 自由度の数は、分散する必要がある個々の特徴値の数に等しい

必要な特性を決定すると仮定します。 したがって、分散を計算するには、平均値がわかっている必要があります。 したがって、分散を計算するときは、(d.f.) = n - 1 を使用します。

学生分布表は 2 つのバージョンで公開されています。

1. 確率積分表と同様に、値( t ) および対応する

さまざまな自由度の現在の確率 F(t)。

2. 値(t)は、最も一般的に使用される信頼確率として与えられます。

0.70; 0.75; 0.80; 0.85; 0.90; 0.95 と 0.99、または 1 - 0.70 = 0.3; 1 - 0.80 = 0.2; …… 1 - 0.99 = 0.01。

3. 異なる自由度で。 この種の表は付録に記載されています

(表 1 - 20)、および値 (t) - 有意水準 0.7 でのスチューデントの検定

最も有名な統計ツールの 1 つは、Student の t 検定です。 これは、さまざまなペアごとの量の統計的有意性を測定するために使用されます。 Microsoft Excel には、この指標を計算するための特別な関数があります。 Excel で Student の t 検定を計算する方法を学びましょう。

まずは、Student の t 検定が一般的に何なのかを見てみましょう。 このインジケーターは、2 つのサンプルの平均値が等しいことを確認するために使用されます。 つまり、2 つのデータ グループ間の差異の重要性を判断します。 同時に、この基準を決定するために一連の方法が使用されます。 インジケーターは、片側または両側の分布を考慮して計算できます。

Excel でのインジケーターの計算

それでは、Excel でこの指標を計算する方法の問題に直接移りましょう。 関数を通じて実行できます 学生テスト。 2007 以前のバージョンの Excel では、この名前は テスト。 ただし、互換性を確保するために後のバージョンにも残されましたが、それでもより新しいバージョンを使用することが推奨されています。 学生テスト。 この機能は 3 つの方法で使用できます。詳細については以下で説明します。

方法 1: 関数ウィザード

この指標を計算する最も簡単な方法は、関数ウィザードを使用することです。


計算が実行され、結果が画面上の事前に選択されたセルに表示されます。

方法 2: [数式] タブを使用する

関数 学生テストタブに移動して呼び出すこともできます 「公式」リボンの特別なボタンを使用します。


方法 3: 手動入力

学生テストワークシート上の任意のセルまたは関数行に手動で入力することもできます。 その構文形式は次のようになります。

STUDENT TEST(配列1,配列2,尾,型)

最初のメソッドを分析するときに、各引数が何を意味するかが考慮されました。 これらの値をこの関数に代入する必要があります。

データを入力したら ボタンを押してください 入力結果を画面に表示します。

ご覧のとおり、Excel で学生のテストを計算するのは非常に簡単かつ迅速です。 重要なことは、計算を実行するユーザーが、自分が何者であり、どの入力データが何の責任を負うのかを理解する必要があるということです。 プログラム自体が直接計算を実行します。

対応のあるスチューデントの t 検定は、スチューデントの方法の修正版の 1 つで、対応のある (反復された) 測定値の差の統計的有意性を判断するために使用されます。

1. t検定開発の歴史

t検定が開発されました ウィリアム・ゴセットギネス会社のビールの品質を評価するため。 営業秘密の非開示に関する会社への義務により、ゴセットの論文は 1908 年に「Student」というペンネームでジャーナル Biometrics に掲載されました。

2. 対応のある Student の t 検定は何に使用されますか?

比較には対応のあるスチューデントの t 検定が使用されます 2 つの依存 (ペア) サンプル。 依存とは、同じ患者で異なる時点で行われた測定値です。たとえば、高血圧患者の血圧などです。 前後降圧薬を服用している。 帰無仮説は、比較されるサンプル間に差がないことを示し、対立仮説は、統計的に有意な差があることを示します。

3. 対応のある Student の t 検定はどのような場合に使用できますか?

主な条件は、 サンプルの依存関係つまり、比較される値は、1 つのパラメータの繰り返し測定から取得する必要があります。

独立したサンプルの比較の場合と同様、対応のある t 検定を使用するには、元のデータが 正規分布。 この条件が満たされない場合は、サンプル平均を比較する方法を使用する必要があります。 ノンパラメトリック統計、 のような Gサインテストそして ウィルコクソン T 検定.

対応のある t 検定は、比較する場合にのみ使用できます。 サンプル。 比較する必要がある場合 3つ以上繰り返し測定を使用する必要があります 反復測定の一元配置分散分析.

4. 対応のある Student の t 検定を計算するにはどうすればよいですか?

対応のあるスチューデントの t 検定は、次の式を使用して計算されます。

どこ MD - 前後で測定された指標間の差の算術平均、 σ d - 指標の差の標準偏差、 n - 勉強した科目の数。

5. スチューデントの t 検定値をどう解釈するか?

結果として得られる対応のあるスチューデントの t 検定値の解釈は、無関係な母集団の t 検定の評価と変わりません。 まず第一に、自由度の数を見つける必要があります f 次の式によると:

f = n - 1

この後、必要な有意水準に対するスチューデントの t 検定の臨界値を決定します (たとえば、p<0,05) и при данном числе степеней свободы f 表によると( 以下を参照してください).

基準の重要な値と計算された値を比較します。

  • 対応のあるスチューデントの t 検定の計算値が 同等以上重要な点が表から判明したため、比較した値間の差異は統計的に有意であると結論付けられます。
  • 計算された対応のあるスチューデントの t 検定の値が 少ない表形式。これは、比較された値間の差異が統計的に有意ではないことを意味します。

6. Studentのt検定の計算例

新しい血糖降下剤の有効性を評価するため、糖尿病患者の血糖値を服用前後で測定した。 その結果、以下のようなデータが得られました。

解決:

1. 値の各ペアの差を計算します( d):

患者N 血糖値、mmol/l 差分(d)
薬を服用する前に 薬を服用した後
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. 次の式を使用して差の算術平均を求めます。

3. 次の式を使用して、平均からの差の標準偏差を求めます。

4. 対応のある Student の t 検定を計算します。

5. Student の t 検定 8.6 で得られた値を、自由度の数を含むテーブルの値と比較してみましょう。 f 10 - 1 = 9 に等しく、有意水準 p=0.05 は 2.262 です。 得られた値は臨界値よりも大きいため、新薬の服用前後の血糖値には統計的に有意な差があると結論付けられます。

この基準は、ギネス会社でビールの品質を評価するためにウィリアム ゴセットによって開発されました。 営業秘密の不開示に関する会社への義務(ギネス経営陣は業務における統計装置の使用をそのようなものだとみなしていた)に関連して、ゴセットの論文は1908年に「Student」というペンネームでジャーナル「バイオメトリクス」に掲載された。

データ要件

この基準を適用するには、元のデータが正規分布を持っている必要があります。 独立したサンプルに対して 2 サンプル検定を適用する場合は、分散の等しさの条件にも従う必要があります。 ただし、分散が等しくない状況では、Student の t 検定に代わる方法があります。

独立したサンプルの 2 サンプル t 検定

サンプル サイズがわずかに異なる場合は、近似計算の簡略化された式が使用されます。

サンプル サイズが大幅に異なる場合は、より複雑で正確な式が使用されます。

どこ M 1 ,M 2 - 算術平均、σ 1、σ 2 - 標準偏差、および N 1 ,N 2 - サンプルサイズ。

依存サンプルの 2 サンプル t 検定

2 つの依存サンプル (たとえば、時間間隔のある同じテストの 2 つのサンプル) 間の差異に関する仮説を検定する状況で t 検定の経験値を計算するには、次の式が使用されます。

どこ M dは値の平均差であり、σは d- 差の標準偏差。

自由度の数は次のように計算されます。

1 サンプルの t 検定

平均値と既知の値との差に関する仮説をテストするために使用されます。

自由度の数は次のように計算されます。

ノンパラメトリック類似体

独立したサンプルに対する 2 サンプル検定の類似物は、マン-ホイットニー U 検定です。 依存サンプルのある状況の場合、類似物は符号検定とウィルコクソン T 検定です。

Studentのt検定の自動計算


ウィキメディア財団。

  • 2010年。
  • 地球化学貯留層

他の辞書で「Student's T-test」が何であるかを確認してください。

    学生の t-c テスト- 生徒の基準または t c。 または S.t 検定は、比較された平均間の差の有意性に関する統計的基準です。 この差と差誤差の比率によって決定されます: t の値について... ... 遺伝学。 百科事典

    学生の t 検定- Student の t 検定は、Student 分布との比較に基づいて仮説を統計的に検定する方法 (統計検定) のクラスの一般名です。 t 検定を使用する最も一般的なケースは、等価性の確認に関連しています... ... Wikipedia

    学生の t 検定- ステータスを確認して、スカートモ タープ ヴィドゥルキシュ パティキムモ ロディクリス、スカートスカート イル ジョ パクレイドス サンティキウを確認してください。 アティティクメニス:英語。 学生のテストラス。 学生の t テスト... ジェムスはアウガルの選択を決定し、最終的には決定を下します

    学生の t 検定- 帰無仮説の仮定の下で、使用される統計が t 分布 (スチューデント分布) に対応する統計検定。 注記。 この基準の適用例は次のとおりです。 1. 平均値が等しいかどうかを確認します... ... 社会統計辞典

    学生の基準- 任意の特性について、2つの動物グループの平均値(M1とM2)を相互に比較したときの差(td)の信頼性を示す生体指標。 差の信頼性は次の式で決定されます。 結果の td 値は次と比較されます... ... 家畜の育種、遺伝学、生殖に使用される用語と定義

    学生の基準- (所定の有意水準で) ランダムとして分類されるかどうかの観点から 2 つの平均値の近さを評価し、平均値が互いに統計的に有意に異なるかどうかという質問に答えます)