Расчет коэффициента стьюдента. Классические методы статистики: t-критерий Стьюдента

Эквивалентным подходом к интерпретации результатов теста будет следующий: допустив, что нулевая гипотеза верна, мы можем рассчитать, насколько велика вероятность получить t -критерий, равный или превышающий то реальное значение, которое мы рассчитали по имеющимся выборочным данным. Если эта вероятность оказывается меньше, чем заранее принятый уровень значимости (например, Р < 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Предположим, у нас имеются данные по суточному потреблению энергии, поступающей с пищей (кДж/сутки), для 11 женщин (пример заимствован из книги Altman D. G. (1981) Practical Statistics for Medical Research , Chapman & Hall, London ):


Среднее значение для этих 11 наблюдений составляет:


Вопрос: отличается ли это выборочное среднее значение от установленной нормы в 7725 кДж/сутки? Разница между нашим выборочным значением и этим нормативом довольно прилична: 7725 - 6753.6 = 971.4. Но насколько велика эта разница статистически? Ответить на этот вопрос поможет одновыборочный t -тест. Как и другие варианты t -теста, одновыборочный тест Стьюдента выполняется в R при помощи функции t.test() :


Вопрос: различаются ли эти средние значения статистически? Проверим гипотезу об отсутствии разницы при помощи t -теста:

Но как в таких случаях оценить наличие эффекта от воздействия статистически? В общем виде критерий Стьюдента можно представить как

Таблица распределения Стьюдента

Таблицы интеграла вероятностей используются для выборок большого объема из бесконечно большой генеральной совокупности. Но уже при (n ) < 100 получается Несоответствие между

табличными данными и вероятностью предела; при (n ) < 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

ральной совокупности не имеет значения, так как распределение отклонений выборочного показателя от генеральной характеристики при большой выборке всегда оказывается нормаль-

ным. В выборках небольшого объема (n ) < 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

вокупности, имеющей нормальное распределение. Теория малых выборок разработана английским статистиком В. Госсетом (писавшим под псевдонимом Стьюдент) в начале XX в. В

1908 г. им построено специальное распределение, которое позволяет и при малых выборках соотносить (t ) и доверительную вероятность F(t ). При (n ) > 100, таблицы распределения Стьюдента дают те же результаты, что и таблицы интеграла вероятностей Лапласа, при 30 < (n ) <

100 различия незначительны. Поэтому практически к малым выборкам относят выборки объемом менее 30 единиц (безусловно, большой считается выборка с объемом более 100 единиц).

Использование малых выборок в ряде случаев обусловлено характером обследуемой совокупности. Так, в селекционной работе «чистого» опыта легче добиться на небольшом числе

делянок. Производственный и экономический эксперимент, связанный с экономическими затратами, также проводится на небольшом числе испытаний. Как уже отмечалось, в случае малой выборки только для нормально распределенной генеральной совокупности могут быть рассчитаны и доверительные вероятности, и доверительные пределы генеральной средней.

Плотность вероятностей распределения Стьюдента описывается функцией.

1 + t2

f (t ,n) := Bn

n − 1

t - текущая переменная;n - объем выборки;

B - величина, зависящая лишь от (n ).

Распределение Стьюдента имеет только один параметр: (d.f. ) -число степеней свободы (иногда обозначается (к )). Это распределение - как и нормальное, симметрично относительно точки (t ) = 0, но оно более пологое. При увеличении объема выборки, а, следовательно, и числа степеней свободы распределение Стьюдента быстро приближается к нормальному. Число степеней свободы равно числу тех индивидуальных значений признаков, которыми нужно рас-

полагать для определения искомой характеристики. Так, для расчета дисперсии должна быть известна средняя величина. Поэтому при расчете дисперсии применяют (d.f. )= n - 1 .

Таблицы распределения Стьюдента публикуются в двух вариантах:

1. аналогично таблицам интеграла вероятностей приводятся значения (t ) и соответствую-

щие вероятности F(t ) при разном числе степеней свободы;

2. значения (t ) приводятся для наиболее употребляемых доверительных вероятностей

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 и 0,99 или для 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 - 0,99 = 0,01.

3. при разном числе степеней свободы. Такого рода таблица приведена в приложении

(Таблица 1 - 20 ), а также значение (t )- критерий Стьюдента при уровне значимости от0,7

Одним из наиболее известных статистических инструментов является критерий Стьюдента. Он используется для измерения статистической значимости различных парных величин. Microsoft Excel обладает специальной функцией для расчета данного показателя. Давайте узнаем, как рассчитать критерий Стьюдента в Экселе.

Но, для начала давайте все-таки выясним, что представляет собой критерий Стьюдента в общем. Данный показатель применяется для проверки равенства средних значений двух выборок. То есть, он определяет достоверность различий между двумя группами данных. При этом, для определения этого критерия используется целый набор методов. Показатель можно рассчитывать с учетом одностороннего или двухстороннего распределения.

Расчет показателя в Excel

Теперь перейдем непосредственно к вопросу, как рассчитать данный показатель в Экселе. Его можно произвести через функцию СТЬЮДЕНТ.ТЕСТ . В версиях Excel 2007 года и ранее она называлась ТТЕСТ . Впрочем, она была оставлена и в позднейших версиях в целях совместимости, но в них все-таки рекомендуется использовать более современную — СТЬЮДЕНТ.ТЕСТ . Данную функцию можно использовать тремя способами, о которых подробно пойдет речь ниже.

Способ 1: Мастер функций

Проще всего производить вычисления данного показателя через Мастер функций.


Выполняется расчет, а результат выводится на экран в заранее выделенную ячейку.

Способ 2: работа со вкладкой «Формулы»

Функцию СТЬЮДЕНТ.ТЕСТ можно вызвать также путем перехода во вкладку «Формулы» с помощью специальной кнопки на ленте.


Способ 3: ручной ввод

Формулу СТЬЮДЕНТ.ТЕСТ также можно ввести вручную в любую ячейку на листе или в строку функций. Её синтаксический вид выглядит следующим образом:

СТЬЮДЕНТ.ТЕСТ(Массив1;Массив2;Хвосты;Тип)

Что означает каждый из аргументов, было рассмотрено при разборе первого способа. Эти значения и следует подставлять в данную функцию.

После того, как данные введены, жмем кнопку Enter для вывода результата на экран.

Как видим, вычисляется критерий Стьюдента в Excel очень просто и быстро. Главное, пользователь, который проводит вычисления, должен понимать, что он собой представляет и какие вводимые данные за что отвечают. Непосредственный расчет программа выполняет сама.

​ Парный t-критерий Стьюдента – одна из модификаций метода Стьюдента, используемая для определения статистической значимости различий парных (повторных) измерений.

1. История разработки t-критерия

t-критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

2. Для чего используется парный t-критерий Стьюдента?

Парный t-критерий Стьюдента используется для сравнения двух зависимых (парных) выборок . Зависимыми являются измерения, выполненные у одних и тех же пациентов, но в разное время, например, артериальное давление у больных гипертонической болезнью до и после приема антигипертензивного препарата. Нулевая гипотеза гласит об отсутствии различий между сравниваемыми выборками, альтернативная - о наличии статистически значимых различий.

3. В каких случаях можно использовать парный t-критерий Стьюдента?

Основным условием является зависимость выборок , то есть сравниваемые значения должны быть получены при повторных измерениях одного параметра.

Как и в случае сравнения независимых выборок, для применения парного t-критерия необходимо, чтобы исходные данные имели нормальное распределение . При несоблюдении этого условия для сравнения выборочных средних должны использоваться методы непараметрической статистики , такие как G-критерий знаков и Т-критерий Вилкоксона .

Парный t-критерий может использоваться только при сравнении двух выборок. Если необходимо сравнить три и более повторных измерений, следует использовать однофакторный дисперсионный анализ для повторных измерений .

4. Как рассчитать парный t-критерий Стьюдента?

Парный t-критерий Стьюдента рассчитывается по следующей формуле:

где М d - средняя арифметическая разностей показателей, измеренных до и после, σ d - среднее квадратическое отклонение разностей показателей, n - число исследуемых.

5. Как интерпретировать значение t-критерия Стьюдента?

Интерпретация полученного значения парного t-критерия Стьюдента не отличается от оценки t-критерия для несвязанных совокупностей. Прежде всего, необходимо найти число степеней свободы f по следующей формуле:

f = n - 1

После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p<0,05) и при данном числе степеней свободы f по таблице (см. ниже ).

Сравниваем критическое и рассчитанное значения критерия:

  • Если рассчитанное значение парного t-критерия Стьюдента равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми величинами.
  • Если значение рассчитанного парного t-критерия Стьюдента меньше табличного, значит различия сравниваемых величин статистически не значимы.

6. Пример расчета t-критерия Стьюдента

Для оценки эффективности нового гипогликемического средства были проведены измерения уровня глюкозы в крови пациентов, страдающих сахарным диабетом, до и после приема препарата. В результате были получены следующие данные:

Решение:

1. Рассчитаем разность каждой пары значений (d ):

N пациента Уровень глюкозы в крови, ммоль/л Разность значений (d)
до приема препарата после приема препарата
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Найдем среднюю арифметическую разностей по формуле:

3. Найдем среднее квадратическое отклонение разностей от средней по формуле:

4. Рассчитаем парный t-критерий Стьюдента:

5. Сравним полученное значение t-критерия Стьюдента 8.6 с табличным значением, которое при числе степеней свободы f равном 10 - 1 = 9 и уровне значимости p=0.05 составляет 2.262. Так как полученное значение больше критического, делаем вывод о наличии статистически значимых различий содержания глюкозы в крови до и после приема нового препарата.

История

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс . В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение . В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий . Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Двухвыборочный t-критерий для независимых выборок

В случае с незначительно отличающимся размером выборки применяется упрощённая формула приближенных расчётов:

В случае, если размер выборки отличается значительно, применяется более сложная и точная формула:

Где M 1 ,M 2 - средние арифметические, σ 1 ,σ 2 - стандартные отклонения, а N 1 ,N 2 - размеры выборок.

Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t-критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

где M d - средняя разность значений, а σ d - стандартное отклонение разностей.

Количество степеней свободы рассчитывается как

Одновыборочный t-критерий

Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения :

Количество степеней свободы рассчитывается как

Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна-Уитни . Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона

Автоматический расчет t-критерия Стьюдента


Wikimedia Foundation . 2010 .

  • Гиннесс
  • Геохимический резервуар

Смотреть что такое "T-критерий Стьюдента" в других словарях:

    Критерий Стьюдента t-к - Критерий Стьюдента, t к. * крытэрый Ст’юдэнта, t к. * Student’s criterion or t c. or S. t test статистический критерий существенности разности между сравниваемыми средними. Определяется отношением этой разности к ошибке разности: При значениях t… … Генетика. Энциклопедический словарь

    Критерий Стьюдента - t критерий Стьюдента общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t критерия связаны с проверкой равенства… … Википедия

    критерий Стьюдента - Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: angl. Student’s test rus. критерий Стьюдента … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    критерий Стьюдента - Статистический критерий, в котором, в предположении нулевой гипотезы, используемая статистика соответствует t распределению (распределению Стьюдента). Примечание. Вот примеры применения этого критерия: 1. проверка равенства среднего из… … Словарь социологической статистики

    КРИТЕРИЙ СТЬЮДЕНТА - Биометрический показатель достоверности разницы (td) между средними значениями двух сравниваемых между собой групп животных (M1 и М2) по какому либо признаку. Достоверность разницы определяется по формуле: Полученное значение td сравнивается с… … Термины и определения, используемые в селекции, генетике и воспроизводстве сельскохозяйственных животных

    КРИТЕРИЙ СТЬЮДЕНТА - оценивает близость двух средних значений с точки зрения отнесения или не отнесения ее к случайной (при заданном уровне значимости), отвечая на вопрос о том, отличаются ли средние значения статистически достоверно друг от друга }