Доверителен интервал за оценка на средната стойност (дисперсията е известна) в MS EXCEL. Как да изчислим доверителен интервал

Доверителни интервали ( английски Доверителни интервали) един от видовете интервални оценки, използвани в статистиката, които се изчисляват за дадено ниво на значимост. Те ни позволяват да направим твърдението, че истинската стойност на неизвестен статистически параметър на съвкупността е в рамките на получения диапазон от стойности с вероятност, която е определена от избраното ниво на статистическа значимост.

Нормално разпределение

Когато дисперсията (σ 2) на съвкупността от данни е известна, z-резултатът може да се използва за изчисляване на доверителните граници (крайните точки на доверителния интервал). В сравнение с използването на t-разпределението, използването на z-резултат ще ви позволи да конструирате не само по-тесен доверителен интервал, но и по-надеждни оценки на очакваната стойност и стандартното отклонение (σ), тъй като z-резултатът се основава на нормално разпределение.

Формула

За определяне на граничните точки на доверителния интервал, при условие че е известно стандартното отклонение на съвкупността от данни, се използва следната формула

L = X - Z α/2 σ
√n

Пример

Да приемем, че размерът на извадката е 25 наблюдения, очакваната стойност на извадката е 15, а стандартното отклонение на популацията е 8. За ниво на значимост от α=5%, Z-резултатът е Z α/2 =1,96. В този случай долната и горната граница на доверителния интервал ще бъдат

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Така можем да кажем, че с 95% вероятност математическото очакване на населението ще попадне в диапазона от 11.864 до 18.136.

Методи за стесняване на доверителния интервал

Нека приемем, че диапазонът е твърде широк за целите на нашето изследване. Има два начина за намаляване на диапазона на доверителния интервал.

  1. Намалете нивото на статистическа значимост α.
  2. Увеличете размера на извадката.

Намалявайки нивото на статистическа значимост до α=10%, получаваме Z-резултат, равен на Z α/2 =1,64. В този случай долната и горната граница на интервала ще бъдат

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

И самият доверителен интервал може да бъде написан като

В този случай можем да направим предположението, че с 90% вероятност математическото очакване на населението ще попадне в диапазона .

Ако искаме да не намаляваме нивото на статистическа значимост α, тогава единствената алтернатива е да увеличим размера на извадката. Увеличавайки го до 144 наблюдения, получаваме следните стойности на границите на доверие

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Самият доверителен интервал ще има следната форма

По този начин стесняването на доверителния интервал без намаляване на нивото на статистическа значимост е възможно само чрез увеличаване на размера на извадката. Ако увеличаването на размера на извадката не е възможно, тогава стесняването на доверителния интервал може да се постигне единствено чрез намаляване на нивото на статистическа значимост.

Конструиране на доверителен интервал за разпределение, различно от нормалното

Ако стандартното отклонение на популацията не е известно или разпределението е различно от нормалното, t-разпределението се използва за конструиране на доверителен интервал. Тази техника е по-консервативна, което се отразява в по-широки доверителни интервали в сравнение с техниката, базирана на Z-скора.

Формула

За да изчислите долната и горната граница на доверителния интервал въз основа на t-разпределението, използвайте следните формули

L = X - t α σ
√n

Разпределението на Студент или t-разпределението зависи само от един параметър - броя на степените на свобода, който е равен на броя на отделните стойности на атрибута (броя наблюдения в извадката). Стойността на t-критерия на Стюдънт за даден брой степени на свобода (n) и нивото на статистическа значимост α могат да бъдат намерени в референтните таблици.

Пример

Да приемем, че размерът на извадката е 25 индивидуални стойности, очакваната стойност на извадката е 50, а стандартното отклонение на извадката е 28. Необходимо е да се изгради доверителен интервал за нивото на статистическа значимост α=5%.

В нашия случай броят на степените на свобода е 24 (25-1), следователно съответната таблична стойност на t-теста на Student за нивото на статистическа значимост α=5% е 2,064. Следователно долната и горната граница на доверителния интервал ще бъдат

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

И самият интервал може да бъде записан във формата

Така можем да кажем, че с 95% вероятност математическото очакване на населението ще бъде в диапазона .

Използването на разпределението t ви позволява да стесните доверителния интервал или чрез намаляване на статистическата значимост, или чрез увеличаване на размера на извадката.

Като намалим статистическата значимост от 95% на 90% в условията на нашия пример, получаваме съответната таблична стойност на t-теста на Стюдънт от 1,711.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

В този случай можем да кажем, че с 90% вероятност математическото очакване на населението ще бъде в диапазона .

Ако не искаме да намалим статистическата значимост, тогава единствената алтернатива е да увеличим размера на извадката. Да кажем, че това са 64 индивидуални наблюдения, а не 25, както е в първоначалното състояние на примера. Табличната стойност на t-теста на Стюдънт за 63 степени на свобода (64-1) и ниво на статистическа значимост α=5% е 1,998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Това ни позволява да кажем, че с 95% вероятност математическото очакване на населението ще бъде в диапазона .

Големи проби

Големите извадки са извадки от съвкупност от данни, в която броят на индивидуалните наблюдения надвишава 100. Статистическите проучвания показват, че по-големите извадки са склонни да бъдат нормално разпределени, дори ако разпределението на популацията не е нормално. В допълнение, за такива проби използването на z-резултат и t-разпределение дава приблизително еднакви резултати при конструиране на доверителни интервали. По този начин за големи проби е приемливо да се използва z-резултат за нормалното разпределение вместо t-разпределението.

Нека обобщим

Доверителен интервал за математическо очакване - това е интервал, изчислен от данни, които с известна вероятност съдържат математическото очакване на генералната съвкупност. Естествена оценка за математическото очакване е средноаритметичната стойност на неговите наблюдавани стойности. Затова през целия урок ще използваме термините „средна стойност“ и „средна стойност“. При проблеми с изчисляване на доверителен интервал най-често изискваният отговор е нещо като „Доверителният интервал на средното число [стойност в определен проблем] е от [по-малка стойност] до [по-голяма стойност].“ Използвайки доверителен интервал, можете да оцените не само средните стойности, но и специфичното тегло на определена характеристика на общата съвкупност. Средни стойности, дисперсия, стандартно отклонение и грешка, чрез които ще стигнем до нови дефиниции и формули, се обсъждат в урока Характеристики на извадката и съвкупността .

Точкови и интервални оценки на средната стойност

Ако средната стойност на съвкупността се оценява с число (точка), тогава специфична средна стойност, която се изчислява от извадка от наблюдения, се приема като оценка на неизвестната средна стойност на съвкупността. В този случай стойността на извадковата средна - случайна променлива - не съвпада със средната стойност на генералната съвкупност. Следователно, когато посочвате средната стойност на извадката, трябва едновременно да посочите грешката на извадката. Мярката за извадкова грешка е стандартната грешка, която се изразява в същите единици като средната стойност. Поради това често се използва следното обозначение: .

Ако оценката на средната стойност трябва да бъде свързана с определена вероятност, тогава параметърът от интерес в съвкупността трябва да бъде оценен не с едно число, а с интервал. Доверителният интервал е интервал, в който с определена вероятност Пнамира се стойността на прогнозния индикатор за населението. Доверителен интервал, в който е вероятно П = 1 - α се намира случайната променлива, изчислена както следва:

,

α = 1 - П, който може да се намери в приложението към почти всяка книга по статистика.

На практика средната стойност на съвкупността и дисперсията не са известни, така че дисперсията на популацията се заменя с дисперсията на извадката, а средната популация с извадковата средна стойност. По този начин доверителният интервал в повечето случаи се изчислява, както следва:

.

Формулата на доверителния интервал може да се използва за оценка на средната стойност на популацията if

  • стандартното отклонение на съвкупността е известно;
  • или стандартното отклонение на популацията е неизвестно, но размерът на извадката е по-голям от 30.

Средната стойност на извадката е безпристрастна оценка на средната стойност на съвкупността. На свой ред дисперсията на извадката не е безпристрастна оценка на дисперсията на популацията. За да получите безпристрастна оценка на дисперсията на популацията във формулата за дисперсия на извадката, размер на извадката птрябва да се замени с п-1.

Пример 1.От 100 произволно избрани кафенета в даден град е събрана информация, че средният брой служители в тях е 10,5 при стандартно отклонение от 4,6. Определете 95% доверителен интервал за броя на служителите в кафенето.

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

По този начин 95% доверителен интервал за средния брой служители в кафенето варира от 9,6 до 11,4.

Пример 2.За произволна извадка от популация от 64 наблюдения бяха изчислени следните общи стойности:

сбор от стойности в наблюденията,

сума на квадратните отклонения на стойностите от средната .

Изчислете 95% доверителен интервал за математическото очакване.

Нека изчислим стандартното отклонение:

,

Нека изчислим средната стойност:

.

Заменяме стойностите в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

По този начин 95% доверителният интервал за математическото очакване на тази извадка варира от 7,484 до 11,266.

Пример 3.За произволна популационна извадка от 100 наблюдения изчислената средна стойност е 15,2, а стандартното отклонение е 3,2. Изчислете 95% доверителен интервал за очакваната стойност, след това 99% доверителен интервал. Ако мощността на извадката и нейната вариация останат непроменени и коефициентът на доверие се увеличи, ще се стесни или разшири доверителният интервал?

Ние заместваме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

.

По този начин 95% доверителен интервал за средната стойност на тази проба варира от 14,57 до 15,82.

Отново заместваме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,01 .

Получаваме:

.

Така 99% доверителният интервал за средната стойност на тази проба варира от 14,37 до 16,02.

Както виждаме, с увеличаването на коефициента на доверие критичната стойност на стандартното нормално разпределение също се увеличава и следователно началната и крайната точка на интервала са разположени по-далеч от средната стойност и по този начин интервалът на доверие за математическото очакване се увеличава .

Точкови и интервални оценки на специфичното тегло

Делът на някакъв примерен атрибут може да се интерпретира като точкова оценка на дела стрсъс същата характеристика в общата популация. Ако тази стойност трябва да бъде свързана с вероятност, тогава трябва да се изчисли доверителният интервал на специфичното тегло стрхарактеристика в популацията с вероятност П = 1 - α :

.

Пример 4.В някой град има двама кандидати АИ бсе кандидатират за кмет. На случаен принцип са анкетирани 200 жители на града, от които 46% са отговорили, че биха гласували за кандидата А, 26% - за кандидата ба 28% не знаят за кого ще гласуват. Определете 95% доверителен интервал за дела на жителите на града, подкрепящи кандидата А.

Цел– обучават студентите на алгоритми за изчисляване на доверителни интервали на статистически параметри.

При статистическа обработка на данните изчислената средна аритметична стойност, коефициент на вариация, коефициент на корелация, критерии за разлика и други точкови статистики трябва да получат количествени доверителни граници, които показват възможните колебания на показателя в по-малки и по-големи посоки в рамките на доверителния интервал.

Пример 3.1 . Разпределението на калций в кръвния серум на маймуни, както е установено по-рано, се характеризира със следните примерни показатели: = 11,94 mg%; = 0,127 mg%; п= 100. Необходимо е да се определи доверителният интервал за общата средна стойност ( ) с доверителна вероятност П = 0,95.

Генералната средна се намира с определена вероятност в интервала:

, Къде – средноаритметично извадково; t– Ученически тест; – грешка на средноаритметичното.

Използвайки таблицата „Стойности на t-теста на Стюдънт“ намираме стойността с доверителна вероятност от 0,95 и броя на степените на свобода к= 100-1 = 99. Равно е на 1,982. Заедно със стойностите на средната аритметична и статистическа грешка, ние го заместваме във формулата:

или 11.69
12,19

По този начин, с вероятност от 95%, може да се каже, че общата средна стойност на това нормално разпределение е между 11,69 и 12,19 mg%.

Пример 3.2 . Определете границите на 95% доверителен интервал за общата дисперсия ( ) разпределение на калций в кръвта на маймуни, ако е известно, че
= 1,60, при п = 100.

За да разрешите проблема, можете да използвате следната формула:

Къде – статистическа грешка на дисперсията.

Намираме грешката на дисперсията на извадката, използвайки формулата:
. То е равно на 0,11. Значение t- критерий с доверителна вероятност 0,95 и брой степени на свобода к= 100–1 = 99 е известно от предишния пример.

Нека използваме формулата и да получим:

или 1.38
1,82

По-точно, доверителният интервал на общата дисперсия може да бъде конструиран с помощта на (хи-квадрат) - Тест на Пиърсън. Критичните точки за този критерий са дадени в специална таблица. При използване на критерия За конструиране на доверителен интервал се използва двустранно ниво на значимост. За долната граница нивото на значимост се изчислява по формулата
, за върха –
. Например за нивото на увереност = 0,99= 0,010,= 0,990. Съответно, според таблицата на разпределение на критичните стойности , с изчислени нива на достоверност и брой степени на свобода к= 100 – 1= 99, намерете стойностите
И
. получаваме
е равно на 135,80 и
е равно на 70,06.

За да се намерят доверителни граници за общата дисперсия, използвайки Да използваме формулите: за долната граница
, за горната граница
. Нека заместим намерените стойности с данните за проблема във формули:
= 1,17;
= 2,26. Така, с уверена вероятност П= 0,99 или 99% обща дисперсия ще лежи в диапазона от 1,17 до 2,26 mg% включително.

Пример 3.3 . Сред 1000 пшенични семена от партидата, получена в елеватора, 120 семена са заразени с мораво рогче. Необходимо е да се определят вероятните граници на общия дял на заразените семена в дадена партида пшеница.

Препоръчително е да се определят доверителните граници за общия дял за всички негови възможни стойности, като се използва формулата:

,

Къде п – брой наблюдения; м– абсолютен размер на една от групите; t– нормализирано отклонение.

Пробният дял на заразените семена е
или 12%. С увереност вероятност Р= 95% нормализирано отклонение ( t-Тест на студента при к =
)t = 1,960.

Заменяме наличните данни във формулата:

Следователно границите на доверителния интервал са равни на = 0,122–0,041 = 0,081, или 8,1%; = 0,122 + 0,041 = 0,163, или 16,3%.

Така с доверителна вероятност от 95% може да се каже, че общият дял на заразените семена е между 8,1 и 16,3%.

Пример 3.4 . Коефициентът на вариация, характеризиращ вариацията на калций (mg%) в кръвния серум на маймуни, е равен на 10,6%. Размер на извадката п= 100. Необходимо е да се определят границите на 95% доверителен интервал за общия параметър Cv.

Граници на доверителния интервал за общия коефициент на вариация Cv се определят по следните формули:

И
, Къде К междинна стойност, изчислена по формулата
.

Знаейки това с увереност вероятност Р= 95% нормализирано отклонение (тест на Студент при к =
)t = 1,960, нека първо изчислим стойността ДО:

.

или 9,3%

или 12,3%

Така общият коефициент на вариация с 95% ниво на сигурност е в диапазона от 9,3 до 12,3%. При повторни проби коефициентът на вариация няма да надвишава 12,3% и няма да бъде под 9,3% в 95 случая от 100.

Въпроси за самоконтрол:

Задачи за самостоятелно решаване.

1. Средният процент на мазнини в млякото по време на лактация на холмогорски кръстосани крави е както следва: 3,4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3,8; 3.4; 4.0; 3.3; 3.7; 3,5; 3.6; 3.4; 3.8. Установете доверителни интервали за общата средна стойност при 95% ниво на достоверност (20 точки).

2. При 400 хибридни растения ръж първите цветове се появяват средно 70,5 дни след сеитбата. Стандартното отклонение е 6,9 дни. Определете грешката на средната стойност и доверителните интервали за общата средна стойност и дисперсията на ниво на значимост У= 0,05 и У= 0,01 (25 точки).

3. При изследване на дължината на листата на 502 екземпляра градински ягоди са получени следните данни: = 7,86 см; σ = 1,32 cm, =± 0,06 cm. Определете доверителни интервали за средната аритметична съвкупност с нива на значимост 0,01; 0,02; 0,05. (25 точки).

4. В проучване на 150 възрастни мъже, средният ръст е 167 см, и σ = 6 см. Какви са границите на общата средна и общата дисперсия с доверителна вероятност от 0,99 и 0,95? (25 точки).

5. Разпределението на калций в кръвния серум на маймуни се характеризира със следните селективни показатели: = 11,94 mg%, σ = 1,27, п = 100. Изградете 95% доверителен интервал за общата средна стойност на това разпределение. Изчислете коефициента на вариация (25 точки).

6. Изследвано е общото съдържание на азот в кръвната плазма на плъхове албиноси на възраст 37 години и 180 дни. Резултатите се изразяват в грамове на 100 cm3 плазма. На възраст 37 дни 9 плъха имат: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. На възраст 180 дни 8 плъха имат: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1.13; 1.12. Задайте доверителни интервали за разликата при ниво на достоверност 0,95 (50 точки).

7. Определете границите на 95% доверителен интервал за общата дисперсия на разпределението на калций (mg%) в кръвния серум на маймуни, ако за това разпределение размерът на пробата е n = 100, статистическа грешка на дисперсията на пробата s σ 2 = 1,60 (40 точки).

8. Определете границите на 95% доверителен интервал за общата дисперсия на разпределението на 40 пшенични класчета по дължина (σ 2 = 40,87 mm 2). (25 точки).

9. Пушенето се счита за основен фактор, предразполагащ към обструктивни белодробни заболявания. Пасивното пушене не се счита за такъв фактор. Учените се усъмниха в безвредността на пасивното пушене и изследваха проходимостта на дихателните пътища на непушачи, пасивни и активни пушачи. За да характеризираме състоянието на дихателните пътища, взехме един от показателите за функцията на външното дишане - максималната обемна скорост на потока в средата на изтичане. Намаляването на този показател е признак на обструкция на дихателните пътища. Данните от проучването са показани в таблицата.

Брой прегледани лица

Максимален дебит в средата на издишването, l/s

Стандартно отклонение

Непушачи

работа в зона за непушачи

работа в задимена стая

Пушенето

пушат малък брой цигари

среден брой пушачи на цигари

пушат голям брой цигари

Използвайки данните от таблицата, намерете 95% доверителни интервали за общата средна стойност и общата дисперсия за всяка група. Какви са разликите между групите? Представете резултатите графично (25 точки).

10. Определете границите на 95% и 99% доверителни интервали за общата дисперсия в броя на прасенцата при 64 опрасвания, ако статистическата грешка на дисперсията на извадката s σ 2 = 8,25 (30 точки).

11. Известно е, че средното тегло на зайците е 2,1 кг. Определете границите на 95% и 99% доверителни интервали за общата средна стойност и дисперсия при п= 30, σ = 0,56 кг (25 точки).

12. Съдържанието на зърно в класа е измерено за 100 класа ( X), дължина на ухото ( Y) и масата на зърното в класа ( З). Намерете доверителни интервали за общата средна стойност и дисперсия при П 1 = 0,95, П 2 = 0,99, П 3 = 0,999 ако = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29,153, σ y 2 = 2, 111, σ z 2 = 0, 064. (25 точки).

13. В 100 произволно избрани класа зимна пшеница е преброен броят на класчетата. Извадката се характеризира със следните показатели: = 15 класчета и σ = 2,28 бр. Определете с каква точност е получен средният резултат ( ) и конструиране на доверителен интервал за общата средна стойност и дисперсия при 95% и 99% нива на значимост (30 точки).

14. Брой на ребрата на изкопаеми черупки на мекотели Ортамбонити калиграма:

Известно е, че п = 19, σ = 4,25. Определете границите на доверителния интервал за общата средна стойност и общата дисперсия на ниво на значимост У = 0,01 (25 точки).

15. За да се определи добивът на мляко в търговска млечна ферма, продуктивността на 15 крави се определя ежедневно. По данни за годината всяка крава е дала средно дневно следното количество мляко (л): 22; 19; 25; 20; 27; 17; 30; 21; 18; 24; 26; 23; 25; 20; 24. Конструирайте доверителни интервали за общата дисперсия и средната аритметична стойност. Можем ли да очакваме средният годишен млеконадой от крава да е 10 000 литра? (50 точки).

16. За определяне на средния добив на пшеница за земеделското предприятие е извършено коситба на опитни площи от 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 и 2 хектара. Производителността (c/ha) от парцелите е 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 съответно. Конструирайте доверителни интервали за общата дисперсия и средната аритметична стойност. Можем ли да очакваме средният земеделски добив да бъде 42 ц/дка? (50 точки).

Оценка на доверителните интервали

Цели на обучението

Статистиката отчита следното две основни задачи:

    Имаме някаква оценка, базирана на примерни данни, и искаме да направим някакво вероятностно изявление за това къде се намира истинската стойност на изчисления параметър.

    Имаме конкретна хипотеза, която трябва да бъде тествана с примерни данни.

В тази тема разглеждаме първата задача. Нека въведем и определението за доверителен интервал.

Доверителният интервал е интервал, който е изграден около оценената стойност на даден параметър и показва къде се намира истинската стойност на оценения параметър с предварително определена вероятност.

След като изучите материала по тази тема, вие:

    научете какво е доверителен интервал за оценка;

    научете се да класифицирате статистически проблеми;

    овладеят техниката за конструиране на доверителни интервали, както с помощта на статистически формули, така и с помощта на софтуерни инструменти;

    научете се да определяте необходимите размери на извадката, за да постигнете определени параметри на точност на статистическите оценки.

Разпределение на характеристиките на извадката

Т-разпределение

Както беше обсъдено по-горе, разпределението на случайната променлива е близко до стандартизираното нормално разпределение с параметри 0 и 1. Тъй като не знаем стойността на σ, ние я заместваме с някаква оценка на s. Количеството вече има различно разпределение, а именно или Студентско разпределение, което се определя от параметъра n -1 (броят степени на свобода). Това разпределение е близко до нормалното разпределение (колкото по-голямо е n, толкова по-близо са разпределенията).

На фиг. 95
представено е разпределението на Студент с 30 степени на свобода. Както можете да видите, то е много близо до нормалното разпределение.

Подобно на функциите за работа с нормалното разпределение NORMIDIST и NORMINV има функции за работа с t-разпределението - STUDIST (TDIST) и STUDRASOBR (TINV). Пример за използване на тези функции може да се види във файла STUDRASP.XLS (шаблон и решение) и на фиг. 96
.

Разпределение на други характеристики

Както вече знаем, за да определим точността на оценката на математическото очакване, се нуждаем от t-разпределение. За оценка на други параметри, като дисперсия, са необходими различни разпределения. Две от тях са F-разпределението и х 2 -разпределение.

Доверителен интервал за средната стойност

Доверителен интервал- това е интервал, който се изгражда около оценената стойност на параметъра и показва къде се намира истинската стойност на оценения параметър с предварително определена вероятност.

Получава се изграждането на доверителен интервал за средната стойност както следва:

Пример

Заведението за бързо хранене планира да разшири асортимента си с нов вид сандвичи. За да оцени търсенето за него, мениджърът планира да избере произволно 40 посетители от тези, които вече са го опитали, и да ги помоли да оценят отношението си към новия продукт по скала от 1 до 10. Мениджърът иска да оцени очакваното брой точки, които ще получи новият продукт и конструиране на 95% доверителен интервал за тази оценка. Как да стане това? (вижте файла SANDWICH1.XLS (шаблон и решение).

Решение

За да разрешите този проблем, можете да използвате. Резултатите са представени на фиг. 97
.

Доверителен интервал за обща стойност

Понякога, използвайки примерни данни, е необходимо да се оцени не математическото очакване, а общата сума от стойности. Например, в ситуация с одитор, интересът може да бъде в оценката не на средния размер на сметката, а на сумата от всички сметки.

Нека N е общият брой елементи, n е размерът на извадката, T3 е сумата от стойностите в извадката, T" е оценката за сумата от цялата популация, тогава , а доверителният интервал се изчислява по формулата , където s е оценката на стандартното отклонение за извадката и е оценката на средната стойност за извадката.

Пример

Да приемем, че данъчна агенция иска да изчисли общия възстановен данък за 10 000 данъкоплатци. Данъкоплатецът или получава възстановяване, или плаща допълнителни данъци. Намерете 95% доверителен интервал за сумата за възстановяване, като приемете, че извадката е от 500 души (вижте файла AMOUNT OF REFUND.XLS (шаблон и решение).

Решение

StatPro няма специална процедура за този случай, но може да се отбележи, че границите могат да бъдат получени от границите за средната стойност въз основа на горните формули (Фиг. 98
).

Доверителен интервал за пропорцията

Нека p е математическото очакване на дела на клиентите и нека p b е оценката на този дял, получена от извадка с размер n. Може да се покаже, че за достатъчно големи разпределението на оценката ще бъде близко до нормалното с математическо очакване p и стандартно отклонение . Стандартната грешка на оценката в този случай се изразява като , а доверителният интервал е като .

Пример

Заведението за бързо хранене планира да разшири асортимента си с нов вид сандвичи. За да оцени търсенето на него, мениджърът произволно избра 40 посетители от тези, които вече са го опитали, и ги помоли да оценят отношението си към новия продукт по скала от 1 до 10. Мениджърът иска да оцени очаквания дял на клиенти, които оценяват новия продукт най-малко от 6 точки (той очаква, че тези клиенти ще бъдат потребителите на новия продукт).

Решение

Първоначално създаваме нова колона въз основа на атрибут 1, ако рейтингът на клиента е над 6 точки и 0 в противен случай (вижте файла SANDWICH2.XLS (шаблон и решение).

Метод 1

Като броим числото 1, оценяваме дела и след това използваме формулите.

Стойността zcr се взема от специални таблици за нормално разпределение (например 1,96 за 95% доверителен интервал).

Използвайки този подход и конкретни данни за конструиране на 95% интервал, получаваме следните резултати (Фиг. 99
). Критичната стойност на параметъра zcr е 1,96. Стандартната грешка на оценката е 0,077. Долната граница на доверителния интервал е 0,475. Горната граница на доверителния интервал е 0,775. По този начин мениджърът има право да вярва с 95% увереност, че процентът на клиентите, които оценяват новия продукт с 6 или повече точки, ще бъде между 47,5 и 77,5.

Метод 2

Този проблем може да бъде разрешен с помощта на стандартни инструменти StatPro. За да направите това, достатъчно е да се отбележи, че делът в този случай съвпада със средната стойност на колоната Тип. След това прилагаме StatPro/Статистически извод/Анализ на една извадказа конструиране на доверителен интервал на средната стойност (оценка на математическото очакване) за колоната Тип. Резултатите, получени в този случай, ще бъдат много близки до резултатите от първия метод (фиг. 99).

Доверителен интервал за стандартно отклонение

s се използва като оценка на стандартното отклонение (формулата е дадена в раздел 1). Функцията на плътност на оценката s е функцията хи-квадрат, която, подобно на t-разпределението, има n-1 степени на свобода. Има специални функции за работа с тази дистрибуция CHIDIST и CHIINV.

Доверителният интервал в този случай вече няма да бъде симетричен. Конвенционална гранична диаграма е показана на фиг. 100.

Пример

Машината трябва да произвежда части с диаметър 10 cm, но поради различни обстоятелства възникват грешки. Контрольорът по качеството е загрижен за две обстоятелства: първо, средната стойност трябва да бъде 10 cm; второ, дори и в този случай, ако отклоненията са големи, тогава много части ще бъдат отхвърлени. Всеки ден той прави проба от 50 части (вижте файла QUALITY CONTROL.XLS (шаблон и решение). Какви заключения може да даде такава проба?

Решение

Нека изградим 95% доверителни интервали за средното и стандартното отклонение, като използваме StatPro/Статистически изводи/Анализ на една извадка(фиг. 101
).

След това, използвайки предположението за нормално разпределение на диаметрите, ние изчисляваме дела на дефектните продукти, като задаваме максимално отклонение от 0,065. Използвайки възможностите на таблицата за заместване (случай на два параметъра), ще начертаем зависимостта на дела на дефектите от средната стойност и стандартното отклонение (фиг. 102).
).

Доверителен интервал за разликата между две средни стойности

Това е едно от най-важните приложения на статистическите методи. Примери за ситуации.

    Мениджърът на магазин за дрехи би искал да знае колко повече или по-малко средната клиентка харчи в магазина, отколкото средният клиент мъж.

    Двете авиокомпании летят по сходни маршрути. Потребителска организация би искала да сравни разликата между средните очаквани времена на закъснение на полета за двете авиокомпании.

    Компанията изпраща купони за определени видове стоки в един град, а не в друг. Мениджърите искат да сравнят средните обеми на покупките на тези продукти през следващите два месеца.

    Търговец на автомобили често се занимава с женени двойки на презентации. За да се разберат личните им реакции към презентацията, двойките често се интервюират отделно. Мениджърът иска да оцени разликата в оценките, дадени от мъжете и жените.

Случай на независими проби

Разликата между средните ще има t-разпределение с n 1 + n 2 - 2 степени на свобода. Доверителният интервал за μ 1 - μ 2 се изразява чрез отношението:

Този проблем може да бъде решен не само с помощта на горните формули, но и с помощта на стандартни инструменти StatPro. За да направите това, достатъчно е да използвате

Доверителен интервал за разликата между пропорциите

Нека е математическото очакване на акциите. Нека са техните извадкови оценки, съставени съответно от извадки с размер n 1 и n 2. След това е оценка за разликата. Следователно доверителният интервал на тази разлика се изразява като:

Тук z cr е стойност, получена от нормално разпределение с помощта на специални таблици (например 1,96 за 95% доверителен интервал).

Стандартната грешка на оценката се изразява в този случай чрез отношението:

.

Пример

Магазинът, подготвяйки се за голяма разпродажба, предприе следното маркетингово проучване. Най-добрите 300 купувачи бяха избрани и разделени на случаен принцип в две групи от по 150 членове всяка. На всички избрани клиенти бяха изпратени покани за участие в разпродажбата, но само членовете на първата група получиха талон с право на 5% отстъпка. По време на продажбата бяха записани покупките на всички 300 избрани купувачи. Как един мениджър може да интерпретира резултатите и да направи преценка за ефективността на купоните? (вижте файла COUPONS.XLS (шаблон и решение)).

Решение

За нашия конкретен случай от 150 клиенти, получили купон за отстъпка, 55 са направили покупка на разпродажба, а сред 150-те, които не са получили купон, само 35 са направили покупка (Фиг. 103
). Тогава стойностите на пропорциите на извадката са съответно 0,3667 и 0,2333. И пробната разлика между тях е равна съответно на 0,1333. Приемайки 95% доверителен интервал, намираме от таблицата за нормално разпределение z cr = 1,96. Изчисляването на стандартната грешка на разликата в извадката е 0,0524. Най-накрая откриваме, че долната граница на 95% доверителен интервал е 0,0307, ​​а горната граница е съответно 0,2359. Получените резултати могат да се интерпретират така, че на всеки 100 клиента, получили купон за отстъпка, можем да очакваме от 3 до 23 нови клиента. Трябва обаче да имаме предвид, че това заключение само по себе си не означава ефективността на използването на купони (тъй като предоставяйки отстъпка, губим печалба!). Нека демонстрираме това с конкретни данни. Да приемем, че средният размер на покупката е 400 рубли, от които 50 рубли. има печалба за магазина. Тогава очакваната печалба от 100 клиенти, които не са получили купон, е:

50 0,2333 100 = 1166,50 rub.

Подобни изчисления за 100 клиенти, получили купон, дават:

30 0,3667 100 = 1100,10 rub.

Намаляването на средната печалба до 30 се обяснява с факта, че използвайки отстъпката, клиентите, получили купон, ще направят покупка средно за 380 рубли.

По този начин окончателното заключение показва неефективността на използването на такива купони в тази конкретна ситуация.

Коментирайте. Този проблем може да бъде разрешен с помощта на стандартни инструменти StatPro. За да направите това, достатъчно е да намалите този проблем до проблема за оценка на разликата между две средни стойности с помощта на метода и след това да приложите StatPro/Статистически изводи/Анализ с две пробида се изгради доверителен интервал за разликата между две средни стойности.

Контролиране на дължината на доверителния интервал

Дължината на доверителния интервал зависи от следните условия:

    данни директно (стандартно отклонение);

    ниво на значимост;

    размер на извадката.

Размер на извадката за оценка на средната стойност

Първо, нека разгледаме проблема в общия случай. Нека обозначим стойността на половината от дължината на дадения ни доверителен интервал като B (фиг. 104
). Знаем, че доверителният интервал за средната стойност на някаква случайна променлива X се изразява като , Къде . Вярвайки:

и изразявайки n, получаваме .

За съжаление не знаем точната стойност на дисперсията на случайната променлива X. Освен това не знаем стойността на tcr, тъй като зависи от n чрез броя на степените на свобода. В тази ситуация можем да направим следното. Вместо дисперсия s, ние използваме някаква оценка на дисперсията въз основа на всякакви налични реализации на изследваната случайна променлива. Вместо стойността t cr, ние използваме стойността z cr за нормалното разпределение. Това е напълно приемливо, тъй като функциите на плътност на разпределението за нормалното и t-разпределението са много близки (с изключение на случая на малки n). Така търсената формула приема формата:

.

Тъй като формулата дава, най-общо казано, нецелочислени резултати, закръгляването с излишък на резултата се приема като желания размер на извадката.

Пример

Заведението за бързо хранене планира да разшири асортимента си с нов вид сандвичи. За да оцени търсенето за него, мениджърът планира да избере произволен брой посетители от тези, които вече са го опитали, и да ги помоли да оценят отношението си към новия продукт по скала от 1 до 10. Мениджърът иска да оцени очаквания брой точки, които новият продукт ще получи продукт и конструиране на 95% доверителен интервал за тази оценка. В същото време той иска полуширината на доверителния интервал да не надвишава 0,3. Колко посетители трябва да интервюира?

изглежда така:

тук r otsе оценка на пропорцията p, а B е дадена половина от дължината на доверителния интервал. Надценка за n може да се получи с помощта на стойността r ots= 0,5. В този случай дължината на доверителния интервал няма да надвишава определената стойност B за всяка истинска стойност на p.

Пример

Нека мениджърът от предишния пример планира да оцени дела на клиентите, които са предпочели нов тип продукт. Той иска да конструира 90% доверителен интервал, чиято половин дължина не надвишава 0,05. Колко клиенти трябва да бъдат включени в произволната извадка?

Решение

В нашия случай стойността на z cr = 1,645. Следователно необходимото количество се изчислява като .

Ако мениджърът имаше причина да вярва, че желаната p-стойност е, например, приблизително 0,3, тогава чрез заместване на тази стойност в горната формула, ще получим по-малка стойност на произволна извадка, а именно 228.

Формула за определяне произволен размер на извадката в случай на разлика между две средни стойностинаписан като:

.

Пример

Някои компютърни компании имат център за обслужване на клиенти. Напоследък се увеличи броят на оплакванията на клиентите за лошо качество на услугата. В сервизния център работят основно два вида служители: такива, които нямат голям опит, но са завършили специални подготвителни курсове, и такива, които имат богат практически опит, но не са завършили специални курсове. Компанията иска да анализира оплакванията на клиенти през последните шест месеца и да сравни средния брой оплаквания за всяка от двете групи служители. Предполага се, че числата в пробите и за двете групи ще бъдат еднакви. Колко служители трябва да бъдат включени в извадката, за да се получи 95% интервал с половин дължина не повече от 2?

Решение

Тук σ ots е оценка на стандартното отклонение на двете случайни променливи при допускането, че са близки. Следователно в нашия проблем трябва по някакъв начин да получим тази оценка. Това може да стане например по следния начин. След като разгледа данните за оплакванията на клиентите през последните шест месеца, мениджърът може да забележи, че всеки служител обикновено получава от 6 до 36 оплаквания. Знаейки, че за нормално разпределение почти всички стойности са не повече от три стандартни отклонения от средната стойност, той може разумно да вярва, че:

, откъдето σ ots = 5.

Замествайки тази стойност във формулата, получаваме .

Формула за определяне случаен размер на извадката в случай на оценка на разликата между пропорциитеима формата:

Пример

Някои компании имат две фабрики, произвеждащи подобни продукти. Мениджър на фирма иска да сравни процента на дефектни продукти в двете фабрики. Според наличната информация процентът на дефектите и в двата завода варира от 3 до 5%. Предназначен е да се изгради 99% доверителен интервал с половин дължина не повече от 0,005 (или 0,5%). Колко продукта трябва да бъдат избрани от всяка фабрика?

Решение

Тук p 1ots и p 2ots са оценки на два неизвестни дяла от дефекти в 1-ва и 2-ра фабрика. Ако поставим p 1ots = p 2ots = 0,5, тогава получаваме надценена стойност за n. Но тъй като в нашия случай имаме някаква априорна информация за тези дялове, ние вземаме горната оценка на тези дялове, а именно 0,05. получаваме

Когато се оценяват някои параметри на съвкупността от извадкови данни, е полезно да се даде не само точкова оценка на параметъра, но и да се предостави доверителен интервал, който показва къде може да се намира точната стойност на оценявания параметър.

В тази глава се запознахме и с количествени зависимости, които ни позволяват да конструираме такива интервали за различни параметри; научени начини за контролиране на дължината на доверителния интервал.

Имайте предвид също, че проблемът с оценката на размера на извадката (проблемът с планирането на експеримент) може да бъде решен с помощта на стандартни инструменти на StatPro, а именно StatPro/Статистически извод/Избор на размер на извадката.

Доверителен интервал(CI; на английски, доверителен интервал - CI), получен в проучване с извадка, дава мярка за точността (или несигурността) на резултатите от изследването, за да се направят заключения относно популацията на всички такива пациенти (общата популация). Правилното определение на 95% CI може да се формулира по следния начин: 95% от тези интервали ще съдържат истинската стойност в популацията. Тази интерпретация е малко по-малко точна: CI е диапазонът от стойности, в рамките на който можете да сте 95% сигурни, че съдържа истинската стойност. Когато се използва CI, акцентът е върху определянето на количествения ефект, за разлика от P стойността, която се получава чрез тестване на статистическата значимост. P стойността не оценява каквото и да е количество, а по-скоро служи като мярка за силата на доказателствата срещу нулевата хипотеза за „без ефект“. Стойността на P сама по себе си не ни казва нищо за големината на разликата или дори за нейната посока. Следователно независимите P стойности са абсолютно неинформативни в статии или резюмета. За разлика от това, CI показва както размера на ефекта от непосредствен интерес, като ползата от лечението, така и силата на доказателствата. Следователно DI е пряко свързан с практиката на EBM.

Оценъчният подход към статистическия анализ, илюстриран с CI, има за цел да измери количеството на ефекта от интерес (чувствителност на диагностичен тест, процент на прогнозираните случаи, намаляване на относителния риск с лечение и т.н.), както и да измери несигурността в това ефект. Най-често CI е диапазонът от стойности от двете страни на оценката, в който е вероятно да лежи истинската стойност и можете да сте 95% сигурни в това. Споразумението за използване на 95% вероятност е произволно, както и P стойността.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI се основава на идеята, че едно и също изследване, проведено върху различни проби от пациенти, няма да доведе до идентични резултати, но че техните резултати ще бъдат разпределени около истинска, но неизвестна стойност. С други думи, CI го описва като „зависима от пробата променливост“. CI не отразява допълнителна несигурност поради други причини; по-специално, не включва въздействието на селективна загуба върху проследяването, лошо съответствие или неточно измерване на резултатите, липса на заслепяване и др. Следователно CI винаги подценява общото количество несигурност.

Изчисляване на доверителния интервал

Таблица A1.1. Стандартни грешки и доверителни интервали за избрани клинични измервания

Обикновено CI се изчислява от наблюдавана оценка на количество, като разликата (d) между две пропорции и стандартната грешка (SE) в оценката на тази разлика. Приблизителният 95% CI, получен по този начин, е d ± 1,96 SE. Формулата се променя според естеството на мярката за резултат и обхвата на CI. Например, в рандомизирано, плацебо-контролирано проучване на ацелуларна ваксина срещу коклюш, 72 от 1670 (4,3%) бебета, които са получили ваксината, развиват коклюш и 240 от 1665 (14,4%) в контролната група. Процентната разлика, известна като намаляване на абсолютния риск, е 10,1%. SE на тази разлика е 0,99%. Съответно 95% CI е 10,1% + 1,96 x 0,99%, т.е. от 8.2 до 12.0.

Въпреки различните си философски подходи, CI и тестовете за статистическа значимост са тясно свързани математически.

По този начин стойността на P е „значима“, т.е. Р<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Несигурността (неточността) на оценката, изразена в CI, е до голяма степен свързана с корен квадратен от размера на извадката. Малките проби предоставят по-малко информация от големите и съответно CI е по-широк в по-малка извадка. Например, статия, сравняваща ефективността на три теста, използвани за диагностициране на инфекция с Helicobacter pylori, съобщава за чувствителност на дихателния тест с урея от 95,8% (95% CI 75–100). Въпреки че цифрата от 95,8% е впечатляваща, малката извадка от 24 възрастни пациенти с J. pylori означава, че има значителна несигурност в тази оценка, както се вижда от широкия CI. Наистина долната граница от 75% е много по-ниска от оценката от 95,8%. Ако същата чувствителност се наблюдава в извадка от 240 души, 95% CI ще бъде 92,5–98,0, което дава повече сигурност, че тестът е силно чувствителен.

В рандомизирани контролирани проучвания (RCT) незначимите резултати (т.е. тези с P >0,05) са особено податливи на погрешно тълкуване. CI е особено полезен тук, защото показва колко съвместими са резултатите с клинично полезния истински ефект. Например, в RCT, сравняващ шев на дебелото черво и анастомоза със скоби, инфекция на раната се е развила съответно при 10,9% и 13,5% от пациентите (P = 0,30). 95% CI за тази разлика е 2,6% (-2 до +8). Дори в това проучване на 652 пациенти остава възможно да има скромна разлика в честотата на инфекциите в резултат на двете процедури. Колкото по-малко изследвания, толкова по-голяма е несигурността. Sung и др. извърши RCT, за да сравни инфузията на октреотид с остра склеротерапия за остро варикозно кървене при 100 пациенти. В групата на октреотид степента на контрол на кървенето е 84%; в групата на склеротерапията - 90%, което дава Р = 0,56. Имайте предвид, че честотата на продължаващото кървене е подобна на тази при инфекция на раната в споменатото проучване. В този случай обаче 95% CI за разликата между интервенциите е 6% (-7 до +19). Този диапазон е доста широк в сравнение с разликата от 5%, която би представлявала клиничен интерес. Ясно е, че проучването не изключва значителна разлика в ефективността. Следователно заключението на авторите „инфузията на октреотид и склеротерапията са еднакво ефективни при лечението на кървене от разширени вени“ определено е невалидно. В случаи като този, където, както тук, 95% CI за абсолютно намаляване на риска (ARR) включва нула, CI за NNT (брой, необходим за лечение) е доста труден за тълкуване. NPL и неговият CI се получават от реципрочните стойности на ACP (умножени по 100, ако тези стойности са дадени като проценти). Тук получаваме NPL = 100: 6 = 16,6 с 95% CI от -14,3 до 5,3. Както се вижда от бележка под линия „d“ в табл. A1.1, този CI включва стойности на NPL от 5,3 до безкрайност и NPL от 14,3 до безкрайност.

CI могат да бъдат конструирани за най-често използваните статистически оценки или сравнения. За RCT включва разликата между средни пропорции, относителни рискове, коефициенти на шансове и NLR. По същия начин CI могат да бъдат получени за всички основни оценки, направени в проучвания за точност на диагностични тестове - чувствителност, специфичност, положителна прогнозна стойност (всички от които са прости пропорции) и съотношения на вероятност - оценки, получени в мета-анализи и сравнение с контрола проучвания. Програма за персонален компютър, която обхваща много от тези употреби на MDI, е достъпна с второто издание на Statistics with Confidence. Макросите за изчисляване на CI за пропорции са достъпни безплатно за Excel и статистическите програми SPSS и Minitab на http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Множество оценки на ефекта от лечението

Въпреки че конструирането на CI е желателно за първичните резултати от изследването, те не са необходими за всички резултати. CI се отнася до клинично важни сравнения. Например, когато сравнявате две групи, правилният CI е този, конструиран за разликата между групите, както е показано в примерите по-горе, а не CI, който може да бъде конструиран за оценката във всяка група. Не само, че не е полезно да се предоставят отделни CI за оценки във всяка група, това представяне може да бъде подвеждащо. По същия начин правилният подход при сравняване на ефективността на лечението в различни подгрупи е директното сравняване на две (или повече) подгрупи. Неправилно е да се приеме, че лечението е ефективно само в една подгрупа, ако неговият CI изключва стойността, съответстваща на липса на ефект, а останалите не. CI също са полезни при сравняване на резултати в множество подгрупи. На фиг. A 1.1 показва относителния риск от еклампсия при жени с прееклампсия в подгрупи жени от плацебо-контролирано RCT на магнезиев сулфат.

ориз. A1.2. Горският график показва резултатите от 11 рандомизирани клинични изпитвания на говежди ротавирусна ваксина за предотвратяване на диария в сравнение с плацебо. Използван е 95% доверителен интервал за оценка на относителния риск от диария. Размерът на черния квадрат е пропорционален на количеството информация. Освен това са показани обобщената оценка на ефективността на лечението и 95% доверителен интервал (обозначен с ромб). Мета-анализът използва модел на произволни ефекти, по-голям от някои предварително определени; например, това може да е размерът, използван при изчисляване на размера на извадката. По-строг критерий изисква целият диапазон на CI да показва полза, по-голяма от предварително определен минимум.

Вече обсъдихме грешката да се приема липсата на статистическа значимост като индикация, че две лечения са еднакво ефективни. Също толкова важно е да не се отъждествява статистическата значимост с клиничната значимост. Може да се приеме клинично значение, когато резултатът е статистически значим и степента на оценката на ефективността на лечението

Проучванията могат да покажат дали резултатите са статистически значими и кои са клинично важни и кои не. На фиг. A1.2 показва резултатите от четири теста, за които целият CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.