statistic hat
Модуль 3

Лекція 1. Перевірка статистичних гіпотез.

     План

1. Принцип практичної впевненості.

2. Статистична гіпотеза та загальна схема її перевірки.

3. Перевірка гіпотез про рівність середніх сукупностей.

1.Якщо ймовірність події А у даному досліді дуже мала, то при одноразовому повторенні досліду можна бути практично впевненим, що подія А не настане, та в практичної діяльності поводитися так, нібито подія А неможлива.

Якщо ж проведено багато дослідів (n), то це збільшує ймовірність настання події А n разів.

2. З теорією статистичного оцінювання тісно пов’язана перевірка статистичних гіпотез. Її використовують всякий раз, коли необхідно зробити обґрунтований висновок про переваги того чи іншого засобу, процесу та ін.

Статистичною гіпотезою називається припущення про вигляд або параметри невідомого закону розподілу, яке може бути перевірене за результатами спостережень.

Висунуту гіпотезу, яку треба перевірити виділяють, як головну і позначають, як правило, H0 (або H), а іншу – як альтернативну (конкуруючу) і позначають H1 (або K). Нульова та конкуруюча гіпотезу являють собою дві можливості вибору, що взаємовиключають одна одну.

Припущення-гіпотези можуть бути різними, та їх можна перевірити за допомогою статистичних даних. Обмеженість вибіркових даних припускає можливість прийняття неправильного рішення. Очевидно, що за статистичними даними важко, а іноді і неможливо робити безпомилкові висновки, при цьому помилки при перевірці гіпотез можуть бути двох родів. Помилка першого роду складається в тому, що відкидається основна гіпотеза, коли вона вірна. При помилці другого роду відкидається вірна конкуруюча гіпотеза. Ймовірність α припуститися помилки першого роду називається рівнем значущості критерію, ймовірність припуститися помилки другого роду зазвичай позначають β. Ймовірність (1–β) не припуститися помилки другого роду називають потужністю критерію.

З метою перевірки статистичної гіпотези використовують спеціально складену випадкову величину (статистику або критерій) розподіл якої відомий, її позначають t, F чи Χ2 у залежності від її розподілу (у загальному вигляді позначимо ). Прийняте рішення, щодо нульової гіпотези опирається на статистичний критерій – правило за яким гіпотеза повинна бути прийнята чи відкинута. Статистичний критерій розбиває всю множину можливих значень статистики (критерію)  на дві множини, що не перетинаються: критичну область (область відкидання гіпотези) та область припустимих значень (область прийняття гіпотези). При перевірці гіпотези намагаються обрати таку критичну область, де потужність критерію буде найбільшою.

Вимоги до критичної області аналітично можна записати так:

тобто критичну область слід обирати так, щоб ймовірність потрапляння у неї статистики  була мінімальною та рівною α, якщо гіпотеза H0 вірна, та максимальною у протилежному випадку. Або іншими словами, критична область повинна бути такою, щоб при даному рівні значущості α, потужність критерію була б найбільшою.

В залежності від вигляду конкуруючої гіпотези H1 обирають правосторонню, лівосторонню або двосторонню критичні області. Так можна впевнитися, що при конкуруючій гіпотезі H1: а>a0 слід використовувати правосторонню критичну область, у випадку H1: а<a0 – лівосторонню критичну область, а при конкуруючій гіпотезі H1: а≠a0 – двосторонню критичну область. За таких обставин границі критичних областей  при заданому рівні значущості визначаються з відповідних співвідношень:

- для правосторонньої критичної області

- для лівосторонньої критичної області

- для двосторонньої критичної області

Принцип перевірки статистичної гіпотези не дає логічного доведення її вірності або невірності. Прийняття гіпотези слід розглядати лише як твердження, що не містить протиріч до дослідних даних.

3. Розглянемо задачу порівняння двох середніх генеральних сукупностей. Нехай є дві сукупності, що характеризуються генеральними середніми та відомими дисперсіями  та . Необхідно перевірити гіпотезу про рівність генеральних середніх H0:

Для перевірки гіпотези з цих сукупностей взято дві незалежні вибірки об’ємами n1 та n2 за якими знайдено середні арифметичні  та вибіркові дисперсії , .

За достатньо великими об’ємами вибірки вибіркові середні мають спостижено нормальні закони розподілу з параметрами  та   відповідно.

У випадку правильної гіпотези H0 різниця  має нормальний розподіл з математичним сподіванням  та дисперсією  (зауважимо, що дисперсія різниці двох незалежних величин дорівнює сумі їх дисперсій, а дисперсія n незалежних доданків в n разів менша за дисперсію кожного).

Тому при виконання гіпотези H0 статистика

має стандартний нормальний розподіл.

У випадку конкуруючої гіпотези H1:  (або H1: ) обирають односторонню критичну область та критичне значення статистики знаходять з умови

             (1)

а при конкуруючій гіпотезі H1:  обирають двосторонню критичну область, критичне значення статистики:

                (2)

Якщо фактичне значення статистики t, що спостерігається більше tкр, що його визначено на рівні значущості α (за абсолютною величиною), тобто |t|>tкр, то гіпотезу H0 відкидаємо, інакше – робимо висновок, що гіпотеза не містить протиріччя до вибіркових даних.

Будемо вважати, що розподіл ознаки (випадкової величини) X та Y у кожній сукупності має нормальний розподіл. В такому випадку, якщо генеральні дисперсії відомі, то перевірка гіпотез проводиться таким самим чином не тільки для великих, але і для малих за об’ємом вибірок.

Якщо ж дисперсії невідомі проте рівні, тобто , то у якості не відомої величини можна взяти її оцінки – виправлену вибіркову дисперсію.

 або

Проте найкращою оцінкою буде дисперсія змішаної сукупності об’єму n1+n2, тобто

а оцінкою дисперсії різниці незалежних вибіркових середніх

У випадку справедливості гіпотези H0 статистика

має t-розподіл Стьюдента з k=n1+n2–2 степенями вільності. Тому критичне значення статистики t знаходяться за тими ж формулами (1)-(2), де замість функції Лапласа береться функція  для розподілу Стьдента при кількості ступенів волі k=n1+n2–2, тобто

                  (3)

                   (4)

При цьому правило відкидання (прийняття) гіпотези зберігається.



lпопередня лекція прикладизавданнямодуль наступна лекціяr