![]() |
![]() |
||
|
|
Модуль 3
Лекція 1. Перевірка статистичних гіпотез. План 1. Принцип практичної впевненості. 2. Статистична гіпотеза та загальна схема її перевірки. 3. Перевірка гіпотез про рівність середніх сукупностей. 1.Якщо ймовірність події А у даному досліді дуже мала, то при одноразовому повторенні досліду можна бути практично впевненим, що подія А не настане, та в практичної діяльності поводитися так, нібито подія А неможлива. Якщо ж проведено багато дослідів (n), то це збільшує ймовірність настання події А n разів. 2. З теорією статистичного оцінювання тісно пов’язана перевірка статистичних гіпотез. Її використовують всякий раз, коли необхідно зробити обґрунтований висновок про переваги того чи іншого засобу, процесу та ін. Статистичною гіпотезою називається припущення про вигляд або параметри невідомого закону розподілу, яке може бути перевірене за результатами спостережень. Висунуту гіпотезу, яку треба перевірити виділяють, як головну і позначають, як правило, H0 (або H), а іншу – як альтернативну (конкуруючу) і позначають H1 (або K). Нульова та конкуруюча гіпотезу являють собою дві можливості вибору, що взаємовиключають одна одну. Припущення-гіпотези можуть бути різними, та їх можна перевірити за допомогою статистичних даних. Обмеженість вибіркових даних припускає можливість прийняття неправильного рішення. Очевидно, що за статистичними даними важко, а іноді і неможливо робити безпомилкові висновки, при цьому помилки при перевірці гіпотез можуть бути двох родів. Помилка першого роду складається в тому, що відкидається основна гіпотеза, коли вона вірна. При помилці другого роду відкидається вірна конкуруюча гіпотеза. Ймовірність α припуститися помилки першого роду називається рівнем значущості критерію, ймовірність припуститися помилки другого роду зазвичай позначають β. Ймовірність (1–β) не припуститися помилки другого роду називають потужністю критерію. З метою перевірки статистичної гіпотези використовують спеціально складену випадкову величину (статистику або критерій) розподіл якої відомий, її позначають t, F чи Χ2 у залежності від її розподілу (у загальному вигляді позначимо Вимоги до критичної області аналітично можна записати так:
тобто критичну область слід обирати так, щоб ймовірність потрапляння у неї статистики В залежності від вигляду конкуруючої гіпотези H1 обирають правосторонню, лівосторонню або двосторонню критичні області. Так можна впевнитися, що при конкуруючій гіпотезі H1: а>a0 слід використовувати правосторонню критичну область, у випадку H1: а<a0 – лівосторонню критичну область, а при конкуруючій гіпотезі H1: а≠a0 – двосторонню критичну область. За таких обставин границі критичних областей - для правосторонньої критичної області
- для лівосторонньої критичної області
- для двосторонньої критичної області
Принцип перевірки статистичної гіпотези не дає логічного доведення її вірності або невірності. Прийняття гіпотези слід розглядати лише як твердження, що не містить протиріч до дослідних даних. 3. Розглянемо задачу порівняння двох середніх генеральних сукупностей. Нехай є дві сукупності, що характеризуються генеральними середніми Для перевірки гіпотези з цих сукупностей взято дві незалежні вибірки об’ємами n1 та n2 за якими знайдено середні арифметичні За достатньо великими об’ємами вибірки вибіркові середні мають спостижено нормальні закони розподілу з параметрами У випадку правильної гіпотези H0 різниця Тому при виконання гіпотези H0 статистика
має стандартний нормальний розподіл. У випадку конкуруючої гіпотези H1:
а при конкуруючій гіпотезі H1:
Якщо фактичне значення статистики t, що спостерігається більше tкр, що його визначено на рівні значущості α (за абсолютною величиною), тобто |t|>tкр, то гіпотезу H0 відкидаємо, інакше – робимо висновок, що гіпотеза не містить протиріччя до вибіркових даних. Будемо вважати, що розподіл ознаки (випадкової величини) X та Y у кожній сукупності має нормальний розподіл. В такому випадку, якщо генеральні дисперсії відомі, то перевірка гіпотез проводиться таким самим чином не тільки для великих, але і для малих за об’ємом вибірок. Якщо ж дисперсії невідомі проте рівні, тобто
Проте найкращою оцінкою буде дисперсія змішаної сукупності об’єму n1+n2, тобто
а оцінкою дисперсії різниці незалежних вибіркових середніх
У випадку справедливості гіпотези H0 статистика
має t-розподіл Стьюдента з k=n1+n2–2 степенями вільності. Тому критичне значення статистики t знаходяться за тими ж формулами (1)-(2), де замість функції Лапласа береться функція
При цьому правило відкидання (прийняття) гіпотези зберігається. |
||
|