statistic hat
Модуль 1


Лекція 2. Характеристики варіаційного ряду.

     План

1.Середні величини.

2. Показники варіації.

1. Середні величини характеризують значення ознаки, біля якої концентруються спостереження або, як ще кажуть, центральну тенденцію розподілу.

Середньою арифметичною статистичного ряду називають суму добутків усіх варіант на відповідні частоти, поділену на суму частот.

          (1.1)

де xi – варіанти дискретного ряду (середини інтервалів інтервального статистичного ряду): ni – відповідні їм частоти. Можна бачити також, що

Властивості середньої арифметичної :

  1. Середня арифметична постійної дорівнює власне постійній.
  2. Якщо варіанти збільшити (зменшити) у одне і те саме число разів, то середня арифметична збільшиться (зменшиться) у стільки ж разів.
  3. Якщо варіанти збільшити (зменшити) на одне і те саме число, то середня арифметична збільшиться (зменшиться) на те саме число.
  4. Середня арифметична відхилень варіант від середньої арифметичньої дорівнює нулю.

  1. Середня арифметична алгебраїчної суми декількох ознак дорівнює сумі середніх арифметичних цих ознак:

  1. Якщо ряд складається з декількох груп, загальна середня дорівнює середній арифметичній групових середніх, при цьому вагами є об’єми цих груп.

При розв’язуванні задач можуть застосовуватися й інші форми середньої, які можна отримати із середньої ступеневої k-го порядку.

При k=1 отримаємо середню арифметичну, при k=-1 – середню гармонічну

При k = 0 (після розкриття невизначеності) – середню геометричну

При k=2 середню квадратичну.

Окрім розглянутих раніше середніх величин (їх називають аналітичними), в статистичному аналізі застосовують структурні або порядкові середні.

Медіаною Ме статистичного ряду називають значення ознаки, що припадає на середину ранжованого ряду спостережень.

Модою Мо статистичного ряду називають значення ознаки, якій відповідає найбільша частота.

2. Головною вадою показників середнього є те, що вони не відображають варіації значень ознак, а вказують лише на деяке середнє, навколо якого групуються інші значення ознаки.

Найпростішим показником варіації є статистичний розмах R, що дорівнює різниці між максимальною та мінімальною варіантами ряду.

R=xmax – xmin

Найбільшу цікавість являють міри варіації (розсіювання) спостережень навколо середніх величин.

Дисперсією s2 статистичного ряду називають середню арифметичну квадратів відхилень варіант від їх середньої арифметичної.

          (1.2)

Враховуючи що , формулу (1) можна переписати у вигляді

Дисперсію s2 часто називають вибірковою (або емпіричною), на відміну від σ2 – генеральної дисперсії.

Бажано у якості міри варіації мати характеристику, яка була б виражена у тих самих одиницях, що й значення ознаки. Такою характеристикою є середнє квадратичне відхилення s – арифметичне значення кореня квадратного з дисперсії.

 

Можна також розглянути характеристику, яка не має розмірності – коефіцієнт варіації, який дорівнює відсотковому відношенню середньої квадратичної відхилення до середньої арифметичної.

Якщо значення коефіцієнту варіації досить великі (наприклад, більші 100%), то це свідчить про неоднорідність значень ознаки.

Властивості дисперсії (вони аналогічні до властивостей дисперсії випадкової величини).

  1. Дисперсія постійної дорівнює нулю.
  2. Якщо всі варіанти збільшити (зменшити) у k разів, то дисперсія збільшиться (зменшиться) у k2 разів. ()
  3. Якщо всі варіанти збільшити (зменшити) на одне і те саме число, то дисперсія не зміниться.
  4. Дисперсія дорівнює різниці між середньою арифметичною квадратів варіантів та квадратом середньої арифметичної.

де

5.       Якщо ряд складається з декількох груп спостережень, то загальна дисперсія дорівнює сумі середньої арифметичної групових дисперсій та дисперсії між групами.

          (2)

де s2 – загальна дисперсія (тобто дисперсія всього ряду);

- середня арифметична групових дисперсій

- дисперсія між групами.

Формула (2) має дуже важливе значення у статистичному аналізі.

Приклад: За даними прикладу 1.1 розрахувати дисперсію, середнє квадратичне відхилення та коефіцієнт варіації.

Для цього спочатку необхідно знайти середню арифметичну:

=

Тепер знайдемо дисперсію

=

Відповідно середнє квадратичне відхилення дорівнює

Коефіцієнт варіації:

Квантилем рівня q (або q-квантилем) називають таке значення xq випадкової величини, при якому функція її розподілу набуде значення q.

F(xq) = P(X< xq) = q

Визначення середньої арифметичної та дисперсії за формулами (1.1) та (1.2) на практиці інколи призводе до досить громіздких обчислень, тому, враховуючи властивості цих характеристик, можна перейти до наступних формул:

де                         (1.3)

k – величина інтервалу по х, с – середина відповідного інтервалу (частіше за все обирають інтервал, який має найбільшу частоту), тобто перейти до допоміжних варіант (1.3).

 


lпопередня лекція прикладизавданнямодуль наступна лекціяr