Логарифмічний розподіл. Логарифмічно нормальний розподіл. Зв'язок з іншими розподілами

Головна / Контакти

Модель логарифмічного розподілу відомого англійського математика Фішера була першою спробою описати відношення між числом видів та числом особин цих видів. Особливим успіхом ця модель користувалася в ентомологічних дослідженнях і вперше була застосована Фішером як теоретична модель для опису розподілу видів у колекціях. Цій моделі та статистиці різноманітності було присвячено докладне дослідження Л. Р. Тейлора із співавторами.

Розподіл частот видів для логарифмічного розподілу описується такою послідовністю:

де  х– число видів, представлених однією особиною, х 2 /2 – число видів, представлених двома особинами тощо.

Логарифмічна модель має два параметри  та x. Це означає, що для вибірки обсягом Nта числом видів Sіснує тільки один можливий розподіл частот видів за їх відносною різноманітністю, так як і , і хє функціями Nі S. Чим більша вибірка, витягнута з цієї спільноти, тим більше значення хі тим менше частка особин, що належать до видів, представлених однією особиною у вибірці. Два параметри Sі N(загальна кількість особин) пов'язані між собою залежністю
, де – індекс різноманітності, який можна отримати з рівняння:

,

де сума всіх особин N, що належать Sвидам:

Моделью логарифмічного розподілу, що характеризується малим числом багатих видів та великою часткою «рідкісних», з найбільшою ймовірністю можна описати такі спільноти, структура яких визначається одним чи небагатьма екологічними факторами.

Як показали дослідження, проведені Мегарран в Ірландії, такому ряду відповідає розподіл різноманітних видів рослин наземного ярусу в хвойних культурах в умовах низького освітлення.

5.3.3. Логарифмічно-нормальний розподіл

Для більшості спільнот характерний лог-нормальний розподіл різноманіття видів, але зазвичай ця модель вказує на велике, зріле та різноманітне співтовариство. Такий розподіл характерний для систем, коли величина якоїсь змінної визначається великою кількістю факторів.

Ця модель вперше була застосована до розподілу різноманіття видів Престоном. На різноманітному емпіричному матеріалі він показав, що частоти видів у великих вибірках розподілені відповідно до логарифмічно-нормального закону. За розробленою ним методикою частотні класи групуються види з числом особин, укладеним у проміжках, які обмежені числами геометричної прогресії. Престон завдав на вісь різноманіття видів у масштабі логарифму на підставі 2 (log 2) і назвав класи, що вийшли, октавами. Але для опису моделі можна використовувати будь-яку основу логарифму. На графіці розподілу частот видів за отриманими таким способом класам чисельності відповідають відомою кривою нормального розподілу, зрізаної зліва, частот частот рідкісних видів.

Розподіл зазвичай записується у формі:

, де

S R – теоретичне число видів у октаві, розташованій у R октавах від модальної октави; S mo– число видів у модальній октаві; - Стандартне відхилення теоретичної лог-нормальної кривої, виражене в числі октав.

Рис. 5.3.2. Лог-нормальний розподіл

Лог-нормальний розподіл описується симетричною «нормальною», тобто дзвоноподібною кривою (рис. 5.3.2.). Однак якщо дані, яким вона відповідає, отримані з обмеженої вибірки, то ліва частина кривої (тобто рідкісні, невраховані види) буде виражена нечітко. Престон назвав таку точку усічення кривою зліва «лінією завіси». Лінія завіси може зрушуватися вліво при збільшенні обсягу вибірки. На малюнку вона вказана стрілкою. Більшість вибірок виражена лише частина кривої праворуч від моди. Тільки за великої кількості даних, зібраних на великих біогеографічних територіях, простежується повна крива. S-Образна крива вказує на складний характер диференціації та перекривання ніш. Більшість видів у природних відкритих екосистемах існує за умов змагання за ресурси, а чи не за умов прямої конкуренції; безліч адаптацій дає можливість ділити ніші без конкурентного винятку з місця проживання. Ця модель найімовірніша для непорушених спільнот.


Випадкова змінна Y має логарифмічно нормальний розподіл із параметрами μ та σ, якщо випадкова змінна X = lnY має нормальний розподіл із тими самими параметрами μ та σ. Знаючи характер зв'язку між змінними X та Y, можемо легко побудувати графік щільності ймовірності випадкової змінної з логарифмічно нормальним розподілом (Малюнок 4.2).

Рисунок 4.2 – Криві щільності логарифмічно нормального розподілу при різних значеннях параметрів μ та σ

Якщо випадкова змінна X має функцію щільності ймовірності, яка визначається формулою (4.6), і якщо X = lnY, то:

Звідки маємо для у > 0:

З визначення випливає, що випадкова змінна, що підкоряється логарифмічно нормальному розподілу, може набувати лише позитивних значень. Як показано на малюнку 4.2, криві функції f(y) мають лівосторонню асиметрію, яка тим сильніша, чим більше значення параметрів μ та σ. Кожна крива має один максимум і є певною для всіх позитивних значень.

Обчислення математичного очікування та дисперсії випадкової змінної з логарифмічно нормальним розподілом не становить особливих труднощів:

Шляхом підстановок та введення нових змінних в інтегралах 4.15 та 4.16 отримаємо:

Взагалі, для обчислення ймовірності того, що випадкова змінна Y з логарифмічно нормальним розподілом і щільністю f(y, μ, σ), набуде значення в інтервалі (а, b), слід взяти інтеграл:

Однак на практиці зручніше скористатися тим, що логарифм випадкової змінної Y має нормальний розподіл. Імовірність того, що а ≤ Y ≤ b рівнозначна ймовірності того, що
lnа ≤ lnY ≤ lnb.

Обчислимо ймовірність того, що випадкова змінна з логарифмічно розподілом μ = 1, σ = 0,5, набуде значення в інтервалі (2, 5). Маємо:

З таблиць логарифмів знаходимо ln2 = 0,6932 та ln5 = 1,6094.

Позначивши lnY = X, можемо написати:

Причому випадкова змінна X підпорядкована нормальному розподілу із середнім значенням μ = 1 та стандартним відхиленням σ = 0,5. Тепер шукану ймовірність неважко обчислити за таблицями інтегральної функції нормального розподілу:

Запитання для самоконтролю

1 Визначення прямокутного розподілу.

2 Графік щільності ймовірності випадкової змінної з прямокутним розподілом

3 Основне значення прямокутного розподілу.

4 Математичне очікування та дисперсія випадкової змінної у прямокутному розподілі.

5 Роль нормального розподілу математичної статистики.

6 Що таке нормальне розподілення і як воно пов'язане з біномним?

7 Графік густини ймовірності випадкової змінної з нормальним розподілом.

8 Якими статистичними параметрами може бути заданий нормальний розподіл?

9 Чому нормальний розподіл є безперервним?

10 Зрівняння нормальної кривої.

11 Що таке нормоване відхилення?

12 Рівняння кривої нормального розподілу у нормованій формі.

13 Якими значеннями μ та σ характеризується нормальна сукупність у нормованій формі?

14 Яка частка даних вибірки укладається в межах ±1?, ±2?, ±3?

15 Що показує таблиця нормального інтегралу ймовірностей?

16 Рівняння логарифмічно нормальної кривої.

17 Графік густини ймовірності випадкової змінної з логарифмічно нормальним розподілом.

18 Які необхідно виконати перетворення, щоб з логарифмічно нормального розподілу отримати нормальний розподіл?

19 Якими статистичними параметрами логарифмічно задається нормальний розподіл?

ТЕМА 5 Розподіл параметрів вибірки

5.1 t – розподіл Стьюдента

5.2 F-розподіл Фішера-Снедекору

5.3 χ 2 -розподіл

5.1 t – розподіл Стьюдента

Закон нормального розподілу проявляється за ознак n > 20–30. Проте експериментатор часто проводить обмежена кількістьвимірів, що грунтує свої висновки на малих вибірках. При невеликій кількості спостережень результати зазвичай близькі і рідко з'являються великі відхилення. Це легко пояснити законом нормального розподілу, згідно з яким ймовірність появи малих відхилень більша, ніж відхилень значних. Так, ймовірність відхилень, що перевищують по абсолютній величині ±2σ, дорівнює 0,05 або один випадок на 20 вимірювань, а відхилень ± 3σ – 0,01, або один випадок на 100.

Якщо ж польовий досвід проводять, наприклад, у 4 – 6 повторностях, то природно очікувати, що серед показань урожаїв на паралельних ділянках великих відхилень не буде. Тому стандартне відхилення s, підраховане за малою вибіркою, в більшості випадків буде менше, ніж у всій генеральній сукупності. Отже, у випадках покладатися на критерії нормального розподілу у висновках не можна.

З початку XX століття в математичній статистиці став розробляти новий напрямок, який можна назвати статистикою малих вибірок. Найбільше практичне значення для експериментальної роботи мало відкрите в 1908 р. англійським статистиком і хіміком В. Держсетом t-розподіл, що отримав назву розподілу Стьюдента (англ. Стюдент - студент, псевдонім В. Госсета).

Розподіл t Стьюдента для вибіркових середніх визначається рівністю:

Чисельник формули означає відхилення вибіркової середньої від середньої сукупності , а знаменник:

- є показником, що оцінює величину стандартної помилкисередньої вибіркової сукупності.

Таким чином, величина t вимірюється відхиленням вибіркової середньої від середньої сукупності, вираженим у частках помилки вибірки, прийнятої за одиницю.

Максимуми частоти нормального та t-розподілу збігаються, але форма кривої t-розподілу повністю залежить від числа ступенів свободи. При дуже малих значеннях ступенів свободи вона набуває вигляду плосковершинної кривої, причому площа, відмежована кривою, більша, ніж при нормальному розподілі, а при збільшенні числа спостережень (n > 30) розподіл t наближається до нормального і переходить у нього при n = ∞.

На малюнку 1.1 представлено диференціальний та інтегральний розподіл t-Стьюдента при 10 степенях свободи.

Рисунок 5.1 – Диференціальний (ліворуч) та інтегральний (праворуч) розподіл t–Стьюдента

Розподіл t-Стьюдента має важливе значення при роботі з малими вибірками: дозволяє визначити довірчий інтервал, що накриває середню сукупність , та перевірити ту чи іншу гіпотезу щодо генеральної сукупності. При цьому немає потреби знати параметри сукупності і достатньо мати їх оцінки μ і σ для певного обсягу вибірки n.

5.1.1 Проблема Беренса-Фішера

Перевірка гіпотези про генеральні середні дві групи з нормальним розподілом і нерівними дисперсіями в математичній статистиці називається проблемою Беренса-Фішера і має нині лише наближені рішення. Чому така важлива вимога рівності дисперсій у порівнюваних групах? Не вдаючись у деталі цієї проблеми, відзначимо, що чим більше різняться між собою дисперсії та обсяги вибірок, тим сильніше відрізняється розподіл "t-критерію, що обчислюється" від розподілу "t-критерію Стьюдента". У цьому різну величину має як сам t-критерій, і такий параметр цих розподілів, як число ступенів свободи. У свою чергу, число ступенів свободи позначається на величині досягнутого (критичного) рівня значущості (р< ...) определяемого для вычисленного значения t-критерия.

Нехтування дослідниками, наведеними вище умовами допустимості використання t-критерію Стьюдента, призводить до суттєвого спотворення результатів перевірки гіпотез про рівність середніх. Тому в роботах, де перевірка гіпотез про рівність двох середніх здійснювалася за допомогою t-критерію Стьюдента, і немає згадки критеріїв перевірки нормальності розподілу та рівності дисперсій, є підстави припускати некоректне використання авторами даного критерію, а отже, і сумнівність декларованих ними висновків.

Інша часта помилка - застосування t-критерію Стьюдента для перевірки гіпотез про рівність трьох і більше групових середніх. У цьому випадку необхідно застосовувати так звану загальну лінійну модель, реалізовану в однофакторній процедурі дисперсійного аналізуз фіксованими ефектами.

Розглянемо докладніше особливості використання t-критерію Стьюдента. Найчастіше t-критерій використовується у двох випадках. У першому випадку його застосовують для перевірки гіпотези про рівність генеральних середніх двох незалежних, незв'язаних вибірок (так званий двовибірковий t-критерій). У цьому випадку є контрольна група та досвідчена група, що складається з різних об'єктів, кількість яких у групах може бути різною. У другому випадку використовується так званий парний t-критерій, коли одна і та ж група об'єктів породжує числовий матеріал для перевірки гіпотез про середніх. Тому ці вибірки називають залежними, пов'язаними. Наприклад, вимірюється вміст лейкоцитів у здорових тварин, а потім у тих самих тварин після опромінення певною дозою випромінювання. В обох випадках має виконуватися вимога нормальності розподілу досліджуваної ознаки у кожній із порівнюваних груп. Домінування t-критерію Стьюдента в переважній більшості робіт відображає два важливі аспекти.

По-друге, це говорить також і про те, що цим авторам невідомі будь-які альтернативи даному критерію, або вони не в змозі ними самостійно скористатися. Можна без перебільшення сказати, що в даний час бездумне застосування t-критерію Стьюдента в більшості біологічних робіт приносить більше шкоди, ніж користі.

5.2 F-розподіл Фішера-Снедекору

Якщо з нормально розподіленої сукупності взяти дві незалежні вибірки обсягом n 1 та n 2 та підрахувати дисперсії і зі ступенями свободи ν 1 = n -1 і ν 2 = n 2 -1, то можна визначити відношення дисперсій:

Відношення дисперсій беруть таким, щоб у чисельнику була велика дисперсія, і тому F ≥ 1.

Розподіл F залежить тільки від числа ступенів свободи 1 і 2 (закон F-розподілу відкрив Р.А. Фішер). Коли дві порівнювані вибірки є випадковими незалежними із загальної сукупності з генеральною середньою, то фактичне значення F не вийде за певні межі і не перевищить критичне для даних 1 і 2 теоретичне значення критерію F (F факт< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >Теор. Теоретичні значення F для 5%-ного та 1%-ного рівня значущості дано в таблиці, де табульовані тільки праві критичні точки для F ≥ 1, так як завжди прийнято знаходити відношення більшої дисперсії до меншої.

Криві, отримані з функції розподілу для всіх можливих значень F, особливо при невеликій кількості спостережень, мають асиметричну форму - довгий хвіст великих значень і велику концентрацію малих величин F (рисунок 5.2).

Рисунок 5.2 – Диференціальне (ліворуч) та інтегральне (праворуч)
F-розподіл Фішера-Снедекору

Зазначимо, що t-розподіл Стьюдента є окремим випадком F-розподілу при числі ступенів свободи ν 1 = 1 і ν 2 = ν, тобто дорівнює числу ступенів свободи для розподілу t. У цьому випадку спостерігається наступне співвідношення між F та t:

5.3 χ 2 -розподіл

Багато фактичних розподілів відповідають моделям теоретичних розподілів (нормальний, біноміальний, Пуассон) Однак, на практиці існують розподіли, що сильно відрізняються від нормального. Для оцінки ступеня розбіжності або ступеня згоди між чисельностями фактичного та теоретичного розподілів запроваджуються статистичні критерії згоди, наприклад, критерій 2 . Цей критерій застосовується для вирішення задач статистичного аналізунаприклад, для перевірки гіпотез: про незалежність двох принципів, покладених в основу угруповання результатів спостережень з однієї сукупності; про однорідність груп щодо деяких визначених характеристик; про згоду теоретичної та експериментальної кривих чисельностей. Критерій 2 може називатися як критерієм згоди, так і критерієм незалежності, критерієм однорідності. Закон розподілу χ 2 (хі-квадрат) відкрив К. Пірсон. Крива розподілу, отримана з функції хі-квадрат:

де f – фактичні та F – теоретичні частоти чисельності об'єктів вибірки. Її вигляд сильно залежить від числа ступенів свободи. Для малого числа ступенів свободи крива асиметрична (рисунок 5.3), але зі збільшенням асиметрія зменшується і при ν = крива стає нормальною гаусової.

Розподіл χ 2 , так само як і t-розподіл, окремий випадок
F – розподіли за ν 1 = ν і ν 2 = ∞.

Рисунок 5.3 – Диференціальне (ліворуч) та інтегральне (праворуч)
χ 2 -розподіл

Запитання для самоконтролю

1 У яких випадках краще використовувати t-розподіл Стьюдента, а не нормальний розподіл?

2 Які величини необхідно оцінювати для використання t-розподілу Стьюдента?

3 У чому суть проблеми Беренса-Фішера?

4 Чим чисельно виражається F-розподіл для двох незалежних вибірок із загальної сукупності змінних?

5 Від яких характерних величин випадкових змінних залежить F-розподіл?

6 На які питання може відповісти значення критерію 2 при статистичній обробці експериментальних даних?

ТЕМА 6 Основи математичної статистики

6.1 Середні величини

6.2 Середня арифметична

6.3 Середня геометрична

6.4 Середня гармонійна

Логарифмічно нормальна функція розподілу знайшла широке застосування при аналізі надійності об'єктів техніки, біології, економіки та ін. Наприклад, функцію успішно застосовують для опису напрацювання повністю підшипників, електронних приладів та інших виробів.

Невід'ємні випадкові значеннядеякого параметра розподілено логарифмічно нормально, якщо його логарифм розподілено нормально. Щільність розподілу для різних значень наведена на рис. 4.3.

Рис. 4.3.

Щільність розподілу описується залежністю

де Мх і σ – параметри, що оцінюються за результатами пвипробувань до відмови:

(4.4)

Для логарифмічно нормального закону розподілу функція надійності

(4.5)

Імовірність безвідмовної роботи можна визначити за таблицями для нормального розподілу (див. табл. П6.1 додатка 6) залежно від значення квантилю

Математичне очікування напрацювання до відмови

Середнє квадратичне відхилення та коефіцієнт варіації відповідно дорівнюватимуть

Якщо v x 0,3, то вважають, що ν x = σ, при цьому помилка становить не більше 1%.

Часто застосовують запис залежностей для логарифмічно нормального закону розподілу у десяткових логарифмах. Відповідно до цього закону щільність розподілу

Оцінки параметрів lg x 0 і σ визначають за результатами випробувань:

Математичне очікування Мх, середнє квадратичне відхилення σ x та коефіцієнт варіації ν x напрацювання вщент відповідно рівні

Приклад 4.6

Визначити можливість безвідмовної роботи редуктора протягом t= 103 год, якщо ресурс розподілено логарифмічно нормально з параметрами lg t 0 = 3,6; σ = 0,3.

Рішення

Знайдемо значення квантилю та визначимо ймовірність безвідмовної роботи:

Відповідь: R(t) = 0,0228.

Розподіл Вейбулла

Функція розподілу Вейбулла є двопараметричним розподілом. Описуваний нею закон є універсальним, оскільки за відповідних значеннях параметрів перетворюється на нормальне, експоненційне та інші види розподілів. Автор цього закону розподілу В. Вейбулл використовував його при описі та аналізі експериментально спостерігалися розкидів втомної міцності сталі, меж її пружності. Закон Вейбулла задовільно описує напрацювання повністю підшипників, елементів електронної апаратури, його використовують для оцінки надійності деталей і вузлів машин, у тому числі автомобілів, а також для оцінки надійності машин у процесі їх приробітку. Щільність розподілу описується залежністю

де - параметр форми кривої розподілу; λ – параметр масштабу кривої розподілу.

Графік функції густини розподілу наведено на рис. 4.4.

Рис. 4.4.

Функція розподілу Вейбулла

Функція надійності для цього закону розподілу

Математичне очікування випадкової величини ходно

де Г( x) - Гамма-функція.

Для безперервних значень х

Для цілих значень хгамма-функцію обчислюють за формулою

також вірні формули

Дисперсія випадкової величини дорівнює

Широке застосування при аналізі та розрахунках надійності виробів закону розподілу Вейбулла пояснюється тим, що цей закон, узагальнюючи експоненційний розподіл, містить додатковий параметр α.

Підбираючи належним чином параметри а і λ, можна отримати кращу відповідність розрахункових значень досвідченим даним порівняно з експоненційним законом, який є однопараметричним (параметр λ).

Так, для виробів, які мають приховані дефекти, але які тривалий час не використовуються (а значить, повільніше старіють), небезпека відмови має найбільше значення в початковий період, а потім швидко падає. Функція надійності такого виробу добре описується законом Вейбулла з параметром α< 1.

Навпаки, якщо виріб добре контролюється при виготовленні і майже не має прихованих дефектів, але піддається швидкому старінню, то функція надійності описується законом Вейбулла з параметром >1. При α = 3,3 розподіл Вейбулла близький до нормального.

У випадку, якщо все ж таки серед є негативні або нульові члени, то тоді можна до кожного члена ряду додати деяку константу, наприклад, . За однією з властивостей математичного очікування, ця операція змінить основні статистичні характеристики ряду. Ця операція дозволяє перейти до логнормального розподілу у цьому випадку.

В результаті застосування операції логарифмування (36) до досліджуваного ряду істотно зменшується розкид між даними. Це можна побачити з рис. 9.16: очевидно, що .

Функція розподілу нового ряду дорівнюватиме

(37)

Але тоді

(38)
(39)

І наостанок,

(40)

Формули (37) – (40) дають зв'язок між логнормальним та вихідним розподілами.


Рис. 9.16.

Закон розподілу Пуассона (закон розподілу рідкісних явищ)

Усі розподіли за досить великої кількості випробувань прагнуть нормальному закону розподілу. Однак, якщо серед даних є рідкісні, виняткові результати, то розподіл цих рідкісних явищ, в той час коли основна маса прагне нормального закону, прагне іншого закону - закону розподілу Пуассона. І тому закону характерно, що з ймовірності чи прагнуть нулю. В цьому випадку біномінальний розподілПуассона переходить у

(41)

Де має той самий сенс, що й у нормальному розподілі.

Закон розподілу Пуассона, що задається формулою (41), описує ймовірність появи подій, що відбуваються через приблизно рівні проміжки часу, за умови, що всі події відбуваються незалежно один від одного і з деякою інтенсивністю, навіть дуже маленькою, але обов'язково постійною. Число випробувань при цьому велике, а ймовірність появи очікуваної події дуже мала і дорівнює. Параметр тоді характеризуватиме інтенсивність появи очікуваної події у послідовності випробувань.

У такому разі спробуємо обчислити матожидання.

Характерною особливістю цього виду розподілу будуть такі математичні співвідношення:

Приклад 5. На полігоні було відібрано 150 зразків. У деяких із них знайшли присутність рідкісного елемента:

Визначити закон розподілу елемента, що шукається.

Рішення. Для відповіді питання в завданні слід перевірити виконання рівності (45), що є характерною ознакою розподілу Пуассона. Для простоти обчислень братимемо не соті частки, а числа, збільшені в 100 разів, тобто.

У зв'язку з тим, що , укладаємо, що розподіл шуканого елемента підпорядковується закону розподілу Пуассона. Тепер, користуючись співвідношеннями (42) обчислимо через теоретичне , порівняємо його з вихідною частотою і

Випадкова змінна Y має логарифмічно нормальний розподіл із параметрами μ та σ, якщо випадкова змінна X = lnY має нормальний розподіл із тими самими параметрами μ та σ. Знаючи характер зв'язку між змінними X та Y, можемо легко побудувати графік щільності ймовірності випадкової змінної з логарифмічно нормальним розподілом (Малюнок 4.2).

Рисунок 4.2 – Криві щільності логарифмічно нормального розподілу при різних значеннях параметрів μ та σ

Якщо випадкова змінна X має функцію щільності ймовірності, яка визначається формулою (4.6), і якщо X = lnY, то:

Звідки маємо для у > 0:

З визначення випливає, що випадкова змінна, що підкоряється логарифмічно нормальному розподілу, може набувати лише позитивних значень. Як показано на малюнку 4.2, криві функції f(y) мають лівосторонню асиметрію, яка тим сильніша, чим більше значення параметрів μ та σ. Кожна крива має один максимум і є певною для всіх позитивних значень.

Обчислення математичного очікування та дисперсії випадкової змінної з логарифмічно нормальним розподілом не становить особливих труднощів:

Шляхом підстановок та введення нових змінних в інтегралах 4.15 та 4.16 отримаємо:

Взагалі, для обчислення ймовірності того, що випадкова змінна Y з логарифмічно нормальним розподілом і щільністю f(y, μ, σ), набуде значення в інтервалі (а, b), слід взяти інтеграл:

Однак на практиці зручніше скористатися тим, що логарифм випадкової змінної Y має нормальний розподіл. Імовірність того, що а ≤ Y ≤ b рівнозначна ймовірності того, що
lnа ≤ lnY ≤ lnb.

Обчислимо ймовірність того, що випадкова змінна з логарифмічно розподілом μ = 1, σ = 0,5, набуде значення в інтервалі (2, 5). Маємо:

З таблиць логарифмів знаходимо ln2 = 0,6932 та ln5 = 1,6094.

Позначивши lnY = X, можемо написати:

Причому випадкова змінна X підпорядкована нормальному розподілу із середнім значенням μ = 1 та стандартним відхиленням σ = 0,5. Тепер шукану ймовірність неважко обчислити за таблицями інтегральної функції нормального розподілу:

Запитання для самоконтролю

1 Визначення прямокутного розподілу.

2 Графік щільності ймовірності випадкової змінної з прямокутним розподілом

3 Основне значення прямокутного розподілу.

4 Математичне очікування та дисперсія випадкової змінної у прямокутному розподілі.



5 Роль нормального розподілу математичної статистики.

6 Що таке нормальне розподілення і як воно пов'язане з біномним?

7 Графік густини ймовірності випадкової змінної з нормальним розподілом.

8 Якими статистичними параметрами може бути заданий нормальний розподіл?

9 Чому нормальний розподіл є безперервним?

10 Зрівняння нормальної кривої.

11 Що таке нормоване відхилення?

12 Рівняння кривої нормального розподілу у нормованій формі.

13 Якими значеннями μ та σ характеризується нормальна сукупність у нормованій формі?

14 Яка частка даних вибірки укладається в межах ±1?, ±2?, ±3?

15 Що показує таблиця нормального інтегралу ймовірностей?

16 Рівняння логарифмічно нормальної кривої.

17 Графік густини ймовірності випадкової змінної з логарифмічно нормальним розподілом.

18 Які необхідно виконати перетворення, щоб з логарифмічно нормального розподілу отримати нормальний розподіл?

19 Якими статистичними параметрами логарифмічно задається нормальний розподіл?

ТЕМА 5 Розподіл параметрів вибірки

5.1 t – розподіл Стьюдента

5.2 F-розподіл Фішера-Снедекору

5.3 χ 2 -розподіл

5.1 t – розподіл Стьюдента

Закон нормального розподілу проявляється за ознак n > 20–30. Проте експериментатор часто проводить обмежену кількість вимірів, грунтує свої висновки на малих вибірках. При невеликій кількості спостережень результати зазвичай близькі і рідко з'являються великі відхилення. Це легко пояснити законом нормального розподілу, згідно з яким ймовірність появи малих відхилень більша, ніж відхилень значних. Так, ймовірність відхилень, що перевищують по абсолютній величині ±2σ, дорівнює 0,05 або один випадок на 20 вимірювань, а відхилень ± 3σ – 0,01, або один випадок на 100.

Якщо ж польовий досвід проводять, наприклад, у 4 – 6 повторностях, то природно очікувати, що серед показань урожаїв на паралельних ділянках великих відхилень не буде. Тому стандартне відхилення s, підраховане за малою вибіркою, в більшості випадків буде менше, ніж у всій генеральній сукупності. Отже, у випадках покладатися на критерії нормального розподілу у висновках не можна.

З початку XX століття в математичній статистиці став розробляти новий напрямок, який можна назвати статистикою малих вибірок. Найбільше практичне значення для експериментальної роботи мало відкрите в 1908 р. англійським статистиком і хіміком В. Держсетом t-розподіл, що отримав назву розподілу Стьюдента (англ. Стюдент - студент, псевдонім В. Госсета).

Розподіл t Стьюдента для вибіркових середніх визначається рівністю:

Чисельник формули означає відхилення вибіркової середньої від середньої сукупності , а знаменник:

- є показником, що оцінює величину стандартної помилки середньої вибіркової сукупності.

Таким чином, величина t вимірюється відхиленням вибіркової середньої від середньої сукупності, вираженим у частках помилки вибірки, прийнятої за одиницю.

Максимуми частоти нормального та t-розподілу збігаються, але форма кривої t-розподілу повністю залежить від числа ступенів свободи. При дуже малих значеннях ступенів свободи вона набуває вигляду плосковершинної кривої, причому площа, відмежована кривою, більша, ніж при нормальному розподілі, а при збільшенні числа спостережень (n > 30) розподіл t наближається до нормального і переходить у нього при n = ∞.

На малюнку 1.1 представлено диференціальний та інтегральний розподіл t-Стьюдента при 10 степенях свободи.

Рисунок 5.1 – Диференціальний (ліворуч) та інтегральний (праворуч) розподіл t–Стьюдента

Розподіл t-Стьюдента має важливе значення при роботі з малими вибірками: дозволяє визначити довірчий інтервал, що накриває середню сукупність , та перевірити ту чи іншу гіпотезу щодо генеральної сукупності. При цьому немає потреби знати параметри сукупності і достатньо мати їх оцінки μ і σ для певного обсягу вибірки n.

5.1.1 Проблема Беренса-Фішера

Перевірка гіпотези про генеральні середні дві групи з нормальним розподілом і нерівними дисперсіями в математичній статистиці називається проблемою Беренса-Фішера і має нині лише наближені рішення. Чому така важлива вимога рівності дисперсій у порівнюваних групах? Не вдаючись у деталі цієї проблеми, відзначимо, що чим більше різняться між собою дисперсії та обсяги вибірок, тим сильніше відрізняється розподіл "t-критерію, що обчислюється" від розподілу "t-критерію Стьюдента". У цьому різну величину має як сам t-критерій, і такий параметр цих розподілів, як число ступенів свободи. У свою чергу, число ступенів свободи позначається на величині досягнутого (критичного) рівня значущості (р< ...) определяемого для вычисленного значения t-критерия.

Нехтування дослідниками, наведеними вище умовами допустимості використання t-критерію Стьюдента, призводить до суттєвого спотворення результатів перевірки гіпотез про рівність середніх. Тому в роботах, де перевірка гіпотез про рівність двох середніх здійснювалася за допомогою t-критерію Стьюдента, і немає згадки критеріїв перевірки нормальності розподілу та рівності дисперсій, є підстави припускати некоректне використання авторами даного критерію, а отже, і сумнівність декларованих ними висновків.

Інша часта помилка - застосування t-критерію Стьюдента для перевірки гіпотез про рівність трьох і більше групових середніх. В цьому випадку необхідно застосовувати так звану загальну лінійну модель, реалізовану в процедурі дисперсійного однофакторного аналізу з фіксованими ефектами.

Розглянемо докладніше особливості використання t-критерію Стьюдента. Найчастіше t-критерій використовується у двох випадках. У першому випадку його застосовують для перевірки гіпотези про рівність генеральних середніх двох незалежних, незв'язаних вибірок (так званий двовибірковий t-критерій). У цьому випадку є контрольна група та досвідчена група, що складається з різних об'єктів, кількість яких у групах може бути різною. У другому випадку використовується так званий парний t-критерій, коли одна і та ж група об'єктів породжує числовий матеріал для перевірки гіпотез про середніх. Тому ці вибірки називають залежними, пов'язаними. Наприклад, вимірюється вміст лейкоцитів у здорових тварин, а потім у тих самих тварин після опромінення певною дозою випромінювання. В обох випадках має виконуватися вимога нормальності розподілу досліджуваної ознаки у кожній із порівнюваних груп. Домінування t-критерію Стьюдента в переважній більшості робіт відображає два важливі аспекти.

По-друге, це говорить також і про те, що цим авторам невідомі будь-які альтернативи даному критерію, або вони не в змозі ними самостійно скористатися. Можна без перебільшення сказати, що в даний час бездумне застосування t-критерію Стьюдента в більшості біологічних робіт приносить більше шкоди, ніж користі.

5.2 F-розподіл Фішера-Снедекору

Якщо з нормально розподіленої сукупності взяти дві незалежні вибірки обсягом n 1 та n 2 та підрахувати дисперсії і зі ступенями свободи ν 1 = n -1 і ν 2 = n 2 -1, то можна визначити відношення дисперсій:

Відношення дисперсій беруть таким, щоб у чисельнику була велика дисперсія, і тому F ≥ 1.

Розподіл F залежить тільки від числа ступенів свободи 1 і 2 (закон F-розподілу відкрив Р.А. Фішер). Коли дві порівнювані вибірки є випадковими незалежними із загальної сукупності з генеральною середньою, то фактичне значення F не вийде за певні межі і не перевищить критичне для даних 1 і 2 теоретичне значення критерію F (F факт< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >Теор. Теоретичні значення F для 5%-ного та 1%-ного рівня значущості дано в таблиці, де табульовані тільки праві критичні точки для F ≥ 1, так як завжди прийнято знаходити відношення більшої дисперсії до меншої.

Криві, отримані з функції розподілу для всіх можливих значень F, особливо при невеликій кількості спостережень, мають асиметричну форму - довгий хвіст великих значень і велику концентрацію малих величин F (рисунок 5.2).

Рисунок 5.2 – Диференціальне (ліворуч) та інтегральне (праворуч)
F-розподіл Фішера-Снедекору

Зазначимо, що t-розподіл Стьюдента є окремим випадком F-розподілу при числі ступенів свободи ν 1 = 1 і ν 2 = ν, тобто дорівнює числу ступенів свободи для розподілу t. У цьому випадку спостерігається наступне співвідношення між F та t:

5.3 χ 2 -розподіл

Багато фактичних розподілів відповідають моделям теоретичних розподілів (нормальний, біноміальний, Пуассон) Однак, на практиці існують розподіли, що сильно відрізняються від нормального. Для оцінки ступеня розбіжності або ступеня згоди між чисельностями фактичного та теоретичного розподілів запроваджуються статистичні критерії згоди, наприклад, критерій 2 . Цей критерій застосовується для вирішення завдань статистичного аналізу, наприклад, для перевірки гіпотез: про незалежність двох принципів, покладених в основу угруповання результатів спостережень з однієї сукупності; про однорідність груп щодо деяких визначених характеристик; про згоду теоретичної та експериментальної кривих чисельностей. Критерій 2 може називатися як критерієм згоди, так і критерієм незалежності, критерієм однорідності. Закон розподілу χ 2 (хі-квадрат) відкрив К. Пірсон. Крива розподілу, отримана з функції хі-квадрат:

де f – фактичні та F – теоретичні частоти чисельності об'єктів вибірки. Її вигляд сильно залежить від числа ступенів свободи. Для малого числа ступенів свободи крива асиметрична (рисунок 5.3), але зі збільшенням асиметрія зменшується і при ν = крива стає нормальною гаусової.

Розподіл χ 2 , так само як і t-розподіл, окремий випадок
F – розподіли за ν 1 = ν і ν 2 = ∞.

Рисунок 5.3 – Диференціальне (ліворуч) та інтегральне (праворуч)
χ 2 -розподіл

Запитання для самоконтролю

1 У яких випадках краще використовувати t-розподіл Стьюдента, а не нормальний розподіл?

2 Які величини необхідно оцінювати для використання t-розподілу Стьюдента?

3 У чому суть проблеми Беренса-Фішера?

4 Чим чисельно виражається F-розподіл для двох незалежних вибірок із загальної сукупності змінних?

5 Від яких характерних величин випадкових змінних залежить F-розподіл?

6 На які питання може відповісти значення критерію 2 при статистичній обробці експериментальних даних?

ТЕМА 6 Основи математичної статистики

6.1 Середні величини

6.2 Середня арифметична

6.3 Середня геометрична

6.4 Середня гармонійна

© 2022 androidas.ru - Все про Android