Реферат
з дисципліни
“Теорія ймовірностей та математична статистика”
на тему: „Однофакторний і двофакторний дисперсійний аналіз”
2006
Зміст
Вступ
1. Загальні відомості про дисперсійний аналіз
2. Однофакторний дисперсійний аналіз
3. Двофакторний дисперсійний аналіз
Висновки
Список використаної літератури
Важко установити, хто вперше порушив питання, нехай і в недосконалій формі, про можливість кількісного виміру можливості появи випадкової події. Ясно тільки, що більш-менш задовільну відповідь на це питання зажадав великого часу і значних зусиль видатних дослідників цілого ряду поколінь.
345 років тому, у 1657 році, був опублікований твір видатного голландського вченого Християна Гюйгенса "Про розрахунки при грі в кості", що є одним з перших досліджень в області теорії ймовірностей.
Звичайно вважають, що теорія ймовірностей виникла в середині XVII сторіччя, причому її появу зв'язують з іменами П. Ферма (1601-1665), Б. Паскаля (1623-1662) і Х. Гюйгенса (1629-1695). У роботах цих вчених у зародковому виді фігурували поняття ймовірності випадкової події і математичного чекання випадкової величини. Відправним пунктом досліджень були задачі, зв'язані з азартними іграми, особливо іграми в кості, оскільки при їхньому вивченні можна обмежуватися простими і зрозумілими математичними моделями. Однак учені розуміли важливість нових понять, наприклад, Гюйгенс у творі "Про розрахунки при грі в кісті" писав: "...думаю, при уважному вивченні предмета читач помітить, що має справу не тільки з грою, але що тут закладаються основи дуже цікавої і глибокої теорії".
Всі процеси, що відбуваються у природі чи людському суспільстві, є наслідком взаємодії багатьох факторів. Для того щоб вивчити ці процеси і надалі керувати ними, необхідно з'ясувати, яку роль у досліджуваному процесі відіграє кожний фактор окремо. Наприклад, у разі вивчення руху тіла слід з'ясувати, які сили спричинюють його рух, а які гальмують; яким чином саме рухоме тіло впливає на ті сили, що діють на нього. Досліджуючи процес зміни курсу деякої валюти, скажімо гривні, потрібно з'ясувати вплив багатьох економічних і соціальних факторів як внутрішніх, так і зовнішніх, що можуть істотно змінювати курс національної валюти щодо долара, німецької марки і т. ін.
Усі зазначені фактори необхідно подати з допомогою певних кількісних оцінок, а далі — скористатися відповідними математичними методами. Отже, щоб мати змогу застосувати математичні методи з метою вивчення взаємодії тих чи інших факторів, слід уміти виражати дію кожного з них кількісно.
Щоб дістати потрібні числові дані, необхідно провести серію спостережень. Отже, спостереження є найважливішою ланкою будь-якого експерименту. Слід, проте, враховувати, що жодний найретельніше підготовлений експеримент не дозволяє виокремити саме той фактор, який для нас головний. Адже в здійснюваному експерименті ми не в змозі вилучити численні зайві фактори, які нас не цікавлять. Так, вивчаючи падіння тіла, ми не уникнемо дії на нього сил, зумовлених обертанням Земної кулі. Коли ж ідеться про хімічні реакції, нам ніколи не доведеться стикатися з чистими елементами. А досліджуючи вплив на врожайність тієї чи іншої культури внесеного в ґрунт добрива, ми не можемо знехтувати впливом інших факторів (опади, середня весняна температура, економічний стан регіону і т. ін.), які безпосередньо впливають на остаточний наслідок експерименту — урожайність.
Отже, кожне спостереження дає нам лише наслідок взаємодії основного фактора. який нас цікавить, з багатьма сторонніми, другорядними. Деякі з них погрібне й можна враховувати-в дослідженнях. Врахування ж решти факторів або в принципі неможливе, або недоцільне з якихось міркувань. Тому за реальних умов під час дослідження будь-якого процесу застосовують метод його формалізації, беручи до уваги-інше ті фактори, які істотно впливають на зазначений процес.
Водночас усі ті фактори, якими експериментатор нехтує, загалом відбиваються на наслідках експерименту, надаючи їм неоднозначності.
Так настають непередбачені наперед події, котрі називають випадковими.
Випадкові події в масі спостережень підпорядковані, як з’ясували дослідники, певним характерним лише для них невипадковим законам.
Математична наука, що вивчає закономірності масових подій називається теорією ймовірностей.
Науку, що використовує теорію ймовірностей для обробки численних одиниць інформації як наслідків експерименту, називають математичною
статистикою.
Зауважимо, що нині існує тенденція до появи нових економічних дисциплін, таких як «Економетрія», «Теорія ризику», «Теорія надійності». «Інформатика» і т. ін., котрі тісно пов'язані з теорією ймовірностей. Своїм виникненням ці дисципліни завдячують саме теорії ймовірностей. Отже, теорію ймовірностей можна розглядати як об'єднання певної кількості різнорідних і доволі розвинених дисциплін, кожна з яких зокрема і всі вони разом мають стати науковим багажем кожного економічно освіченого спеціаліста.
Послідовність операцій, виконуваних з додержанням певного комплексу умов. називають експериментом
(дослідом, спробою).Наслідок будь-якого експерименту називають подією.
Експеримент не обов'язково має виконувати людина. Він може здійснюватися незалежно від неї, скажімо комп'ютером. Людина в такому разі є спостерігачем, котрий фіксує наслідок експерименту— подію.
Дисперсійний аналіз був створений спочатку для статистичної обробки агрономічних дослідів. В наш час його також використовують як в економічних експериментах, так і технічних, соціальних.
Сутність цього аналізу полягає в тому, що загальну дисперсію досліджуваної ознаки розділяють на окремі компоненти, які обумовлені впливом певних конкретних чинників. Істотність їх впливу на цю ознаку здійснюється методом дисперсійного аналізу.Відповідно до дисперсійного аналізу будь-який його результат можна подати у вигляді суми певної кількості компонент. Так, наприклад, якщо досліджується вплив певного чинника на результат експерименту, то модель, що описує структуру останнього, можна подати так:
де xij
— значення ознаки X
, одержане при i
-му експерименті наj
-му рівні фактора.
Під рівнем фактора розуміють певну його міру.
Наприклад, якщо фактором є добрива, які вносяться в землю з метою збільшення врожайності сільськогосподарської культури, то рівнем фактора в цьому разі є кількість добрива, що вноситься в грунт;
—
загальна середня величина ознаки X;
α
j
— ефект впливу фактора на значення ознаки X
на j
-му рівні;
ε
ij
— випадкова компонента, що впливає на значення ознаки X
в i
-му експерименті на j
-му рівні.
При цьому М(ε
ij
) = 0
і ε
ij
, як випадкові величини мають законрозподілу ймовірностей N(0;σ2
)
і між собою незалежні (К
ij
=0 ).
Складнішою моделлю аналізу є вивчення впливу на результати експерименту кількох факторів. Зокрема при аналізі впливудвох факторів структура моделі набуває такого вигляду:
,
де xijk
– значення ознаки Х
в i
-му експерименті на j
-му рівні впливу фактора A
і на k
-му рівні впливу фактора В; —
загальна середня величина ознаки X
; α
i
—
ефект впливу фактора А
на i
-му рівні, β
j
— ефект впливу фактора В
на j
-му рівні; γ
ij
—
ефект одночасного впливу факторів A
і В
; ε
ijk
— випадкова компонента.
У разі проведення дисперсійного аналізу досліджуваний масив даних, одержаних під час експерименту, поділяють на певнігрупи, які різняться дією на результати експерименту певних рівнів факторів.
Вважається, що досліджувана ознака має нормальний закон розподілу, а дисперсії в кожній окремій групі здобутих значень ознаки однакові. Ці припущення необхідно перевірити.
Нехай потрібно дослідити вплив на ознаку Х
певного одного фактора. Результати експерименту ділять на певне число груп, які відрізняються між собою ступенем дії фактора.
Для зручності в проведенні необхідних обчислень результати експерименту зводять в спеціальну таблицю:
Таблиця. 1
Відповідно до моделі однофакторного дисперсійного аналізу необхідно визначити дні дисперсії, а саме: міжгрупову (дисперсію групових середніх), зумовлену впливом досліджуваного фактора на ознаку X.
і внутрішньо групову, зумовлену впливом інших випадкових факторів.
Загальна дисперсія розглядається як сума квадратів відхилень:
.
Тоді поділ загальної дисперсії на компоненти здійснюється так:
Для того щоб мати виправлені дисперсії, необхідно кожну зі здобутих сум поділити на число ступенів свободи.
Так, для загальної дисперсії
виправлена дисперсія дорівнюватиме
Виправлена дисперсія S
1
2
, що характеризує розсіювання всередині групи, зумовлене впливом випадкових факторів, обчислюється за формулою:
,
де N-р=
k
1
є числом ступенів свободи для S
1
2
, оскільки прицьому використовується р
співвідношень при обчисленні групових середніх,
j
=1,
p
/
Виправлена дисперсія S
2
2
, що характеризує розсіювання груповихсередніх відносно загальної середньої ,
яке викликане впливом фактора на результат експерименту ознакиX
, обчислюється за формулою:
де р-1=
k2
— це число ступенів свободи для S2
2
, оскількигрупові середні варіюють відносно однієї загальної середньої .
Завдання виявлення впливу фактора на наслідки експериментуполягає в порівнянні виправлених дисперсій S
1
2
, S
2
2
.
І справді, якщо досліджуваний фактор не впливає на значення ознаки X,
то в цьому разі S1
2
і S2
2
можна розглядати як незалежні оцінки загальної дисперсії D.
І навпаки, якщо відношення S1
2
і S2
2
істотне, то в цьому разі вибірки слід вважати здійсненими з різних сукупностей, тобто з сукупностей з різним рівнем впливу фактора.
Порівняння двох дисперсій ґрунтується на перевірці правильності нульової гіпотези: —
про рівність дисперсій двох вибірок.
За статистичний критерій вибирається випадкова величина
,
що має розподіл Фішера-Снедекора з k1
=
N-
p,
k2
=
p-1
ступенями свободи
За значеннямиα
,k
1
=
N
-
p
,
k
2
=
p
-1
, знаходимо критичнуточку.
Якщо F
*
≤
Fkp
, то нульова гіпотеза про вплив фактора на результати досліджень відхиляється, а коли F
*
>
Fkp
,
то цим самимпідтверджується вплив фактора на ознаку X.
Результати спостережень та обчислення статистичних оцінокзручно подати в упорядкованому вигляді за допомогою табл. 2.
Таблиця 2
Нехай необхідно визначити вплив двох факторів А
і В
на певну ознаку Х
. Для цього необхідно, щоб дослід здійснювався при фіксованих рівнях факторів А
і В
, а також їх одночасній дії на ознаку. При цьому дослід здійснюватимемо п
разів для кожного з рівнів факторів А
і В
.
Позначимо через xijk
конкретне значення ознаки Х
, якого вона набуває при і
-му експерименті, j
-му рівні фактора А
і k
-му рівні фактора В
.
Результат експерименту зручно подати у вигляді таблиці, яка поділена на блоки, в кожному з яких враховується на певних рівнях факторів А
і В
їх вплив на конкретні значення ознаки X
=
xijk
(табл.. 3).
Виходячи з даних табл.,
є середнім значенням ознаки Х
для кожного блока;
,
є середнім значенням ознаки Х
за стовпцями;
,
є середнім значенням ознаки Х
за рядками;
є загальною середньою ознакою Х
;
є виправленою дисперсією, яка зумовлена впливом фактора А
на ознаку Х
;
є виправленою дисперсією, яка зумовлена впливом фактора В
на ознаку Х
;
є виправленою дисперсією, яка зумовлена одночасним впливом на ознаку Х
факторів А
і В
;
є виправленою дисперсією, яка зумовлена впливом на ознаку Х
інших, не головних факторів.
Обчислюються спостережувані значення критерію
; ; .
При рівні значущості α
визначають критичні точки:
Fkp
(α;
k4
;
k1
),
Fkp
(α;
k3
;
k1
),
Fkp
(α;
k2
;
k2
).
Якщо:
1) FA
*
>
Fkp
(α;
k4
,
k1
)
, то нульова гіпотеза про відсутність впливу фактора А
відхиляється;
2) FB
*
>
Fkp
(α
;
k
3
;
k
1
)
, то нульова гіпотеза про відсутність впливу фактора В
відхиляється;
3) FAB
*
>
Fkp
(α
;
k
2
;
k
1
)
, )
, то нульова гіпотеза про відсутність спільного впливу факторів А
В
відхиляється.
Таблиця 3.
Дисперсійний аналіз створений для статистичної обробки агрономічних дослідів, а також його використовують в економічних експериментах, технічних, соціальних. Сутність цього аналізу полягає в тому, що загальну дисперсію досліджуваної ознаки розділяють на окремі компоненти, які обумовлені впливом певних конкретних чинників.
Існують однофакторний та двофакторний дисперсійний аналізи. Одно факторним досліджують вплив на ознаку певного одного фактора. Двофакторний використовують коли необхідно визначити вплив двох факторів на певну ознаку. Результати досліджень подають у вигляді таблиці.
1.
Жлуктенко В.І., Наконечний С.І.
Теорія ймовірностей і математична статистика: Навч. – метод. посібник.
У 2 ч. – Ч I. Теорія ймовірностей. – К.: КНЕУ, 2000. – 3047 с.
2.
Жлуктенко В.І., Наконечний С.І., Савіна С.С.
Теорія ймовірностей і математична статистика: Навч.–метод. посібник.
У 2 ч. – Ч II. Математична статистика. – К.: КНЕУ, 2001. – 336 с.
3.
Турчин В.М.Теорія ймовірностей: Основні поняття, приклади, задачі: Навч. посіб. – К.:
Видавництво А.С.К., 2004. – 208 с.: іл.
4.
О.В. Крайчук, Г.К. Московська, О.І. Соколенко
Теорія ймовірностей і математична статистика. – Рівне, 2004.
5.
Зубков А.М., Севастьянов Б.А., Чистяков В.В.
Сборник задач по теории вероятностей. – М.: Наука, 1989. – 320 с.
|