Санкт-Петербургский Государственный Университет
Факультет прикладной математики – процессов управления
Кафедра диагностики функциональных систем
Анализ зависимости между УК в крови больных СКВ и степенью тяжести поражения почек
Курсовая работа
Варламова
Александра
Александровна
Научный руководитель
доктор медицинских наук, профессор Шишкин В.И.
Санкт-Петербург 2008
Содержание
§1. Введение
§2. Постановка задачи
§3. Используемые методы
1. Дисперсионный анализ по одному признаку для проверки равенства нескольких средних
2. Непараметрический дисперсионный анализ по одному признаку с применением критерия Краскала-Уоллиса для нескольких независимых выборок
3. Непараметрический дисперсионный анализ по одному признаку с применением критерия Джонкхиера для нескольких выборок, упорядоченных по возрастанию влияния фактора
§4.Вывод
§5. Список литературы
§1. Введение
Формулировка проблемы
Изложим проблемную ситуацию, имеющую место в настоящее время в решении задач обработки результатов исследований. Известно, что в распоряжении исследователей имеется большая и постоянно растущая в объеме база данных результатов измерений из разных областей естествознания: астрономии, экспериментальной физики, экономики, биологии, медицины.
По мнению автора, сформировавшемуся вследствии ознакомления с содержанием официальных высказываний ведущих политиков и ученых мира, наибольшего развития в 21 веке среди других наук достигнут биология и медицина. Известно и напечатано, например, в книге Е.В. Гублера "Информатика в патологии, клинической медицине и педиатрии" [1] , что в этом аспекте решение задач обработки результатов измерений приобретает ключевое значение . Следуя рекомендациям пособия "Кандидатская диссертация" [2] выполним критический анализ ситуации, сложившейся в настоящее время в России в решении задач обработки результатов наблюдений. Уже на предварительном этапе исследования имеет место противоречивая ситуация: с одной стороны – обработка найденных в медицине результатов измерений является актуальной задачей в современной науке, с другой стороны – известно, что в медицинских ВУЗах математика, как дисциплина учебного процесса , практически не изучается. Следовательно, то что методы обработки данных медицинских исследований стали предоставляться математикам-специалистам, создает прецедент выдвижения медицины в число приоритетных направлений Российской науки.
Изложив проблемную ситуацию, перейдем к определению цели и объекта исследования.
§2. Постановка задачи
Предварительные замечания
Системные заболевания соединительной ткани, такие как системная красная волчанка , характеризуются прежде всего выраженной патологией по иммунологической компоненте. Мониторинг этого контингента больных позволяет отнести системные заболевания к числу крайне тяжелых недугов, поражающих людей в наиболее деятельный возрастной период ( в среднем 30-50 лет )[8] и приводящих к ранней инвалидизации, а порой и к летальным исходам. Усиливающееся год от года неблагоприятное воздействие окружающей среды приводит к росту иммунодефицитов различной этиологии, в том числе возрастает заболеваемость системными вариантами иммунокомплексных патологий.
В иммунокомплексных патологиях система комплемента играет важную, хотя и не всегда ясную, роль. Таким образом изучение динамики комплемента приобретает ключевое теоретическое и практическое значение. В связи с этим нами предпринят анализ зависимости уровня комплемента с тяжестью течения классического иммунокомплексного заболевания системной красной волчанкой.
Объект, предмет, цель и задача исследования
В качестве исходных данных для исследования даны выборки численных значений медико-биологических показателей человеческого организма, а именно: уровня комплемента в крови больных системной красной волчанкой ( в дальнейшем – СКВ) и степенью тяжести поражения почек. . В целях полноты изложения приведем необходимое определение : "Комплемент - система сывороточных белков, которая активируется комплексом антиген - антитело с образованием биологически-активных веществ, способных вызывать необратимые повреждения клеточных мембран. Комплемент является одним из факторов естественного иммунитета и широко применяется в диагностических иммунологических реакциях."[3, ст. 57]
Объектом нашего исследования являлись выборочные данные результатов измерений уровня комплемента ( в дальнейшем - УК), причем изучаемые данные представляют собой пять столбцов чисел ,в первом из которых представлены данные без нефрита, во втором с нефритом слабовыраженным, в третьем с нефритом средней выраженности, в четвертом с нефротическим синдром, а в пятом- с почечной недостаточностью.
Предмет исследования определяем, как нахождение зависимости УК в крови больных СКВ и степенью тяжести поражения почек.
§3. Используемые методы
Будем использовать методы биометрического анализа, основанные на проверке гипотез однородности выборок.[9]
1.
Дисперсионный анализ по одному признаку для проверки равенства нескольких средних
Во многих случаях практики интерес представляет вопрос о том, в какой мере существенно влияние того или иного фактора на рассматриваемый признак [9]. В данном случае фактором является степень поражения почек, а признаком - УК.
Научное обоснованное решение подобной задачи при некоторых предположениях составляет предмет дисперсионного анализа , введенного математиком- статистиком Р. А. Фишером.[10]
Статистическая модель
Выборки производятся из нормальных совокупностей. Первая выборка производиться из совокупности со средним, вторая - со средним , k-я из совокупности со средним . Все наблюдения независимы. Будем считать распределение данной мне совокупности нормальным.
Гипотезы №1.
Н0
: = =…=
Н1
: не все средние равны. все средние равны.
Критическая область.
Верхняя 5%-ная область Fk-1.
N
-
k
-распределения. В нашем случае F4,474
-распределения, так как k=4, а =n1
+ n2
+ n3
+ n4
+ n5
=479. Эта область определяется неравенством F>2.37. ( Определяется по таблице, см. Таблица А.4а на стр. 334 "Справочника по вычислительным методам статистики" Дж. Поллард [6] )
Вычисление значения критериальной статистики
Будем рассматривать исходные данные, представленные Таблицей №1.
Таблица №1.
Значения УК в зависимости от тяжести ГН.
.Нет нефрита
Выборка объема
n1
= 210
|
Слабый нефрит
Выборка объема n2
= 101
|
Средний нефрит
Выборка объема n3
= 98
|
Нефротический синдром
Выборка объема
n4
= 45
|
Почечная недостаточность
Выборка объема
n5
= 25
|
36 |
11 |
7 |
10 |
20 |
38 |
35 |
27 |
5 |
20 |
40 |
37 |
6 |
6 |
21 |
31 |
15 |
5 |
15 |
24 |
33 |
40 |
40 |
20 |
3 |
33,8 |
0 |
5 |
25 |
12 |
37 |
33 |
45 |
28 |
10 |
38 |
33 |
45 |
32 |
0 |
33 |
5 |
46 |
46 |
18,2 |
37 |
40 |
45 |
33 |
46 |
48 |
25 |
24 |
44 |
10 |
40 |
33 |
24 |
25 |
0 |
42 |
50 |
43 |
22,5 |
20 |
35 |
25 |
24,5 |
24,5 |
30,4 |
15 |
20 |
20,5 |
38 |
0 |
35 |
50 |
9 |
12 |
33,3 |
48 |
50 |
12 |
54,7 |
14,7 |
45 |
18 |
32 |
20,7 |
34,1 |
38 |
20 |
43 |
0 |
22,4 |
15 |
33 |
35,5 |
26,1 |
17,8 |
13 |
43 |
44 |
11 |
33,5 |
40 |
10 |
50 |
11,7 |
29,6 |
40 |
12 |
34 |
34,4 |
13,6 |
38 |
23 |
12 |
0 |
35 |
32,7 |
34 |
0 |
0 |
37 |
60 |
30 |
25,1 |
42 |
50 |
35 |
22,5 |
32,3 |
51 |
22 |
31 |
16 |
45 |
22,2 |
33 |
32,5 |
25 |
20 |
41,9 |
39,3 |
33 |
21 |
41,7 |
40,2 |
33 |
22 |
37,1 |
0 |
39 |
10 |
33,4 |
39,1 |
35,8 |
37,4 |
33 |
37,7 |
41,7 |
22,4 |
34,3 |
33,5 |
38,2 |
35 |
33 |
43,8 |
37,4 |
37,3 |
36,9 |
16 |
10 |
39,6 |
41 |
16 |
37,9 |
0 |
33 |
31 |
39,3 |
32,8 |
32,15 |
52 |
37,2 |
24 |
38,8 |
51 |
37,8 |
25 |
48,1 |
33,5 |
49,1 |
38 |
0 |
48 |
36,15 |
29 |
0 |
27 |
43,8 |
32 |
26,6 |
48 |
40 |
32 |
52,8 |
40 |
20 |
27 |
36 |
32,3 |
13,6 |
45 |
10 |
10 |
43,5 |
33,9 |
19,5 |
35 |
45,74 |
51,2 |
35 |
0 |
40,4 |
19,5 |
49,1 |
46,05 |
24,2 |
38 |
0 |
33 |
0 |
25,2 |
40,4 |
43,5 |
28 |
30 |
32,3 |
27 |
36 |
41 |
35 |
10 |
40 |
29 |
25 |
29,7 |
50 |
30 |
30 |
20 |
32 |
27,6 |
0 |
31 |
21,4 |
15,6 |
45 |
23 |
35 |
20 |
34,3 |
0 |
45 |
18 |
46 |
15 |
50,4 |
59,2 |
30,4 |
48,2 |
0 |
50 |
37,3 |
22,5 |
46 |
35 |
0 |
35 |
25 |
24 |
15 |
20 |
45 |
18 |
38 |
28,9 |
28 |
47,5 |
30,5 |
36,7 |
37,9 |
45,5 |
47,8 |
40,3 |
43 |
39,2 |
60 |
34,7 |
36,5 |
34,1 |
32,6 |
32 |
46,7 |
38,4 |
45,7 |
39 |
37,15 |
46,9 |
31,4 |
39 |
15,6 |
32 |
52,15 |
34,1 |
42 |
52,2 |
44,7 |
43,8 |
0 |
26,5 |
39,1 |
0 |
36,6 |
16 |
0 |
30,3 |
26,5 |
33 |
47 |
43 |
43 |
50 |
36,9 |
46,6 |
52,2 |
29,4 |
59,3 |
38,5 |
30,6 |
0 |
41 |
35,6 |
15,5 |
40 |
38,7 |
21,2 |
45 |
38,2 |
22,8 |
25,5 |
26,1 |
28,3 |
27,7 |
43,2 |
28,15 |
22,5 |
46 |
38,5 |
45 |
35,6 |
26 |
33 |
32,4 |
48,3 |
50 |
47,5 |
50 |
32 |
50 |
35,6 |
33,5 |
56,9 |
28,9 |
40 |
35,2 |
42,5 |
50 |
46,2 |
52,7 |
49,1 |
38 |
33,7 |
32,6 |
30 |
28,9 |
44,4 |
48,2 |
38,15 |
42 |
28,4 |
33,5 |
39,4 |
38,6 |
34,3 |
37,7 |
27,3 |
39,2 |
29,2 |
39,2 |
33,5 |
18 |
31,2 |
23,4 |
36,9 |
57,3 |
45 |
45,3 |
16,5 |
34,9 |
43,1 |
30,8 |
0 |
34,5 |
28 |
16 |
28,9 |
23 |
27 |
41,6 |
43,4 |
36 |
49 |
25 |
41,5 |
35,5 |
35 |
33,1 |
41,7 |
39,15 |
30,8 |
45,7 |
35,4 |
35,8 |
27 |
19,5 |
29,4 |
33,3 |
36,6 |
42,6 |
30 |
36,1 |
43 |
33,3 |
28,7 |
28,7 |
45,1 |
31,8 |
33 |
39,1 |
29 |
46,7 |
41,05 |
29,9 |
50 |
47 |
34,4 |
11 |
20,6 |
36,6 |
38,6 |
29,48 |
25 |
0 |
38 |
34,7 |
38,2 |
43,8 |
40,3 |
38,5 |
60 |
50 |
36 |
55 |
33,5 |
25,1 |
24,8 |
Всего:Т1
=7502,38 |
Т2
=3157,44 |
Т3
=2819,55 |
Т4
=1223,50 |
Т5
=505,60 |
Т = Т1
+ Т2
+ Т3
+ Т4
+ Т5
Т=15208,47, Т2
= 231297559,74, N = 479
Средние значения выборок:
=35,6
= 31,1
= 28,7
= 26,38
= 19,8
Возведем в квадрат значение всех наблюдений и просуммируем их [6].
Вычисляем:
=
567988,11
Общая сумма квадратов будет следующей:
- /
N
=
85112,2
Находим сумму квадратов между выборками:
(/n1
+….+/nk
) – T2
/N = 8470,35
Теперь можно заполнить таблицу дисперсионного анализа [6].
Таблица №2.
Дисперсионный анализ по одному признаку.
Компонента дисперсии
(1)
|
Сумма квадратов
(2)
|
Степень свободы
(3)
|
Средний квадрат
(4)=(2)/(3)
|
Между выборками |
()-/N |
k-1 |
(определяется делением) |
Остаточная |
(определяется вычитанием) |
N-k |
Полная |
|
N-1 |
----- |
Получаем:
Таблица №2а.
Дисперсионный анализ по одному признаку. Результаты.
Компонента дисперсии
(1)
|
Сумма квадратов
(2)
|
Степень свободы
(3)
|
Средний квадрат
(4)=(2)/(3)
|
Между выборками |
8470,35 |
4 |
2117,59 |
Остаточная |
76641,85 |
474 |
161,69 |
Полная |
85112,2 |
478 |
----- |
Значение критериальной статистики равно:
F = средний квадрат между выборками / остаточный средний квадрат = 2117,59 / 161,69 = 13,09
Сравним F и Fкритич
: 13,09>2,37
Вывод. Следовательно, мы отвергаем гипотезу Н0
,то есть можно предположить, что при 5%-ном уровне значимости УК в крови больных СКВ зависит от степени тяжести поражения почек.
Мы не знаем, какое распределение имеют наши выборки. Описанный метод применяется , как это было описано в статистической модели, для нормальных совокупностей. В связи с этим будет правомочно применить непараметрический метод для выяснения равенства нескольких средних.
2. Непараметрический дисперсионный анализ по одному признаку с применением критерия Краскала-Уоллиса для нескольких независимых выборок
Для проверки совпадений нескольких средних часто применяется непараметрический критерий, свободный от распределения. Его можно использовать, когда рассматриваемые совокупности не являются нормально распределенными [7].
Статистическая модель
Имеется k совокупностей, в нашем случае 5 совокупностей. Каждая выборка извлекается из своей совокупности. Все наблюдения независимы.
Гипотезы
Н0
: все k совокупностей одинаково распределены.
Н1
: нулевая гипотеза не верна.
Критическая область
Верхняя 5%-ная область распределения
2
k
-1.
В нашем случае
2
4
, что соответствует значению критерия , превышающему 9,49
. Данное число взято из Таблицы А.2 на стр. 331 "Справочника по вычислительным методам статистики" Дж. Полларда. [6]
Вычисление значения критериальной статистики
Для этого наблюдения xij
заменяются их рангами rij
.Все n наблюдений упорядоченны по возрастанию от 1 до n. Находим сумму рангов R1
, R2
,…, Rk
для k групп. Вычисляем критерий [4]:
H= ( R2
1
/n1
+….+ R2
k
/nk
) – 3 ( N + 1 )
Значения комплемента упорядочены по возрастанию. Они иногда совпадают, тогда ранг принимает среднее значение.
Далее, используя Таблицу №1
, присваиваем каждому значению комплемента соответствующий ранг в данных пяти выборках и получаем сумму рангов [5] .
Таблица №3.
Таблица рангов наблюдений.
Нет
нефрита
Выборка объема n1
= 210
|
Слабый
нефрит
Выборка объема
n2
= 101
|
Средний
нефрит
Выборка объема
n3
= 98
|
Нефротический синдром
Выборка объема
n4
= 45
|
Почечная недостаточность
Выборка объема
n5
= 25
|
УК |
Ранг |
УК |
Ранг |
УК |
Ранг |
УК |
Ранг |
УК |
Ранг |
36 |
282 |
11 |
45 |
7 |
33 |
10 |
39 |
20 |
86 |
38 |
315,5 |
35 |
264 |
27 |
144,5 |
5 |
28,5 |
20 |
86 |
40 |
352,5 |
37 |
296,5 |
6 |
31,5 |
6 |
31,5 |
21 |
95,5 |
31 |
188,5 |
15 |
59,5 |
5 |
28,5 |
15 |
59,5 |
24 |
115 |
33 |
220 |
40 |
352,5 |
40 |
352,5 |
20 |
86 |
3 |
26 |
33,8 |
242 |
0 |
13 |
5 |
28,5 |
25 |
126,5 |
12 |
50 |
37 |
296,5 |
33 |
220 |
45 |
405,5 |
28 |
28 |
10 |
39 |
38 |
315,5 |
33 |
220 |
45 |
405,5 |
32 |
197,5 |
0 |
13 |
33 |
220 |
5 |
28,5 |
46 |
420,5 |
46 |
420,5 |
18,2 |
77 |
37 |
296,5 |
40 |
352,5 |
45 |
405,5 |
33 |
220 |
46 |
420,5 |
48 |
436,5 |
25 |
126,5 |
24 |
115 |
44 |
396,5 |
10 |
39 |
40 |
352,5 |
33 |
220 |
24 |
115 |
25 |
126,5 |
0 |
13 |
42 |
375,5 |
50 |
453,5 |
43 |
383 |
22,5 |
105,5 |
20 |
86 |
35 |
264 |
25 |
126,5 |
24,5 |
119,5 |
24,5 |
119,5 |
30,4 |
181,5 |
15 |
59,5 |
20 |
86 |
20,5 |
92 |
38 |
315,5 |
0 |
13 |
35 |
264 |
50 |
453,5 |
9 |
34 |
12 |
50 |
33,3 |
231 |
48 |
436,5 |
50 |
453,5 |
12 |
50 |
54,7 |
471 |
14,7 |
56 |
45 |
405,5 |
18 |
74,5 |
32 |
197,5 |
20,7 |
94 |
34,1 |
247 |
38 |
315,5 |
20 |
86 |
43 |
383 |
0 |
13 |
22,4 |
102,5 |
15 |
59,5 |
33 |
220 |
35,5 |
273,5 |
26,1 |
137,5 |
17,8 |
72 |
13 |
53 |
43 |
383 |
44 |
396,5 |
11 |
45 |
33,5 |
237 |
40 |
352,5 |
10 |
39 |
50 |
453,5 |
11,7 |
47 |
29,6 |
171 |
40 |
352,5 |
12 |
50 |
34 |
244,5 |
34,4 |
252,5 |
13,6 |
54,5 |
38 |
315,5 |
23 |
110 |
12 |
50 |
0 |
13 |
35 |
264 |
32,7 |
210 |
34 |
244,5 |
0 |
13 |
0 |
13 |
37 |
296,5 |
60 |
478 |
30 |
176,5 |
25,1 |
132,5 |
42 |
375,5 |
50 |
453,5 |
35 |
264 |
22,5 |
105,5 |
32,3 |
204 |
51 |
462,5 |
22 |
99,5 |
31 |
188,5 |
16 |
68 |
45 |
405,5 |
22,2 |
101 |
33 |
220 |
32,5 |
207 |
25 |
26,5 |
20 |
86 |
41,9 |
373 |
39,3 |
345,5 |
33 |
220 |
21 |
95,5 |
41,7 |
371 |
40,2 |
359 |
33 |
220 |
22 |
99,5 |
37,1 |
299 |
0 |
13 |
39 |
334 |
10 |
39 |
33,4 |
233 |
39,1 |
337 |
35,8 |
278,5 |
37,4 |
304,5 |
33 |
220 |
37,7 |
306,5 |
41,7 |
371 |
22,4 |
102,5 |
34,3 |
250 |
33,5 |
237 |
38,2 |
323 |
35 |
264 |
33 |
220 |
43,8 |
393,5 |
37,4 |
304,5 |
37,3 |
302,5 |
36,9 |
293 |
16 |
68 |
10 |
39 |
39,6 |
346 |
41 |
365 |
16 |
68 |
37,9 |
309,5 |
0 |
13 |
33 |
220 |
31 |
188,5 |
39,3 |
343,5 |
32,8 |
211 |
32,15 |
202 |
52 |
465 |
37,2 |
301 |
24 |
115 |
38,8 |
332 |
51 |
462,5 |
37,8 |
308 |
25 |
126,5 |
48,1 |
439 |
33,5 |
237 |
49,1 |
445 |
38 |
315,5 |
0 |
13 |
48 |
436,5 |
36,15 |
286 |
29 |
165 |
0 |
13 |
27 |
144,5 |
43,8 |
393,5 |
32 |
197,5 |
26,6 |
141 |
48 |
436,5 |
40 |
352,5 |
32 |
197,5 |
52,8 |
470 |
40 |
352,5 |
20 |
86 |
27 |
144,5 |
36 |
282 |
32,3 |
204 |
13,6 |
54,5 |
45 |
405,5 |
10 |
39 |
10 |
39 |
43,5 |
390,5 |
33,9 |
243 |
19,5 |
79 |
35 |
264 |
45,74 |
417 |
51,2 |
464 |
35 |
264 |
0 |
13 |
40,4 |
362,5 |
19,5 |
79 |
49,1 |
445 |
46,05 |
424 |
24,2 |
118 |
38 |
315,5 |
0 |
13 |
33 |
220 |
0 |
13 |
25,2 |
134 |
40,4 |
362,5 |
43,5 |
390,5 |
28 |
152,5 |
30 |
176,5 |
32,3 |
204 |
27 |
144,5 |
36 |
282 |
41 |
365 |
35 |
264 |
10 |
39 |
40 |
352,5 |
29 |
165 |
25 |
126,5 |
29,7 |
172 |
50 |
453,5 |
30 |
176,5 |
30 |
176,5 |
20 |
86 |
32 |
197,5 |
27,6 |
149 |
0 |
13 |
31 |
188,5 |
21,4 |
98 |
15,6 |
64,5 |
45 |
405,5 |
23 |
110 |
35 |
264 |
20 |
86 |
34,3 |
250 |
0 |
13 |
45 |
405,5 |
18 |
74,5 |
46 |
425 |
15 |
59,5 |
50,4 |
461 |
59,2 |
475 |
30,4 |
181,5 |
48,2 |
440,5 |
0 |
13 |
50 |
453,5 |
37,3 |
302,5 |
22,5 |
105,5 |
46 |
420,5 |
35 |
264 |
0 |
13 |
35 |
264 |
25 |
126,5 |
24 |
115 |
15 |
59,5 |
20 |
86 |
45 |
405,5 |
18 |
74,5 |
38 |
315,5 |
28,9 |
161,5 |
28 |
152,5 |
47,5 |
432,5 |
30,5 |
183 |
36,7 |
291 |
37,9 |
309,5 |
45,5 |
414 |
47,8 |
434 |
40,3 |
360,5 |
43 |
383 |
39,2 |
341 |
60 |
478 |
34,7 |
255,5 |
36,5 |
287 |
34,1 |
247 |
32,6 |
208,5 |
32 |
197,5 |
46,7 |
427,5 |
38,4 |
325 |
45,7 |
415,5 |
39 |
334 |
37,15 |
300 |
46,9 |
429 |
31,4 |
192 |
39 |
334 |
15,6 |
64,5 |
32 |
197,5 |
52,15 |
466 |
34,1 |
247 |
42 |
375,5 |
52,2 |
467,5 |
44,7 |
399 |
43,8 |
393,5 |
0 |
13 |
26,5 |
139,5 |
39,1 |
337 |
0 |
13 |
36,6 |
289 |
16 |
68 |
0 |
13 |
30,3 |
180 |
26,5 |
139,5 |
33 |
220 |
47 |
430,5 |
43 |
383 |
43 |
383 |
50 |
453,5 |
36,9 |
293 |
46,6 |
426 |
52,2 |
467,5 |
29,4 |
168,5 |
59,3 |
476 |
38,5 |
327 |
30,6 |
184 |
0 |
13 |
41 |
365 |
35,6 |
276 |
15,5 |
63 |
40 |
352,5 |
38,7 |
331 |
21,2 |
97 |
45 |
405,5 |
38,2 |
323 |
22,8 |
108 |
25,5 |
135 |
26,1 |
137,5 |
28,3 |
156 |
27,7 |
150 |
43,2 |
388 |
28,15 |
155 |
22,5 |
46 |
420,5 |
38,5 |
327 |
45 |
105,5 |
35,6 |
276 |
26 |
136 |
33 |
220 |
32,4 |
206 |
48,3 |
442 |
50 |
453,5 |
47,5 |
432,5 |
50 |
453,5 |
32 |
197,5 |
50 |
453,5 |
35,6 |
276 |
33,5 |
237 |
56,9 |
473 |
28,9 |
161,5 |
40 |
352,5 |
35,2 |
271 |
42,5 |
378 |
50 |
453,5 |
46,2 |
425 |
52,7 |
469 |
49,1 |
445 |
38 |
315,5 |
33,7 |
241 |
32,6 |
208,5 |
30 |
176,5 |
28,9 |
161,5 |
44,4 |
398 |
48,2 |
440,5 |
38,15 |
321 |
42 |
375,5 |
28,4 |
157 |
33,5 |
237 |
39,4 |
345 |
38,6 |
329,5 |
34,3 |
250 |
37,7 |
306,5 |
27,3 |
148 |
39,2 |
341 |
29,2 |
167 |
39,2 |
341 |
33,5 |
237 |
18 |
74,5 |
31,2 |
191 |
23,4 |
112 |
36,9 |
293 |
57,3 |
474 |
45 |
405,5 |
45,3 |
413 |
16,5 |
71 |
34,9 |
257 |
43,1 |
387 |
30,8 |
185,5 |
0 |
13 |
34,5 |
254 |
28 |
152,5 |
16 |
68 |
28,9 |
161,5 |
23 |
110 |
27 |
144,5 |
41,6 |
369 |
43,4 |
389 |
36 |
282 |
49 |
443 |
25 |
126,5 |
41,5 |
368 |
35,5 |
273,5 |
35 |
264 |
33,1 |
229 |
41,7 |
371 |
39,15 |
339 |
30,8 |
185,5 |
45,7 |
415,5 |
35,4 |
272 |
35,8 |
278,5 |
27 |
144,5 |
19,5 |
79 |
29,4 |
168,5 |
33,3 |
231 |
36,6 |
289 |
42,6 |
379 |
30 |
176,5 |
36,1 |
285 |
43 |
383 |
33,3 |
231 |
28,7 |
158,5 |
28,7 |
158,5 |
45,1 |
412 |
31,8 |
193 |
33 |
220 |
39,1 |
337 |
29 |
165 |
46,7 |
427,5 |
41,05 |
367 |
29,9 |
173 |
50 |
453,5 |
47 |
430,5 |
34,4 |
252,5 |
11 |
45 |
20,6 |
93 |
36,6 |
289 |
38,6 |
289 |
29,48 |
170 |
25 |
126,5 |
0 |
13 |
38 |
315,5 |
34,7 |
255,5 |
38,2 |
323 |
43,8 |
393,5 |
40,3 |
360,5 |
38,5 |
327 |
60 |
478 |
50 |
453,5 |
36 |
282 |
55 |
472 |
33,5 |
237 |
25,1 |
132,5 |
24,8 |
121 |
Всего: |
R1
=
57877
|
R2
=
23298.5
|
R3
=
21259.5
|
R4
=
8789
|
R5
=
3072
|
N = 479 |
k = 5 |
R1
= 57877 |
n1
= 210 |
R2
= 23298,5 |
n2
= 101 |
R3
= 21259,5 |
n3
= 98 |
R4
= 8789 |
n4
= 45 |
R5
= 3072 |
n5
= 25 |
Теперь можно полученные суммы рангов подставить в формулу и получить значение критериальной статистики Краскела-Уоллиса [4] :
Н=23,03
Полученный результат не является незначимым, поэтому нельзя считать, что выборки извлечены из одинаково распределенных совокупностей и что средние значения совокупностей совпадают. Но этот вывод является приближенным, так как в нашей таблице есть много совпадающих значений. Для учета влияния связей можно воспользоваться модифицированной формой статистики Краскела-Уоллиса [4]:
Н`
=
, где g – число групп совпадающих значений, Тj
= (t - t), t– число совпадающих наблюдений в группе с номером j .
Таблица №4.
Группы совпадающих наблюдений.
Повторяющиеся значения УК |
Кол-во повторений tj
|
Значение Tj
|
0 |
25 |
15600 |
5 |
4 |
60 |
6 |
2 |
6 |
10 |
9 |
720 |
11 |
3 |
24 |
12 |
5 |
120 |
13,6 |
2 |
6 |
15 |
6 |
210 |
15,6 |
2 |
6 |
16 |
5 |
120 |
18 |
4 |
60 |
19,5 |
3 |
24 |
20 |
11 |
1320 |
21 |
2 |
6 |
22 |
2 |
6 |
22,4 |
2 |
6 |
22,5 |
4 |
60 |
23 |
3 |
24 |
24 |
5 |
120 |
24,5 |
2 |
6 |
25 |
10 |
990 |
25,1 |
2 |
6 |
26,1 |
2 |
6 |
26,5 |
2 |
6 |
27 |
6 |
210 |
28 |
4 |
60 |
28,7 |
2 |
6 |
28,9 |
4 |
60 |
29 |
3 |
24 |
29,4 |
2 |
6 |
30 |
6 |
210 |
30,4 |
2 |
6 |
30,8 |
2 |
6 |
31 |
4 |
60 |
32 |
8 |
504 |
32,3 |
3 |
24 |
32,6 |
2 |
6 |
33 |
17 |
4896 |
33,3 |
3 |
24 |
33,5 |
7 |
336 |
34 |
2 |
6 |
34,1 |
3 |
24 |
34,3 |
3 |
24 |
34,4 |
2 |
6 |
34,7 |
2 |
6 |
35 |
13 |
2184 |
35,5 |
2 |
6 |
35,6 |
3 |
24 |
35,8 |
2 |
6 |
36 |
5 |
120 |
36,6 |
3 |
24 |
36,9 |
3 |
24 |
37 |
4 |
60 |
37,3 |
2 |
6 |
37,4 |
2 |
6 |
37,7 |
2 |
6 |
37,9 |
2 |
6 |
38 |
10 |
990 |
38,2 |
3 |
24 |
38,5 |
3 |
24 |
38,6 |
2 |
6 |
39 |
3 |
24 |
39,1 |
3 |
24 |
39,2 |
3 |
24 |
39,3 |
2 |
6 |
40 |
12 |
1716 |
40,3 |
2 |
6 |
40,4 |
2 |
6 |
41 |
3 |
24 |
41,7 |
3 |
24 |
42 |
4 |
60 |
43 |
7 |
336 |
43,5 |
2 |
6 |
43,8 |
4 |
60 |
44 |
2 |
6 |
45 |
12 |
1716 |
45,7 |
2 |
6 |
46 |
6 |
210 |
46,7 |
2 |
6 |
47 |
2 |
6 |
47,5 |
2 |
6 |
48 |
4 |
60 |
48,2 |
2 |
6 |
49,1 |
3 |
24 |
50 |
14 |
2730 |
51 |
2 |
6 |
52,2 |
2 |
6 |
60 |
3 |
24 |
g = 88
Теперь можно полученные результаты подставить в модифицированную формулу и получить уточненное значение критериальной статистики Краскела-Уоллиса :
Н`
= 23,037
Вывод.
Скорректированное значение Н`
статистики Краскела-Уоллиса несущественно отличается от значения Н, т.о. мы можем отвергнуть гипотезу Н0
на минимальном уровне значимости. Следовательно , мы подтвердили результат полученный ранее : существует зависимость между УК в крови больных СКВ и степенью тяжести поражения почек .
3. Непараметрический дисперсионный анализ по одному признаку с применением критерия Джонкхиера для нескольких выборок, упорядоченных по возрастанию влияния фактора
Нам заранее известно, что имеющиеся группы результатов упорядочены по возрастанию влияния фактора.. В нашем случае фактором является степень тяжести ГН. В таких случаях целесообразно использовать критерий Джонхиера , более чувствительный против альтернатив об упорядоченном влиянии фактора [5].
Статистическая модель
Имеется k совокупностей, в нашем случае 5 совокупностей. Каждая выборка извлекается из своей совокупности. Все наблюдения независимы. имеющиеся группы результатов упорядочены по возрастанию влияния фактора . 1-й столбец Таблицы №1 отвечает наименьшему уровню фактора, последний – наибольшему, а промежуточные столбцы получили номера, соответствующие их положению. В нашем случае фактором является степень тяжести поражения почек [4] .
Гипотезы
Н0
:==…= ( влияние фактора упорядоченно.)
Н1
: …
Критическая область
Верхняя 5% область F-распределения, что в нашем случае соответствует значению критерия, превышающему значение 2,21. Данное число взято из таблицы А.4 на стр. 334 [6].
Вычисление значения критериальной статистики
Вычислим статистику Манна – Уитни. Сравниваем k способов обработки, в нашем случае 5. Поступим следующим образом : для каждой пары натуральных чисел u и v , где 1£u<v£k , составляем по выборкам с номерами u,vстатистику Манна – Уитни [4].
U = , y)
Определим так же статистику Джонхиера как :
J =
Для нахождения значений статистики Манна – Уитни будем использовать программу,( так как мы имеем выборки большого объема) написанную на языке FortranPowerStation для Windows , версия 4.0 .Выбор данного языка программирования связан с тем, что он максимально приближен к общепринятому языку математических формул. [11].
implicit real*8 (a-h, o-z)
dimension a1(210), a2(101),a3(98),a4(45),a5(25)
open (unit=11, file='1.dat', access='sequential', status='old')
open (unit=12, file='2.dat', access='sequential', status='old')
open (unit=13, file='3.dat', access='sequential', status='old')
open (unit=14, file='4.dat', access='sequential', status='old')
open (unit=15, file='5.dat', access='sequential', status='old')
open (unit=16, file='res.dat',access='append',status='unknown')
do 2222 i=1,210
read (11, 21) a1(i)
21 format(e8.1)
2222 continue
do 2223 i=1,101
read (12, 21) a2(i)
2223 continue
do 2224 i=1,98
read (13, 21) a3(i)
2224 continue
do 2225 i=1,45
read (14, 21) a4(i)
2225 continue
do 2226 i=1,25
read (15, 21) a5(i)
2226 continue
u12=0
do 101 i=1,210
do 91 j=1,101
if (a1(i)<a2(j)) then
u12 = u12+1
elseif (a1(i).eq.a2(j)) then
u12= u12+0.5
else
u12= u12+0.0
endif
91 continue
101 continue
u13=0
do 102 i=1,210
do 92 j=1,98
if (a1(i)<a3(j)) then
u13 = u13+1
elseif (a1(i).eq.a3(j)) then
u13= u13+0.5
else
u13= u13+0.0
endif
92 continue
102 continue
u14=0
do 103 i=1,210
do 93 j=1,45
if (a1(i)<a4(j)) then
u14 = u14+1
elseif (a1(i).eq.a4(j)) then
u14= u14+0.5
else
u14= u14+0.0
endif
93 continue
103 continue
u15=0
do 104 i=1,210
do 94 j=1,25
if (a1(i)<a5(j)) then
u15 = u15+1
elseif (a1(i).eq.a5(j)) then
u15= u15+0.5
else
u15= u15+0.0
endif
94 continue
104 continue
u23=0
do 105 i=1,101
do 95 j=1,98
if (a2(i)<a3(j)) then
u23 = u23+1
elseif (a2(i).eq.a3(j)) then
u23= u23+0.5
else
u23= u23+0.0
endif
95 continue
105 continue
u24=0
do 106 i=1,101
do 96 j=1,45
if (a2(i)<a4(j)) then
u24 = u24+1
elseif (a2(i).eq.a4(j)) then
u24= u24+0.5
else
u24= u24+0.0
endif
96 continue
106 continue
u25=0
do 107 i=1,101
do 97 j=1,25
if (a2(i)<a5(j)) then
u25 = u25+1
elseif (a2(i).eq.a5(j)) then
u25= u25+0.5
else
u25= u25+0.0
endif
97 continue
107 continue
u34=0
do 108 i=1,98
do 98 j=1,45
if (a3(i)<a4(j)) then
u34 = u34+1
elseif (a3(i).eq.a4(j)) then
u34= u34+0.5
else
u34= u34+0.0
endif
98 continue
108 continue
u35=0
do 109 i=1,98
do 99 j=1,25
if (a3(i)<a5(j)) then
u35 = u35+1
elseif (a3(i).eq.a5(j)) then
u35= u35+0.5
else
u35= u35+0.0
endif
99 continue
109 continue
u45=0
do 110 i=1,45
do 100 j=1,25
if (a4(i)<a5(j)) then
u45 = u45+1
elseif (a4(i).eq.a5(j)) then
u45= u45+0.5
else
u45= u45+0.0
endif
100 continue
110 continue
U=u12+u13+u14+u15+u23+u24+u25+u34+u35+u45
22 format(2x,'u12=',f10.3)
23 format(2x,'u13=',f10.3)
24 format(2x,'u14=',f10.3)
25 format(2x,'u15=',f10.3)
26 format(2x,'u23=',f10.3)
27 format(2x,'u24=',f10.3)
28 format(2x,'u25=',f10.3)
29 format(2x,'u34=',f10.3)
30 format(2x,'u35=',f10.3)
31 format(2x,'u45=',f10.3)
32 format(2x,'U=',f10.3)
write(16,22)u12
write(16,23)u13
write(16,24)u14
write(16,25)u15
write(16,26)u23
write(16,27)u24
write(16,28)u25
write(16,29)u34
write(16,30)u35
write(16,31)u45
write(16,32)U
end
Обработав таким образом результаты наблюдений, получаем значения статистики Манна – Уитни:
u12= 8441,000
u13= 7793,500
u14= 3172,500
u15= 888,000
u23= 4637,500
u24= 1928,500
u25= 648,500
u34= 2054,500
u35= 805,500
u45= 411,000
Подставив в формулу полученные значения получаем результат для статистики Джонхиера:
J= 30780,5
Значение статистики Джонхиера очень велико, что свидетельствует в пользу гипотезы Н1
об упорядоченном влиянии фактора , в нашем случае – зависимости УК в крови больных СКВ от степени поражения почек. То есть мы снова подтвердили результат, полученный ранее.
Но поскольку предложенные выборки велики, то можно проверить полученный результат, подсчитав приближенную статистику J* для большой выборки [4].
Вычислим величину:
J*
= ( J – MJ ) /
Где MJ = ( N2
- ) , DJ = ( N2
( 2N + 3 ) - ( 2nj
+ 3))
В результате вычислений мы получаем значение J*
= 5,9.
Вывод.
Полученный результат превышает критическое значение, что позволяет отклонить гипотезу Н0
, и принять гипотезу Н1.
Таким образом мы подтверждается результат, полученный с помощью статистики J – влияние фактора в предложенных выборках упорядоченно.
§4.Вывод
Целью данной курсовой работы был анализ зависимости между УК в крови больных СКВ и степенью тяжести поражения почек. Исходные данные были подвергнуты методам статистического анализа, независимым между собой. Результатом является доказательство наличия зависимости УК в крови больных СКВ и степенью тяжести поражения почек в каждом из использованных методов, что позволяет сформулировать окончательный вывод : УК в крови больных СКВ зависит от степени тяжести поражения почек, причем УК уменьшается с возрастанием степени тяжести поражения почек.
§5. Список литературы
1. Гублер Е.В. Информатика в патологии, клинической медицине и педиатрии. –Л.: Медицина, 1990.-176с.
2. Кузин Ф.А. Кандидатская диссертация . Методика написания, правила оформления и порядок защиты. Практическое пособие для аспирантов и соискателей ученой степени. –5-е изд., доп.-М.:Ось 89, 2000.-224с.
3. Энциклопедический словарь медицинских терминов: В 3-х томах. Около 60000 терминов.-М.: Советская энциклопедия, - Т.2. 1983.-448с.
4. Тюрин Ю.Н. , Макаров А.А. Статистический анализ данных на компьютере .-М.: Инфра – М., 1982.-528с.
5. Холлендер М., Вулф Д.А. Непараметрические методы статистики.-М.: Финансы и статистика., 1983.-518с.
6. Поллард Дж. Справочник по вычислительным методам статистики.-М.: Финансы и статистика., 1982.-344с.
7. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей.-М.: Финансы и статистика,-Т.2. 1985.-488с.
8. Шишкин В.И., Кудрявцева Г.В. Регуляторная роль функциональной системы "Комплемент – простагландиды – пентозофосфатный путь обмена углеводов" в патогенезе основных ревматологических заболеваний.-СПб.: НИИХ. 2002.-38с.
9. Колмогоров А.Н. Теория вероятности и математическая статистика.-М.:Наука.,1986.-535с.
10. Фишер Р.А. Статистические методы для исследователей.-М.:Госстатиздат.,1982.-344с.
11. Фишер Ф.П., Суиндл Д.Ф. Системы программирования.-М.:Статистика.,1971.-606с.
|