Страница:БСЭ-1 Том 34. Конкурс - Крестьянская война (1937).pdf/192

Материал из Викитеки — свободной библиотеки
Эта страница не была вычитана

КОРРЕЛЯЦИЯимели бы прямую функциональную зависимость; если бы Рд(В) = Рд(В)> т. е. если бы количества случаев выздоровления были бы одинаковы как при применении сыворотки, так и без нее, то, очевидно, применение сыворотки было бы бесцельно, т. к., в соответствии с данным выше определением, событие В (выздоровление) было бы независимо от события А (применении сыворотки).

Если же, напр., Рд(В)=0, 97, а Р^(В)=0, 85, то коэффициент ев= 0, 12 показывая бы наличие положительной связи между применением сыворотки и выздоровлением.

Коэффициент регрессии дв равен +1 при положительной функциональной связи, нолю  — при независимости В от Л и  — 1  — при отрицательной функциональной связи; в остальных случаях он принимает значения между  — 1 и +1, не равные нолю. Во многих вопросах нет никаких оснований измерять связь между А и В непременно при помощи коэффиціента а не при помощи аналогичного коэффициента регрессии = РВ(А) ~ РВ(А) события А относительно В. В этом случае может быть удобен коэффициент К. между событиями А и В: R=± • qb . Знак R должен совпадать со знаком обоих коэффициентов регрессии (они имеют всегда одинаковый знак). Коэффициент К. обращается в ноль тогда и только тогда, когда события Л и В независимы (если событие В независимо от Л, то, как легко доказывается, и событие Л независимо от В), и равняется ± 1 в случае функциональной зависимости и только в этом случае.

К. между двумя величинами. Величина у зависит функционально от величины х, если каждому значению х соответствует вполне определейная величина y — f(x). Если такой зависимости нет, то в случае статистических (неограниченно повторяющихся с определейными вероятностями) явлений мы можем определить для каждого возможного значения х соответствующее математическое ожидание (см.) Ех(у) = f(x) величины у при условии заданного значения х (мы оставляем в стороне имеющие чисто теоретический интерес случаи, в к-рых математическое ожидание бесконечно или неопределенно). Уравнение у = f(x) называется уравнением регрессии величины у относительно®, а линия y=f(x) на плоскости (ж, у) — линией регрессии у относительно х.

Обозначим ау = Е(у) математическое ожидание у (безусловное математическое «ожидание). В случае, если величины х и у независимы, уравнение регрессии имеет вид у = ау [т. к. тогда Ех(у)=Е(у)=ау\. Заметим, что йз того, что уравнение регрессии есть у = ау, еще не следует независимости х и у; напр. с измѳнением х математическое ожидание у может оставаться неизменным, но средняя колеблемость у, измеряемая хотя бы при помощи Ех(у  — ау) 2, может зависеть от®. Естественно желание определить, насколько хорошо уравнение регрессии передает изменение у, иначе говоря, в какой мере зависимость между ж и у близка к функциональной. На этот вопрос дает ответ корреляционное отношение у к х [введено Пирсоном (см.)]: р =, 1/1 У  — Г и 1

Е[у-Ех(у№ .

Е(ѵ-ауУі

Ру = 0 тогда и только тогда, когда уравнение регрессии имеет вид у=ау, т. е. математическое ожидание у не зависит от ж; Р2/=+1 в случае функциональной зависимости у от ж.

В остальных случаях Ру принимает промежуточное значение между 0 и +1.

Практически приходится вычислять уравнѳниѳ регрессии по ограниченному числу наблю  — 370

дѳний, имеющих ограниченную точность. Данные опыта непосредственно выражаются коррѳляционной таблицей, в к-рой указывается, в каком Число наблюдений получилась данная комбинация значѳний вѳличин ж и у (см. схематический примѳр на табл. 1).

Табл. 1 .

X

У \ 1 2 3 4 521 1

— — —

1 2 — —

1 2 1 — —

4 |

— 3 1—579

10—1 4 2—1 3 3

1—4 —

2 4 1 —

. 1—2 —

1 2 — — —

Если на каждое отдѳльноѳ значение ж приходится достаточно много отдельных наблюдений, то линия регрессии y=f(x) может быть приближенно опрѳдѳлѳна очень просто: для каждого значения ж=жг  — опрѳдѳляется среднее значение у£ величины у в наблюдениях с данным значѳниѳм х=х£’Уі=^(х£) и представляет приближенно линию регрессии. Однако, если число наблюдений, соотвѳтствующих каждому значению х — х£і недостаточно велико, то такой мѳтод может привести к совершенно случайным рѳзультатам.

Таблица 2 дает у£, соответствующиѳ данным табл. 1. Уже простой здравый смысл подсказываѳт, что линия регрессии y=f(x) должна, начиТ а б л. 2.

Х/>2468

Уі

1, 5

2, 7

2, 0

3, 2

4, 1

4, 4

3, 4

2, 82, 2 •1, 7

наясь примѳрно с 1, 5 при ж=1, подниматься примѳрно до 4, около ж=5 или 6 и вновь спускаться при дальнѳйшѳм возрастании ж. Однако* такиѳ обстоятельства, как, напр., дополнительный максимум у£ при ж=2 с послѳдующим умѳныпѳниѳм і/г приж=3, могут при данном число наблюдений считаться чисто случайными.

Нормальная К. между двумя величинами. В силу ряда оснований, к-рые с наибольшей полнотой были теоретически изучены акад. С. Н. Бернштейном, корреляционная зависимость между двумя величинами хиув очень многих случаях с известным приближением является нормальной, т. е. вероятность того, что точка с координатами х и у попадает в какую-либо область g плоскости (х, у), приближенно изобразится интегралом  — 1 Г(х-аж) 2 t (і/-ау) 2 2R(x~ax)(y-ay) l

~f f6

°У*

аХ°У

Jdxdy'

g _______ гдеЛ = 2лахоуѴ1  — Вл, ау = Е (у), ау = 4  — V Е(у — ау) 2  — дисперсия величины у, ах = Е (х), ох = + Ѵе(х  — ах) 2-математическое ожидание и дисперсия величины х и, нако- * нец, В — коэффициент К. величин хи у: „ Е {(х — ах) (у-ау)}‘ Іг = ------------------------- ------ -• ах ау В случае нормальной К. уравнение регрессии у=/(х> имеет вид: У  — Оу + Qy (Я ~~ ах) > где (,, — В я

ах т. е. линия регрессии в случае нормальной К. есть прямая. Корреляционное отношение Пирсона Ру равно н случае нормальной К. коэфф. корреляции R. Употребление коэфф. К. в качестве меры зависимости между хиув случае связей, сильно отличающихся от нормальной, приводит иногда к ошибочным выводам, т. к. коэффициент К. может равняться нолю даже в случае, когда у