Теория вероятностей и математическая статистика/Регрессионный анализ

Материал из testwiki
Перейти к навигации Перейти к поиску

Шаблон:Материалы

Рассмотрим две случайные величины X и Y. Регрессией Y на X называется математическое ожидание случайной величины Y при условии, что X=x: 𝐌(Y|X=x)=φ(x).

График функции φ(x) называется кривой регрессии.

Если φ(x)=ax+b, то говорят о линейной регрессии Y на X.

По данным выборки можно найти выборочные средние x, y и исправленные выборочные средние квадратические отклонения sx, sy.

Тогда оценки для коэффициентов a и b имеют вид a¯=rsysx, b¯=y¯a¯x¯, где r — выборочный коэффициент корреляции, который вычисляется по формуле

r=i=1n(xix¯)(yiy¯)i=1n(xix¯)2i=1n(yiy¯)2.

Выборочный коэффициент корреляции 1r1. Он отражает степень линейной зависимости Y от X.

Примеры

Пример 1

Десять раз при различных значениях признака X было измерено значение признака Y. Получены следующие результаты:

X 2 2.8 3 3.1 3.5 3.9 4.1 4.4 4.6 5.1
Y 3.9 7.8 9.3 9.8 11.1 13.1 14 16.3 17.1 19.4

Найти уравнение регрессии Y на X: y=ax+b.

Решение:

Все вычисления удобно производить в таблице.

Для нахождения коэффициентов a¯ и b¯ найдем все суммы (последняя строка таблицы).

x¯=1ni=1nxi=36.5/10=3.65, y¯=1ni=1nyi=121.8/10=12.18.

Тогда r=40.018.025200.336=0.9978;

sx=1ni=1n(xix¯)20.8025=0.8958;

sy=1ni=1n(yiy¯)220.0336=4.4758.

Коэффициенты регрессии:

a¯=rsysx=0.99784.47580.8958=4.9856;

b¯=y¯a¯x¯=12.184.98563.65=6.0176.

Таким образом, уравнение регрессии имеет вид y=4.9856x6.0176

i xi yi xix¯ yiy¯ (xix¯)(yiy¯) (xix¯)2 (yiy¯)2
1 2 3.9 -1.65 -8.28 13.662 2.7225 68.5584
2 2.8 7.8 -0.85 -4.38 3.723 0.7225 19.1844
3 3 9.3 -0.65 -2.88 1.872 0.4225 8.2944
4 3.1 9.8 -0.55 -2.38 1.309 0.3025 5.6644
5 3.5 11.1 -0.15 -1.08 0.162 0.0225 1.1664
6 3.9 13.1 0.25 0.92 0.23 0.0625 0.8464
7 4.1 14 0.45 1.82 0.819 0.2025 3.3124
8 4.4 16.3 0.75 4.12 3.09 0.5625 16.9744
9 4.6 17.1 0.95 4.92 4.674 0.9025 24.2064
10 5.1 19.4 1.45 7.22 10.469 2.1025 52.1284
36.5 121.8 40.01 8.025 200.336

Упражнения

<quiz display=simple> { Если φ(x)=ax+b, то говорят о какой регрессии? |type="()"} + линейной - параболической - гиперболической

{ По какой формуле вычисляется выборочный коэффициент корреляции? |type="()"} - r=i=1n(xixi+1)(yiyi+1)i=1n(xixi+1)2i=1n(yiyi+1)2 - r=i=1n(xix¯)2(yiy¯)2i=1n(xix¯)i=1n(yiy¯) + r=i=1n(xix¯)(yiy¯)i=1n(xix¯)2i=1n(yiy¯)2

</quiz>