ЗАДАЧА № 2 По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли Y от среднегодовой ставки по кредитам Х1, ставки по депозитам Х2 и размера внутрибанковских расходов Х3. 36 28 66 74 80 84 82 98 112 96 Y
40 44 28 52 50 64 70 68 78 90 X1
32 40 44 28 50 56 50 56 60 62 X2
60 68 80 76 44 96 100 104 106 98 X3
1. Осуществить выбор факторных признаков для построения двухфакторной модели 2. Рассчитать параметры модели 3. Для характеристики модели определить а) линейный коэффициент множественной корреляции б) коэффициент детерминации в)средние коэффициенты эластичности г)бета, дельта - коэффициенты. Дать их интерпретацию 4. Оценить надежность уравнения регрессии 5. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии 6. Построить точечный и интервальный прогнозы результативного показателя 7. Отразить результаты прогнозов на графике РЕШЕНИЕ: Исходные данные сведены в табл. 1 Таблица 1. Статистические данные по переменным Y X1 X2 Х3
36 40 32 60
28 44 40 68
66 28 44 80
74 52 28 76
80 50 50 44
84 64 56 96
82 70 50 100
98 68 56 104
112 78 60 106
96 90 62 98
Сумма 756 584 478 832
Среднее 75,6 58,4 47,8 83,2
Количество наблюдений n равно 10
1.Вычисление матрицы коэффициентов парной корреляции и анализ тесноты связи между показателями Коэффициент парной корреляции определяется по формуле 1: Вычислим матрицу коэффициентов парной корреляции Таблица 2. Расчет величин, входящих в формулу 1 для расчета коэффициентов парной корреляции Y(t)-Ycp X1(t)-X1cp X2(t)-X2cp X3(t)-X3cp Y(t)-Ycp X1(t)-X1cp X2(t)-X2cp X3(t)-X3cp
Значимость коэффициентов корреляции проверяем по t-критерию Стьюдента, для этого рассчитываем tнабл по формуле Рассчитанные значения tнабл сведены в табл. 4 Таблица 4. Рассчитанные значения tнабл Сравниваем абсолютные значения tнабл с табличными значениями распределения Стьюдента tkp для надежности 90% и степени свобода n-2. Табличное значение tkp=1,86 Если tнабл>tkp , то полученное значение коэффициента корреляции признается значимым Таблица 4. Результаты расчета tнабл и выводы о значимости коэффициентов корреляции Наблюдаемые значения tнабл
Значимость коэффициента
Y X1 X2 X3
Y X1 X2 X3
Y
Y -
X1 3,194
X1 значим -
X2 3,217 3,124
X2 значим значим -
X3 2,508 2,752 2,214
X3 значим значим значим -
Проверяем условие мультиколлинеарности: rxi,xk<0.8; ry,xi>rxi,xk. Если хотя бы одно из этих неравенств не выполняется, то в модель включаются факторы, которые наиболее тесно связаны с Y. Факторы X1 X2 X3
Выполнение условия: rxi,xk<0.8; ry,xi>rxi,xk
1 1 0 +1 если выполнено условие
Общая оценка фактора 1,749 1,751 0,663
Строим двухфакторную модель. Вводим новые обозначения факторов. Фактор Х0 равен 1 для всех t Обозначим через Х1 фактор с наибольшей общей оценкой. В исходном условии это фактор X2 Обозначим через Х2 фактор со второй по величине оценкой. В исходном условии это фактор X1 В результате получим матрицы Y и Х, где матрица Х имеет 3 столбца (Х0,Х1 и Х2) и 10 строк. 2. Построение линейной модели регрессии Y(i)=a(0)*Х0+a(1)*X1(i)+a(2)*X2(i) Таблица 5. Матрицы,полученные после отбора ведущих фактора и использованные для построения модели
c учетом найденных коэффициентов уравнения регрессии а(0), а(1) и а(2)
уравнение регрессии имеет вид Yp(i)=-6,6346+0,9925*X1(i)+0,5958*X2(i)
3. Оценка качества построенной модели Таблица 6. Промежуточные расчеты для оценки адекватности модели t Факт Yp(t) Отклон Точки Откл, по |E(t)|/Y(t) E(t)2 [Y(t)-Ycp]2
Ycp =756 / 10 = 75,6 Таблицы 6. Продолжение E(t-1) E(t)-E(t-1) графа 11 в E(t)*E(t-1)
квадрате
10 11 12 13
- - - -
-12,96 -18,32 335,74 405,27
-31,28 43,56 1 897,64 -384,19
12,28 9,58 91,82 268,55
21,86 -14,64 214,45 157,88
7,22 -10,30 106,00 -22,20
-3,07 0,38 0,14 8,28
-2,69 11,24 126,26 -23,01
8,54 4,07 16,58 107,75
12,61 -25,13 631,72 -157,93
0,44 3 420,36 360,40
3.1.Проверка случайности уровней на основе критерия поворотных точек Проверку случайности уровней остаточной компоненты (столбец 4 табл.6.) проводим на основе критерия поворотных точек. Для этого каждый уровень ряда сравниваем с двумя соседними. Если он больше (либо меньше) обеих соседних уровней , то он является поворотной точкой и тогда в столбце 4 рядом с ним ставим 1. В первой и последней строку ставим прочерки, т.к. у этих уровней нет двух соседних уровней . Общее число поворотных точек равно 4 Оно приведено в последней строке 5-го столбца таблицы 6. Обозначим его через р Рассчитаем q = ЦЕЛОЕ{ 2 *(N-2)/3 - 2*КОРЕНЬ[(16*N - 29)/90] } = ЦЕЛОЕ{2,929495 } = 2 Суть критерия состоит в том, что если p>q, то условие случайности уровней выполнено. Поскольку неравенство p>q есть ИСТИНА то на вопрос
СВОЙСТВО СЛУЧАЙНОСТИ ВЫПОЛНЕНО? ОТВЕЧАЕМ : ДА
3.2. Проверка НЕЗАВИСИМОСТИ (ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ) Проверку проводим двумя методами а) по d-критерию Дарбина-Уотсона ; б) по первому коэффициенту автокорреляции r(1). Проверка по d-критерию Дарбина-Уотсона Для проверки по d-критерию Дарбина-Уотсона рассчитали значение d и если пол