МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

ЭКОНОМЕТРИКА
Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на ПЭВМ
для студентов 3 курса,
обучающихся по специальностям
«Финансы и кредит», «Бухгалтерский учет и аудит», «Экономика труда»,


Лекции – 16 ч. Аудиторная
Практические работа на ПЭВМ - 1
занятия –4 ч. Контрольная работа - 1
Практические Экзаменационный зачет
занятия на ПЭВМ - 4 ч. VI семестр
Всего - 24 ч.




Москва – 2005
Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на ПЭВМ разработали:
канд.экон.наук, профессор Орлова И.В.,
докт. экон.наук, профессор Половников В.А.
докт. физ.-мат наук, профессор Габескирия В.Я.,
канд.экон.наук, доцент Гармаш А.Н.,
канд.экон.наук, доцент Гусарова О.М.,
докт. физ.-мат наук, профессор Михайлов В.Н.,
докт.педагогич.наук, профессор Пилипенко А.И..

Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на ПЭВМ обсуждены на заседании кафедры экономико-математических методов и моделей.
Зав. кафедрой
профессор Половников В.А.
Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на ПЭВМ одобрены на заседании Научно-методического совета ВЗФЭИ
Проректор по УМРпредседатель НМСпрофессор Дайитбегов Д.М.
ЭКОНОМЕТРИКА Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на ПЭВМ.
Для студентов 3 курса, обучающихся по специальностям «Финансы и кредит», «Бухгалтерский учет анализ и аудит», «Экономика труда»

Содержание
TOC \t "Заголовок 3,2,Заголовок 7,1" Тема 1. Введение. Эконометрика и эконометрическое моделирование. PAGEREF _Toc8538782 \h 4
Тема 2. Временные ряды.. PAGEREF _Toc8538783 \h 7
Тема 3. Парная регрессия и корреляция. PAGEREF _Toc8538784 \h 7
3.1. корреляционный анализ PAGEREF _Toc8538785 \h 8
3.2. Регрессионный анализ PAGEREF _Toc8538786 \h 15
Тема 4. Множественная регрессия. PAGEREF _Toc8538787 \h 33
Тема 5. Системы линейных одновременных уравнений. 51
Тема 6. Многомерный статистический анализ 57
Задания для выполнения контрольной работы по дисциплине 66
Задания для выполнения аудиторной работы на ПЭВМ 70
Приложения 75
Литература 78
Полезные ссылки на интернет - ресурсы 78

PAGEREF _Toc8538794 \h 67

Тема 1. Введение. Эконометрика и эконометрическое моделирование.
Классификация эконометрических моделей. Основные этапы построения эконометрических моделей. Типы экономических данных, используемых в эконометрических исследованиях: пространственные данные и временные ряды.
Сегодня деятельность в любой области экономики (управлении, финансово-кредитной сфере, маркетинге, учете, аудите) требует от специалиста применения современных методов работы, знания достижений мировой экономической мысли, понимания научного языка. Большинство новых методов основано на эконометрических моделях, концепциях, приемах. Без глубоких знаний эконометрики научиться их использовать невозможно. Изучение современной экономической литературы также предполагает хорошую эконометрическую подготовку.
Так что же такое эконометрика? Сформулируем следующее определение.
Эконометрика – это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов на базе
экономической теории,
экономической статистики,
математико-статистического инструментария (см. рис. 1.1).

Рис. 1.1. К определению науки «Эконометрика»
эконометрика (вместе с микроэкономикой и макроэкономикой) входит в число основных дисциплин экономического образования.
Прикладное значение этой дисциплины состоит в том, что она является связующим звеном между экономической теорией и практикой. Эконометрика дает методы экономических измерений, методы оценки параметров моделей микро- и макроэкономики. Важно, что эконометрические методы одновременно позволяют оценить ошибки измерений экономических величин и параметров моделей. Экономист, не владеющий этими методами, не может эффективно работать аналитиком. Менеджер, не понимающий значение этих методов, обречен на принятие ошибочных решений. Без эконометрических методов нельзя построить сколько-нибудь надежного прогноза, а значит под вопросом успех в банковском деле, финансах, бизнесе.
Существует мнение, что проблема оценки параметров экономической модели при современном развитии вычислительной техники решается легко – достаточно научиться пользоваться каким-нибудь пакетом статистических программ. Это мнение справедливо лишь в небольшой степени. Пакеты статистических программ решают лишь вычислительные проблемы, они не освобождают пользователя от необходимости знания эконометрики.
Основные задачи эконометрики — построение количественно определенных экономико-математических моделей, разработка методов оценки их параметров по статистическим данным и анализ их свойств. Можно выделить три основных класса моделей, которые применяются для анализа и прогнозирования экономических систем [4, с. 13-15]
модели временных рядов.
регрессионные модели с одним уравнением.
системы одновременных уравнений.
При этом все переменные любой эконометрической модели, в зависимости от конечных прикладных целей ее использования, принято (целесообразно) делить на экзогенные, эндогенные и предопределенные.
Переменные, которые входят в эконометрическую модель, но рассматриваются как определенные независимо от моделируемого явления, называют экзогенными. Иными словами, экзогенные переменные заданы как бы «извне», автономно; в определенной степени это управляемые (планируемые) переменные. Их также называют независимыми переменными.
Если переменные определяются только явлением, для которого строится модель, то они называются эндогенными. Стало быть, значения этих переменных формируются в процессе и внутри функционирования анализируемой социально-экономической системы, причем в существенной мере под воздействием экзогенных переменных и, конечно, во взаимодействии друг с другом. В эконометрической модели они являются предметом объяснения, и в этом смысле их иногда называют зависимыми (объясняемыми) переменными.
Переменные, выступающие в системе в роли факторов - аргументов, или объясняющих переменных называют предопределенными. Очевидно, множество предопределенных переменных формируется из всех экзогенных переменных (которые могут быть «привязаны» к прошлым, текущему или будущим моментам времени) и так называемых лаговых эндогенных переменных, т. е. таких эндогенных переменных, значения которых входят в уравнения анализируемой эконометрической системы измеренными в прошлые (по отношению к текущему) моменты времени, а, следовательно, являются уже известными, заданными. Таким образом, можно сказать, что эконометрическая модель служит для объяснения поведения эндогенных переменных в зависимости от значений экзогенных и лаговых эндогенных переменных, т.е. в зависимости от значений предопределенных переменных. Н
На первом (постановочном) этапе построения такой модели формулируются конечные цели моделирования, определяется набор участвующих в модели факторов и показателей, т.е. устанавливается, какие из переменных рассматриваются как эндогенные, а какие – как экзогенные и лаговые эндогенные. Так, пусть Y={y1, y2, …, yn} – множество эндогенных переменных, а X={X1, X2, …, Xm} (где Xi ={x1i,x2i, …, xni}, а индекс i = EMBED Equation.3 ) – множество экзогенных переменных.
На втором этапе (априорном) осуществляется предварительный анализ экономической сущности изучаемого явления, формирование и формализация априорной информации, в частности, относящейся к природе и генезису исходных статистических данных и случайных остаточных составляющих.
Третий этап (параметризация) – это собственно моделирование, т. е. выбор общего вида модели, в том числе состава и формы, входящих в нее связей. Если соответствующая система уравнений разрешена относительно эндогенных переменных, то эконометрическая модель в общем случае записывается в виде Y= f(X), и проблема заключается в определении способов использования множества результатов наблюдений для уточнения коэффициентов функции f(X) Вообще говоря, система уравнений не обязательно должна быть разрешена аналитически. Модель может представлять собой множество операций, которые позволяют перейти от экзогенных к эндогенным переменным.
.
Четвертый этап (информационный) заключается в сборе необходимой статистической информации и предварительном анализе данных, т.е. регистрируются значения участвующих в модели факторов и показателей на различных временных или пространственных интервалах функционирования изучаемого явления.
Пятый этап (идентификация модели) посвящен статистическому анализу модели и в первую очередь статистической оценке неизвестных параметров модели. В зависимости от выбираемого критерия и численного метода оценки получаются разные результаты. Наибольшее распространение – из-за простоты реализации и надежности результатов – получил метод наименьших квадратов.
Шестой этап (верификация модели) предполагает сопоставление реальных и модельных данных, проверку адекватности модели, оценку точности модельных данных. Если модель адекватна и имеет приемлемую точность, то на ее основе проводится анализ моделируемой системы и строится прогноз – точечный и интервальный.
Последние три этапа (4-й, 5-й и 6-й) сопровождаются крайне трудоемкой процедурой калибровки модели. Она заключается в переборе большого числа различных вариантов «нормативные ограничения  Нормативные ограничения – ограничения, определенные содержательным смыслом анализируемых связей.
— значения отдельных переменных» (что связано с многократными «вычислительными прогонами» модели) с целью получения совместной, непротиворечивой и идентифицируемой модели.
Замечание. Если математическую модель экономического явления или процесса сформулировать в общем, виде без выполнения четвертого и пятого этапов, то ее нельзя считать эконометрической! Суть собственно эконометрической модели заключается в том, что она описывает функционирование именно конкретной экономической системы, а не системы вообще. Значит, она предусматривает обязательную реализацию четвертого и пятого, а, следовательно, и шестого этапов моделирования.
Следует обратить внимание на типы данных Данные [data] – сведения о состоянии любого объекта, в том числе и экономического, представленные в формализованном виде и предназначенные для обработки (или уже обработанные). Данные не обязательно должны быть числовыми. Так статистические показатели работы предприятий и анкетные данные о человеке – это все данные.
, чаще всего используемых в эконометрике. (Дело в том, что они могут иметь различный вид, который иногда диктует выбор методов экономико-математического анализа (или хотя бы влияет на него)).
1. Кросс секционные – иначе, перекрестные – данные представляют ситуацию в группе переменных в каждый отдельный момент времени. Например, списки цен акций, процентных ставок или обменных курсов, публикуемые в деловых разделах газет, представляют собой кросс секционные (перекрестные) данные, потому что относятся к ценам или ставкам нескольких переменных (акций, валют и т.п.) в данный момент времени. Данные, связанные с ценой каждой из составляющих индекса акций FTSE 100 в конкретный момент времени, также являются кросс секционными.
2. Пространственные данные – иначе, пространственный срез – характеризуют ситуацию по конкретной переменной (или набору переменных), относящейся к пространственно разделенным сходным объектам в один и тот же момент времени. Таковы, например, данные по курсам покупки или продажи наличной валюты в конкретный день по разным обменным пунктам г. Москвы. Другим примером является, скажем, набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени.
3. Временные ряды отражают изменения (динамику) какой-либо переменой на промежутке времени. Например, данные о цене акции, обменном курсе валюты за каждый день (неделю или месяц) в течение ряда лет будут ежедневным (еженедельным или ежемесячным) временным рядом. В качестве иных примеров временных данных можно привлечь ежеквартальные данные по инфляции, данные по средней заработной плате, национальному доходу и денежной эмиссии за несколько последних лет или цены фьючерсных контрактов на поставку долларов США (на МТБ) и котировки ГКО (на ММВБ), скажем, за два последних года.
Тема 2. Временные ряды Эта тема изучается только студентами 2-го образования. Студенты 1-го образования изучают эту тему в рамках дисциплины ЭММ и ПМ.
.
Структура и особенности временных рядов экономических показателей. Требования, предъявляемые к информационной базе временных рядов. Методы обнаружения и устранения аномальных наблюдений во временных рядах. Методы выявления тенденций во временных рядах. Исследование и моделирование тренд сезонных, сезонных и периодических колебаний в функционировании финансовых рынков. Экстраполяционные методы и модели прогнозирования социально-экономических процессов. Классификация методов и моделей экономического прогнозирования. Критерии точности и адекватности экономико-математических моделей. Экстраполяция тенденций развития финансово-экономических показателей с использованием кривых роста. Точечные и интервальные прогнозы.
Тема 3. Парная регрессия и корреляция.
экономические данные представляют собой количественные характеристики каких-либо экономических объектов или процессов. Они формируются под действием множества факторов, не все из которых доступны внешнему контролю. Неконтролируемые факторы могут принимать случайные значения из некоторого множества значений и тем самым обуславливать случайность данных, которые они определяют. Стохастическая (вероятностная) природа экономических данных обуславливает необходимость применения соответствующих статистических методов для их обработки и анализа.
Статистические распределения характеризуются наличием более или менее значительной вариации в величине признака у отдельных единиц совокупности. Естественно, возникает вопрос о том, какие же причины формируют уровень признака в данной совокупности и каков конкретный вклад каждой из них. Изучение зависимости вариации признака от окружающих условий и составляет содержание теории корреляции Основоположниками теории корреляции считаются английские биометрики Ф. Гальтон (1822-1911) и К.Пирсон (1857-1936). Термин «корреляция» был заимствован из естествознания и обозначает соотношение, соответствие. Представление о корреляции как об отношении взаимозависимости между случайными переменными величинами лежит в основе математико-статистической теории корреляции.
.
Изучение действительности показывает, что вариация каждого изучаемого признака находится в тесной связи и взаимодействии с вариацией других признаков, характеризующих исследуемую совокупность единиц. Вариация уровня производительности труда работников предприятий зависит от степени совершенства применяемого оборудования, технологии, организации производства, труда и управления и других самых различных факторов.
При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обусловливающих изменение других признаков. Признаки этой первой группы в дальнейшем будем называть признаками-факторами (факторными признаками); а признаки, которые являются результатом влияния этих факторов, будем называть результативными. Например, при изучении зависимости между производительностью труда рабочих и энерговооруженностью их труда уровень производительности труда является результативным признаком, а энерговооруженность труда рабочих - факторным признаком.
Рассматривая зависимости между признаками, необходимо выделить, прежде всего, две категории зависимости: 1) функциональные и 2) корреляционные.
Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением результативной величины, и каждому значению признака-фактора соответствуют вполне определенные значения результативного признака. Функциональная зависимость может связывать результативный признак с одним или несколькими факторными признаками. Так, величина начисленной заработной платы при повременной оплате труда зависит от количества отработанных часов.
В корреляционных связях между изменением факторного и результативного признака нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных. Одновременное воздействие на изучаемый признак большого количества самых разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует целое распределение значений результативного признака, поскольку в каждом конкретном случае прочие факторные признаки могут изменять силу и направленность своего воздействия.
При сравнении функциональных и корреляционных зависимостей следует иметь в виду, что при наличии функциональной зависимости между признаками можно, зная величину факторного признака, точно определить величину результативного признака. При наличии же корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака. В отличие от жесткости функциональной связи корреляционные связи характеризуются множеством причин и следствий и устанавливаются лишь их тенденции.
3.1. Корреляционный анализ
Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации. Кроме того, с помощью корреляционного анализа решаются следующие задачи: отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связи между ними; обнаружение ранее неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между параметрами, но устанавливает численное значение этих связей и достоверность суждений об их наличии.
Выборочная ковариация является мерой взаимосвязи между двумя переменными.
Ковариация между двумя переменными EMBED Equation.DSMT4 рассчитывается следующим образом:
EMBED Equation.3 ,
где EMBED Equation.DSMT4 - фактические значения случайных переменных x и y,
EMBED Equation.3 . EMBED Equation.3 .
ковариация - это статистическая мера взаимодействия двух случайных переменных, таких, например, как доходности двух ценных бумаг. Положительное значение ковариации показывает, что доходности этих ценных бумаг имеют тенденцию изменяться в одну сторону.
Ковариация зависит от единиц, в которых измеряются переменные EMBED Equation.DSMT4 ..
Поэтому для измерения силы связи между двумя переменными используется другая статистическая характеристика, называемая коэффициентом корреляции.
При проведении корреляционного анализа вся совокупность данных рассматривается как множество переменных (факторов), каждая из которых содержит n –наблюдений; хik – i-ое наблюдение k-ой переменной. Основными средствами анализа данных являются парные коэффициенты корреляции, частные коэффициенты корреляции и множественные коэффициенты корреляции.
Коэффициент парной корреляции
Для двух переменных EMBED Equation.DSMT4 теоретический коэффициент корреляции определяется следующим образом:
EMBED Equation.3 .
где EMBED Equation.3 - дисперсии случайных переменных EMBED Equation.DSMT4 , а EMBED Equation.DSMT4 их ковариация.
Парный коэффициент корреляции является показателем тесноты связи лишь в случае линейной зависимости между переменными и обладает следующими основными свойствами:
Коэффициент корреляции принимает значение в интервале (-1,+1), или
|?xy| < 1.
Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, т.е.
? (?1X+?; ?2Y+?)= ?xy,
где ?1, ?2, ? - постоянные величины, причем ?1>0, ?2>0.
Случайные величины Х, Y, можно уменьшать (увеличивать) в ? раз, а также вычитать или прибавлять к значениям EMBED Equation.DSMT4 одно и тоже число ? - это не приведет к изменению коэффициента корреляции ?.
При ? = ±1 случайные величины EMBED Equation.DSMT4 связаны линейной зависимостью, т.е. EMBED Equation.DSMT4 .
При ? = 0 линейная корреляционная связь отсутствует.
В практических расчетах коэффициент корреляции ? генеральной совокупности обычно не известен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции r, так как выборочная совокупность переменных EMBED Equation.DSMT4 случайна, то в отличие от параметра ? , r – случайная величина. Оценкой коэффициента корреляции EMBED Equation.3 является выборочный парный коэффициент корреляции:
EMBED Equation.3 = EMBED Equation.DSMT4 , (3.1)

где EMBED Equation.3 EMBED Equation.3 - оценки дисперсий величин EMBED Equation.DSMT4 .
Для оценки значимости коэффициента корреляции применяется t - критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле:
EMBED Equation.3 (3.2)
Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы.
Если tнабл > tкр, то полученное значение коэффициента корреляции признается значимым (то есть нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь.
Если значение EMBED Equation.3 близко к нулю, связь между переменными слабая. Если случайные величины связаны положительной корреляцией, это означает, что при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать. Если случайные величины связаны отрицательной корреляцией, это означает, что при возрастании одной случайной величины, другая имеет тенденцию в среднем убывать.
Коэффициенты парной корреляции используются для измерения силы линейных связей различных пар признаков из их множества. Для множества m признаков n наблюдений получают матрицу коэффициентов парной корреляции R.
EMBED Equation.3 (3.3)
Одной корреляционной матрицей нельзя полностью описать зависимости между величинами. В связи с этим, в многомерном корреляционном анализе рассматривается две задачи:
Определение тесноты связи одной случайной величины с совокупностью остальных (m – 1) величин, включенных в анализ;
Определение тесноты связи между величинами при фиксировании или исключении влияния остальных k величин, при k<(m-2).
Эти задачи решаются с помощью коэффициентов множественной и частной корреляции, соответственно.
Множественный коэффициент корреляции
Решение первой задачи осуществляется с помощью выборочного коэффициента множественной корреляции по формуле
EMBED Equation.3 , (3.4)
где EMBED Equation.3 - определитель корреляционной матрицы R (3.3);
EMBED Equation.3 - алгебраическое дополнение элемента rjj той же матрицы R.
Квадрат коэффициента множественной корреляции EMBED Equation.3 принято называть выборочным множественным коэффициентом детерминации, который показывает, какую долю вариации (случайного разброса) исследуемой величины Хj объясняет вариация остальных случайных величин X1 , X2 , . . . , Xm.
Коэффициенты множественной корреляции и детерминации являются величинами положительными, принимающими значения в интервале от 0 до 1. При приближении коэффициента R2 к единице можно сделать вывод о тесноте взаимосвязи случайных величин, но не о ее направлении. Коэффициент множественной корреляции может только увеличиваться, если в модель включать дополнительные переменные и не увеличится, если из имеющихся признаков производить исключение.
Проверка значимости коэффициента множественной корреляции осуществляется путем сравнения расчетного значения критерия Фишера:
EMBED Equation.3 , (3.5)
с табличным Fтабл. Табличное значение критерия определяется заданным уровнем значимости EMBED Equation.3 и степенями свободы EMBED Equation.3 и EMBED Equation.3. Коэффициент R2 значимо отличается от нуля, если выполняется неравенство
EMBED Equation.3 .
Частный коэффициент корреляции
Если рассматриваемые случайные величины коррелируют друг с другом, то на величине коэффициента парной корреляции частично сказывается влияние других величин. В связи с этим возникает необходимость исследования частной корреляции между величинами при исключении влияния одной или нескольких других случайных величин.
Выборочный частный коэффициент корреляции определяется по формуле:
‘ EMBED Equation.3 ,
где EMBED Equation.3 – алгебраические дополнения к соответствующим элементам матрицы (3.3).
Частный коэффициент корреляции, так же как и парный коэффициент корреляции изменяется от –1 до +1.
Пример 3.1. Вычисление коэффициентов парной, множественной и частной корреляции.
В табл. 3.1. представлена информация об объёмах продаж и затратах на рекламу одной фирмы, а также индекс потребительских расходов за ряд текущих лет.
Требуется:
Построить диаграмму рассеяния (корреляционное поле) для переменных «объёмы продаж» и «индекс потребительских расходов».
Определить степень влияния индекса потребительских расходов на объёмы продаж (вычислить коэффициент парной корреляции).
Оценить значимость вычисленного коэффициента парной корреляции.
Построить матрицу коэффициентов парной корреляции по трем переменным.
Найти оценку множественного коэффициента корреляции.
Найти оценки коэффициентов частной корреляции.
Таблица 3.1

Решение
1) Вытянутость облака точек на диаграмме рассеяния вдоль наклонной прямой позволяет сделать предположение о том, что существует некоторая объективная тенденция прямой линейной связи между значениями переменных x- индекс потребительских расходов и y- объёмы продаж.
В нашем примере диаграмма рассеяния имеет вид, приведенный на рис 3.1.
2) Промежуточные расчеты при вычислении коэффициента корреляции между переменными x- индекс потребительских расходов и y- объёмы продаж приведены в таблице 3.2..
Средние значения случайных величин Х и Y, которые являются наиболее простыми показателями, характеризующими последовательности EMBED Equation.2 и EMBED Equation.2 , рассчитаем по формулам, соответственно:
EMBED Equation.DSMT4 EMBED Equation.3 EMBED Equation.3 .
Дисперсия характеризуют степень разброса значений EMBED Equation.2 ( EMBED Equation.2 ) вокруг своего среднего EMBED Equation.DSMT4 ( EMBED Equation.DSMT4 , соответственно)
EMBED Equation.3 EMBED Equation.3
EMBED Excel.Chart.8 \s
Рис. 3.1. Диаграмма рассеяния (корреляционное поле).

Стандартные ошибки случайных величин Х и Y рассчитаем по формулам, соответственно:
EMBED Equation.3
Коэффициент корреляции рассчитаем по формуле (3.1):
EMBED Equation.DSMT4
Таблица 3.2.

3) Оценим значимость коэффициента корреляции. Для этого рассчитаем значение t – статистики по формуле EMBED Equation.3 Табличное значение критерия Стьюдента равно: tтабл (? = 0,1; k = n – 2 = 14) =1,76 (см. Приложение 2). Сравнивая числовые значения критериев, видно, что tрасч > tтабл, т.е. полученное значение коэффициента корреляции значимо.
Таким образом, индекс потребительских расходов оказывает весьма высокое влияние на объёмы продаж.
4) Матрица R коэффициентов парной корреляции, вычисленных по формуле (3.1) для трех факторов будет иметь вид:
5) Вычисление множественного коэффициента корреляции y c x1 и x2.
EMBED Equation.3
EMBED Equation.3 - определитель корреляционной матрицы R равен 0,1304.
EMBED Equation.3 - алгебраическое дополнение 1-го диагонального элемента EMBED Equation.DSMT4 той же матрицы R
EMBED Equation.DSMT4 .
6) Вычисление коэффициентов частной корреляции.
EMBED Equation.3
EMBED Equation.DSMT4 ,
где EMBED Equation.3 алгебраическое дополнение элемента EMBED Equation.DSMT4 матрицы R, а EMBED Equation.3 алгебраическое дополнение 2-го диагонального элемента EMBED Equation.DSMT4 :

EMBED Equation.DSMT4
EMBED Equation.DSMT4 .
Коэффициенты частной корреляции можно вычислить, используя коэффициенты парной корреляции:
EMBED Equation.DSMT4
EMBED Equation.DSMT4 .
3.2. Регрессионный анализ
Регрессионный анализ предназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели.
В регрессионных моделях зависимая (объясняемая) переменная Y может быть представлена в виде функции f (X1, X2, X3, … Xm), где X1, X2, X3, … Xm - независимые (объясняющие) переменные, или факторы. В качестве зависимой переменной может выступать практически любой показатель, характеризующий, например, деятельность предприятия или курс ценной бумаги. В зависимости от вида функции f (X1, X2, X3, … Xm) модели делятся на линейные и нелинейные. В зависимости от количества включенных в модель факторов Х модели делятся на однофакторные (парная модель регрессии) и многофакторные (модель множественной регрессии).
Связь между переменной Y и m независимыми факторами можно охарактеризовать функцией регрессии Y= f (X1, X2, X3, … Xm), которая показывает, каково будет в среднем значение переменной yi, если переменные xi примут конкретные значения.
Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования экономических явлений.
Линейная парная регрессия
Под линейностью здесь имеется в виду, что переменная y предположительно находиться под влиянием переменной x в следующей зависимости:
EMBED Equation.3 , (3.6)
где EMBED Equation.DSMT4 - постоянная величина (или свободный член уравнения), EMBED Equation.DSMT4 - коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений. Это показатель, характеризующий изменение переменной EMBED Equation.3 , при изменении значения EMBED Equation.3 на единицу. Если EMBED Equation.3 - переменные EMBED Equation.3 и EMBED Equation.3 положительно коррелированные, если EMBED Equation.DSMT4 ? 0 – отрицательно коррелированны; EMBED Equation.3 - независимые одинаково распределенные случайные величины – остаток с нулевым математическим ожиданием (EMBED Equation.3) и постоянной дисперсией (EMBED Equation.3). Она отражает тот факт, что изменение EMBED Equation.3 будет неточно описываться изменением Х – присутствуют другие факторы, неучтенные в данной модели.
Оценка параметров регрессионного уравнения
Дня оценки параметров регрессионного уравнения наиболее часто используют метод наименьших квадратов (МНК), который минимизирует сумму квадратов отклонения наблюдаемых значений EMBED Equation.3 от модельных значений EMBED Equation.3 .
Согласно принципу метода наименьших квадратов, оценки EMBED Equation.2 и EMBED Equation.2 находятся путем минимизации суммы квадратов
EMBED Equation.2
по всем возможным значениям EMBED Equation.2 и EMBED Equation.2 при заданных (наблюдаемых) значениях EMBED Equation.2 . Задача сводится к известной математической задаче поиска точки минимума функции двух переменных. Точка минимума находится путем приравнивания нулю частных производных функции EMBED Equation.2 по переменным EMBED Equation.2 и EMBED Equation.2 . Это приводит к системе нормальных уравнений
EMBED Equation.2 EMBED Equation.2
решением которой и является пара EMBED Equation.2 , EMBED Equation.2 . Согласно правилам вычисления производных имеем
EMBED Equation.2 EMBED Equation.2
EMBED Equation.2 EMBED Equation.2
так что искомые значения EMBED Equation.2 , EMBED Equation.2 удовлетворяют соотношениям
EMBED Equation.2 EMBED Equation.2
Эту систему двух уравнений можно записать также в виде
EMBED Equation.2
Эта система является системой двух линейных уравнений с двумя неизвестными и может быть легко решена, например, методом подстановки. В результате получаем
EMBED Equation.2
EMBED Equation.2 (3.7)

Такое решение может существовать только при выполнении условия
EMBED Equation.2
что равносильно отличию от нуля определителя системы нормальных уравнений. Действительно, этот определитель равен
EMBED Equation.2
Последнее условие называется условием идентифицируемости модели наблюдений EMBED Equation.2 , и означает, что не все значения EMBED Equation.2 совпадают между собой. При нарушении этого условия все точки EMBED Equation.2 , лежат на одной вертикальной прямой EMBED Equation.2
Оценки EMBED Equation.2 и EMBED Equation.2 называют оценками наименьших квадратов. Обратим еще раз внимание на полученное выражение для EMBED Equation.2 . Нетрудно видеть, что в это выражение входят уже знакомые нам суммы квадратов, участвовавшие ранее в определении выборочной дисперсии EMBED Equation.2
и выборочной ковариации EMBED Equation.3 EMBED Equation.2 так что, в этих терминах,
EMBED Equation.3 = EMBED Equation.3 = EMBED Equation.3 EMBED Equation.3 =
= EMBED Equation.3 EMBED Equation.3 (3.8)
Матричная форма записи
В матричной форме модель парной регрессии имеет вид:
EMBED Equation.DSMT4 (3.9)
где Y - вектор-столбец размерности EMBED Equation.DSMT4 наблюдаемых значений зависимой переменной;
Х – матрица размерности EMBED Equation.DSMT4 наблюдаемых значений факторных признаков. Дополнительный фактор х0 вводится для вычисления свободного члена;
EMBED Equation.DSMT4 - вектор-столбец размерности EMBED Equation.DSMT4 неизвестных, подлежащих оценке коэффициентов регрессии;
EMBED Equation.DSMT4 - вектор-столбец размерности EMBED Equation.DSMT4 ошибок наблюдений
EMBED Equation.DSMT4 .
.Решение системы нормальных уравнений в матричной форме имеет вид:
EMBED Equation.DSMT4
Пример 3.2.
Бюджетное обследование семи случайно выбранных семей дало следующие результаты (в тыс. $ ):
Табл. 3.2..
Требуется:
построить однофакторную модель регрессии
отобразить на графике исходные данные, результаты моделирования.
Решение
Для вычисления параметров модели следует воспользоваться формулами (3.7) и (3.8). Промежуточные расчеты приведены в таблице 3.3.
Табл. 3.3.
EMBED Equation.3 ,
EMBED Equation.DSMT4 EMBED Equation.3 = 3.643 - 0.143125* 40.714= -2.184.
Построена модель зависимости накопления от дохода:
EMBED Equation.3 , график, которой изображен на рис. 3.2.
EMBED Excel.Sheet.8
Рисунок 3.2 График модели парной регрессии.
Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков - EMBED Equation.3 .
После построения уравнения регрессии мы можем разбить значение у, в каждом наблюдении на две составляющих - EMBED Equation.3 и EMBED Equation.3 ;
EMBED Equation.3 (3.10)
Остаток EMBED Equation.3 представляет собой отклонение фактического значения зависимой переменной от значения данной переменной, полученное расчетным путем: EMBED Equation.DSMT4 ( EMBED Equation.DSMT4 ). Если EMBED Equation.DSMT4 ( EMBED Equation.DSMT4 ), то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значениями. Графически это означает, что теоретическая линия регрессии (линия, построенная по функции EMBED Equation.DSMT4 ) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи. Следовательно, результативный признак EMBED Equation.DSMT4 полностью обусловлен влиянием фактора EMBED Equation.DSMT4 .
На практике, как правило, имеет место некоторое рассеивание точек корреляционного поля относительно теоретической линии регрессии, т. е. отклонения эмпирических данных от теоретических ( EMBED Equation.DSMT4 ). Величина этих отклонений и лежит в основе расчета показателей качества (адекватности) уравнения.
При анализе качества модели регрессии используется основное положение дисперсионного анализа [6], согласно которому общая сумма квадратов отклонений зависимой переменной от среднего значения EMBED Equation.DSMT4 может быть разложена на две составляющие — объясненную и необъясненную уравнением регрессии дисперсии:

EMBED Equation.3 (3.11)
где EMBED Equation.3 - значения y, вычисленные по модели EMBED Equation.DSMT4 .
Разделив правую и левую часть (3.11) на EMBED Equation.3
EMBED Equation.3 ,
получим
EMBED Equation.3 .
Коэффициент детерминации определяется следующим образом:
EMBED Equation.3 (3.12.)
Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.
Чем ближе EMBED Equation.3 к 1, тем выше качество модели.
Для оценки качества регрессионных моделей целесообразно также использовать коэффициент множественной корреляции (индекс корреляции) R

R = EMBED Equation.3 = EMBED Equation.3 (3.13)
Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных.
При построении однофакторной модели он равен коэффициенту линейной корреляции EMBED Equation.DSMT4 .
Очевидно, что чем меньше влияние неучтенных факторов, тем лучше модель соответствует фактическим данным.
Также для оценки точности регрессионных моделей целесообразно использовать среднюю относительную ошибку аппроксимации:
EMBED Equation.DSMT4 EMBED Equation.DSMT4 ( 3.14)
Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7 % свидетельствует о хорошем качестве модели.
После того как уравнение регрессии построено, выполняется проверка значимости построенного уравнения в целом и отдельных параметров.
Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y
Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипотезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: EMBED Equation.DSMT4 . Альтернативная ей гипотеза о значимости уравнения — гипотеза о неравенстве нулю параметров регрессии.
Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение с ?1= k и ?2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой.
Для модели парной регрессии:
EMBED Equation.DSMT4 (3.15)
В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины ( EMBED Equation.3 ) называется стандартной ошибкой оценки.
EMBED Equation.3 (3.16)

Для модели парной регрессии EMBED Equation.3
Анализ статистической значимости параметров модели парной регрессии EMBED Equation.3
Значения EMBED Equation.3, соответствующие данным EMBED Equation.3 при теоретических значениях EMBED Equation.DSMT4 и EMBED Equation.DSMT4 являются случайными. Случайными являются и рассчитанные по ним значения коэффициентов EMBED Equation.DSMT4 и EMBED Equation.DSMT4 .
Надежность получаемых оценок EMBED Equation.DSMT4 и EMBED Equation.DSMT4 зависит от дисперсии случайных отклонений (ошибок). По данным выборки эти отклонения и, соответственно, их дисперсия не оцениваются – в расчетах используются отклонения зависимой переменной EMBED Equation.3 от ее расчетных значений EMBED Equation.3 : EMBED Equation.3. Так как ошибки (остатки) EMBED Equation.3 нормально распределены, то среднеквадратическое отклонение ошибок используется для измерения этой вариации. Среднеквадратические отклонения коэффициентов известны как стандартные ошибки (отклонения):
EMBED Equation.DSMT4
EMBED Equation.DSMT4 (3.17)

где EMBED Equation.3 - среднее значение независимой переменной х;
EMBED Equation.3 стандартная ошибка, вычисляемая по формуле (3.16);
EMBED Equation.DSMT4 .
Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений t-критерия (t–статистики) для соответствующих коэффициентов регрессии:
EMBED Equation.DSMT4 (3.18)
Затем расчетные значения EMBED Equation.DSMT4 сравниваются с табличными tтабл. Табличное значение критерия определяется при (n-2) степенях свободы (n - число наблюдений) и соответствующем уровне значимости ? (0,1; 0,05)
Если расчетное значение t-критерия с (n - 2) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).
Интервальная оценка параметров модели
Для значимого уравнения регрессии представляет интерес построение интервальных оценок для параметра EMBED Equation.3:
EMBED Equation.3 (3.19)
свободного члена EMBED Equation.3:
EMBED Equation.3
где tтабл определяется по таблице распределения Стьюдента для уровня значимости ? и числа степеней свободы k = n - 2;
EMBED Equation.3, EMBED Equation.3– стандартные отклонения, соответственно, свободного члена и коэффициента модели (3.6);
n – число наблюдений.
Прогнозирование с применением уравнения регрессии
Регрессионные модели могут быть использованы для прогнозирования возможных ожидаемых значений зависимой переменной.
Прогнозируемое значение переменной EMBED Equation.DSMT4 получается при подстановке в уравнение регрессии
EMBED Equation.DSMT4 (3.20)
ожидаемой величины фактора EMBED Equation.DSMT4 . Данный прогноз называется точечным. Значение независимой переменной EMBED Equation.DSMT4 не должно значительно отличаться от входящих в исследуемую выборку, по которой вычислено уравнение регрессии.
Вероятность реализации точечного прогноза теоретически равна нулю. Поэтому рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надежностью.
доверительные интервалы, зависят от стандартной ошибки (3.16), удаления EMBED Equation.DSMT4 от своего среднего значения EMBED Equation.3, количества наблюдений n и уровня значимости прогноза ?. В частности, для прогноза (3.20) будущие значения EMBED Equation.DSMT4 с вероятностью (1 - ?) попадут в интервал
EMBED Equation.DSMT4 EMBED Equation.3 EMBED Equation.3 .
Пример 3.3
Используя данные примера 3.1, оценить накопления семьи, имеющей доход 42 тыс. $ и отобразить на графике исходные данные, результаты моделирования и прогнозирования.
Решение
В примере 3.1 была построена модель зависимости накопления от дохода:
EMBED Equation.3 .
Для того, чтобы определить накопления семьи при доходе 42 тыс.$ необходимо подставить значение хпрогн в полученную модель.
yпрогноз = - 2.184+0.143*42= 3.827
Величину отклонения от линии регрессии вычисляют по формуле EMBED Equation.DSMT4 , используя данные таблицы 3.4. Величину EMBED Equation.DSMT4 находят по формуле (3.16):
EMBED Equation.3 = EMBED Equation.3 = 0.9112
Табл. 3.4.
Коэффициент Стьюдента EMBED Equation.3 EMBED Equation.3 для m=5 степеней свободы (m=n-2) и уровня значимости 0.1 равен 2.015. Тогда
U(x=42,n=7,?=0.1) = EMBED Equation.3 =
= EMBED Equation.3 = EMBED Equation.3 =1.965
Таким образом, прогнозное значение EMBED Equation.3 =3.827 будет находиться между верхней границей, равной 3.827+1.965=5.792 и нижней границей, равной 3.827-1.965=1.862.
График исходных данных и результаты моделирования приведены на рисунке 3.5
EMBED Excel.Sheet.8
Рисунок 3.5. График модели парной регрессии зависимости накопления от дохода.
Нелинейная регрессия
Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.
Теоретические вопросы, связанные с построением моделей нелинейной регрессии следует изучить по учебнику «Эконометрика» под ред. И.И. Елисеевой стр.62-80.
Пример 3.4.
По семи предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объема капиталовложений ( Х, млн. руб. ).
Требуется:
1.Для характеристики Y от Х построить следующие модели:
линейную (для сравнения с нелинейными),
степенную,
показательную,
гиперболическую.
2.Оценить каждую модель, определив:
индекс корреляции,
среднюю относительную ошибку,
коэффициент детерминации,
F-критерий Фишера.
3.Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4.Рассчитать прогнозные значения результативного признака по лучшей модели, если объем капиталовложений составит 89,573 млн. руб.
5.Результаты расчетов отобразить на графике.
Решение:
1. Построение линейной модели парной регрессии
Определим линейный коэффициент парной корреляции по следующей формуле:
EMBED Equation.3 ;
Можно сказать, что связь между объемом капиталовложений Х и объемом выпуска продукции Y обратная, достаточно сильная.
Уравнение линейной регрессии имеет вид: y = a + b ? x
Таблица 3.5
Значения параметров a и b линейной модели определим, используя данные таблицы 3.5
EMBED Equation.3
Уравнение линейной регрессии имеет вид:
y = 95,36 - 0,55 ? х
С увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции уменьшится в среднем на 550 тыс. руб. Это свидетельствует о неэффективности работы предприятий, и необходимо принять меры для выяснения причин и устранения этого недостатка.
Рассчитаем коэффициент детерминации:
R2 = r2yx = 0,822
Вариация результата Y (объема выпуска продукции) на 82,2 % объясняется вариацией фактора Х (объемом капиталовложений).
Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:
EMBED Equation.3
F>FТАБЛ = 6,61 для ? = 0,05 ; к1=m=1, k2=n-m-1=5.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т. к. F>FТАБЛ .
Определим среднюю относительную ошибку:
EMBED Equation.3
В среднем расчетные значения y для линейной модели отличаются от фактических значений на 5,685 %.
2. Построение степенной модели парной регрессии
Уравнение степенной модели имеет вид: EMBED Equation.DSMT4
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
lg y = lg a + b lg x
Обозначим Y = lg y, X = lg x, A = lg a. Тогда уравнение примет вид:
Y = A + b X - линейное уравнение регрессии.
Рассчитаем его параметры, используя данные таблицы 3.6
Таблица 3.6
EMBED Equation.3
Уравнение регрессии будет иметь вид :
Y=3.3991-0,8921 X
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.
EMBED Equation.3 EMBED Equation.3
Получим уравнение степенной модели регрессии:
EMBED Equation.3
Определим индекс корреляции:
EMBED Equation.3
Связь между показателем y и фактором x можно считать достаточно сильной.
Коэффициент детерминации: 0.836
EMBED Equation.3
Вариация результата Y (объема выпуска продукции) на 83,6 % объясняется вариацией фактора Х (объемом капиталовложений).
Рассчитаем F-критерий Фишера:
EMBED Equation.3
F>FТАБЛ = 6,61 для ? = 0,05. к1=m=1, k2=n-m-1=5
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т. к. F>FТАБЛ.
Средняя относительная ошибка
EMBED Equation.3 .
В среднем расчетные значения y для степенной модели отличаются от фактических значений на 6,04 %.
3. Построение показательной функции
Уравнение показательной кривой: y = a b x
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:

lg y = lg a + x lg b
Обозначим Y = lg y, B = lg b, A = lg a.
Получим линейное уравнение регрессии:
Y = A + B x .
Рассчитаем его параметры, используя данные таблицы 3.7.
Таблица 3.7.
EMBED Equation.3
Уравнение будет иметь вид: Y=2,09-0,0048 EMBED Equation.3
Перейдем к исходным переменным x и y, выполнив потенциирование данного уравнения:
EMBED Equation.3 .
Определим индекс корреляции
EMBED Equation.3
Связь между показателем y и фактором x можно считать достаточно сильной.
Индекс детерминации:
EMBED Equation.3
Вариация результата Y (объема выпуска продукции) на 82,8 % объясняется вариацией фактора Х (объемом капиталовложений).
Рассчитаем F-критерий Фишера:
EMBED Equation.3
F>FТАБЛ = 6,61 для ? = 0,05 ; к1=m=1, k2=n-m-1=5 .
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т. к. F>FТАБЛ .
Средняя относительная ошибка:
EMBED Equation.3
В среднем расчетные значения y для показательной функции отличаются от фактических на 5.909 %.
4.Построение гиперболической функции
Уравнение гиперболической функции : y = a + b / x .
Произведем линеаризацию модели путем замены Х = 1 / х. В результате получим линейное уравнение
y = a + b Х.
Рассчитаем его параметры по данным таблицы 3.8
Таблица 3.8.
EMBED Equation.3
Получим следующее уравнение гиперболической модели:
y=5,7 + 3571,9 / х
Определим индекс корреляции
EMBED Equation.3
Связь между показателем y и фактором x можно считать достаточно сильной.
Индекс детерминации:
EMBED Equation.3
Вариация результата Y (объема выпуска продукции) на 83,5 % объясняется вариацией фактора Х (объемом капиталовложений).
F-критерий Фишера:
EMBED Equation.3
F>FТАБЛ = 6,61 для ? = 0,05 ; к1=m=1, k2=n-m-1=5 .
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т. к. F>FТАБЛ .
Средняя относительная ошибка
EMBED Equation.3
В среднем расчетные значения y для гиперболической модели отличаются от фактических значений на 6,029 %.
Для выбора лучшей модели построим сводную таблицу результатов.
Таблица 3.9.
Все модели имеют примерно одинаковые характеристики, но большее значение F – критерия Фишера и большее значение коэффициента детерминации R2 имеет гиперболическая модель. Ее можно взять в качестве лучшей для построения прогноза.
Расчет прогнозного значения результативного показателя:
Прогнозное значение результативного признака (объема выпуска продукции) определим по уравнению гиперболической модели, подставив в него планируемую (заданную по условию) величину объема капиталовложений :
yПР = 5,7 + 3571,9/ ХПР = 5,7 + 3571,9/ 89,573 = 45,542 (млн. руб.)
Построение парной нелинейной регрессии можно осуществить при помощи программы “Олимп:СтатЭксперт”. Для этого необходимо выполнить следующую последовательность действий:
Инициализировать программу, указать включение макросов, щелкнуть ОК.
Ввести исходные данные – результативный признак (y) и факторный признак (x).
В конец строки для “у” дописать 0, в конец строки для “х” – планируемое (заданное в условии) значение этого фактора (объема капиталовложений).
Выделить этот блок данных.
В меню СтатЭкс выбрать функцию Регрессия;
Установить шаблон данных: указать ориентацию таблицы либо по строкам, либо по столбцам, в зависимости от того, как был осуществлен ввод данных, и наличие наименований таблицы, наблюдений. Щелкнуть Установить.
В окне Регрессионный анализ в список выбранных переменных добавить два показателя, соответствующие значениям “y” и “x”;
Осуществить выбор зависимой переменной, для этого щелкнуть Выбор и выбрать показатель, соответствующий значениям “y”. Установить.
Установить вид регрессии – Парная. Вычислить.
В окне формирования набора моделей в списке доступных переменных выбрать гиперболическую модель y = a + b / x.
Выход.
После выполнения этой последовательности действий программа осуществит расчет параметров гиперболической модели, прогнозных значений и построение графиков. Отчет по вычислениям представлен в следующем виде:
На основании данных расчетов получено уравнение гиперболической модели:
Y(X)=+5.664+3571,928/X .
Аналогичные результаты были получены при осуществлении расчетов в Excel.
Фактические, расчетные и прогнозные значения по лучшей модели отобразим на графике.
EMBED Excel.Chart.8 \s
Рисунок 3.6. Прогноз по лучшей модели.
Тема 4. множественная регрессия.
Линейная модель множественной регрессии имеет вид:
Y i = ?0 + ?1x i 1 +?2x i 2 +…+ ?m x i m + ?i , EMBED Equation.DSMT4 (4.1.)
коэффициент регрессии ?j показывает, на какую величину в среднем изменится результативный признак Y, если переменную xj увеличить на единицу измерения, т. е. ?j является нормативным коэффициентом. Обычно предполагается, что случайная величина ?i имеет нормальный закон распределения с математическим ожиданием равным нулю и с дисперсией EMBED Equation.3 .
Анализ уравнения (4.1) и методика определения параметров становятся более наглядными, а расчетные процедуры существенно упрощаются, если воспользоваться матричной формой записи уравнения (4.2.):
Y = X ? + ?, (4.2.)
Y – это вектор зависимой переменной размерности п ? 1, представляющий собой п наблюдений значений уi, Х— матрица п наблюдений независимых переменных X1, X 2, X 3 , … X m, размерность матрицы Х равна п ? (т+1); ?— подлежащий оцениванию вектор неизвестных параметров размерности (т+1) ? 1; ?— вектор случайных отклонений (возмущений) размерности п ? 1. Таким образом,
Y = EMBED Equation.3 , X = EMBED Equation.3 , ? = EMBED Equation.3
Уравнение (4.1) содержит значения неизвестных параметров ?0,?1,?2,… ,?m EMBED Equation.3 . Эти величины оцениваются на основе выборочных наблюдений, поэтому полученные расчетные показатели не являются истинными, а представляют собой лишь их статистические оценки. Модель линейной регрессии, в которой вместо истинных значений параметров подставлены их оценки (а именно такие регрессии и применяются на практике), имеет вид
Y =Ха + е= EMBED Equation.3 +е, (4.3)
где а — вектор оценок параметров; е — вектор «оцененных» отклонений регрессии, остатки регрессии е = Y - Ха; EMBED Equation.3 —оценка значений Y, равная Ха.
Оценка параметров модели множественной регрессии с помощью метода наименьших квадратов.
Формулу для вычисления параметров регрессионного уравнения приведем без вывода
a = (Xт X )-1 X т Y (4.4).
Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных, т. е., решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экономических показателей это условие выполняется не всегда. Линейная или близкая к ней связь между факторами называется мультиколлинеарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисление параметров либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Мультиколлинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания. В частности, так может случиться, когда значения одной независимой переменной являются лагированными значениями другой. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0.8. Чтобы избавиться от мультиколлинеарности, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной. EMBED Equation.3
В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:
ryxi > rxixk , ryxk > rxixk , rxixk < 0.8
Если приведенные неравенства (или хотя бы одно из них) не выполняются, то в модель включают тот фактор, который наиболее тесно связан с Y.
Оценка качества модели регрессии.
Качество модели регрессии оценивается по следующим направлениям:
проверка качества всего уравнения регрессии;
проверка значимости всего уравнения регрессии;
проверка статистической значимости коэффициентов уравнения регрессии;
проверка выполнения предпосылок МНК.
Для оценки качества модели множественной регрессии вычисляют коэффициент множественной корреляции (индекс корреляции) R и коэффициент детерминации R2 (см. формулы 3.12 и 3.13). Чем ближе к 1 значение этих характеристик, тем выше качество модели.
В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скорректирован с учетом числа независимых переменных. Скорректированный R2, или EMBED Equation.3 , рассчитывается так:
EMBED Equation.3 , (4.5)
где n — число наблюдений;
k — число независимых переменных.
Проверка значимости модели регрессии
Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый по формуле:
EMBED Equation.3 (4.6)
Если расчетное значение с ?1= к и ?2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой.
Анализ статистической значимости параметров модели
значимость отдельных коэффициентов регрессии проверяется по t-статистике путем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного члена):
taj = EMBED Equation.DSMT4 / Saj , (4.7.)
где Saj — это стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии aj. Величина Saj представляет собой квадратный корень из произведения несмещенной оценки дисперсии EMBED Equation.3 и j -го диагонального элемента матрицы, обратной матрице системы нормальных уравнений.
Saj = EMBED Equation.3 ? EMBED Equation.3 , (4.8)
где bjj - диагональный элемент матрицы (ХТ Х)-1.
Если расчетное значение t-критерия с (n - k - 1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели, при этом оставшиеся в модели параметры должны быть пересчитаны.
Проверка выполнения предпосылок МНК.
Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты.
Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые (в действительности, почти независимые) одинаково распределенные случайные величины. В классических методах регрессионного анализа предполагается также нормальный закон распределения остатков.
Исследование остатков полезно начинать с изучения их графика. 0н может показать наличие какой-то зависимости, не учтенной в модели. Скажем, при подборе простой линейной зависимости между Y и X график остатков может показать необходимость перехода к нелинейной модели (квадратичной, полиномиальной, экспоненциальной) или включения в модель периодических компонент.
График остатков хорошо показывает и резко отклоняющиеся от модели наблюдения — выбросы. Подобным аномальным наблюдениям надо уделять особо пристальное внимание, так как их присутствие может грубо искажать значения оценок. Устранение эффектов выбросов может проводиться либо с помощью удаления этих точек из анализируемых данных, (эта процедура называется цензурированием), либо с помощью применения методов оценивания параметров, устойчивых к подобным грубым отклонениям.
Независимость остатков проверяется с помощью критерия Дарбина – Уотсона.
Корреляционная зависимость между текущими уровнями некоторой переменной и уровнями этой же переменной, сдвинутыми на несколько шагов, называется автокорреляцией.
Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.
Наличие (отсутствие) автокорреляции в отклонениях проверяют с помощью критерия Дарбина – Уотсона. Численное значение коэффициента равно
EMBED Equation.3 (4.9)
Значение dw статистики близко к величине 2(1 – r(1)), где r(1) - выборочная автокорреляционная функция остатков первого порядка. Таким образом, значение статистики Дарбина - Уотсона распределено в интервале от 0 до 4. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения критерия соответствуют положительной автокорреляции остатков, большие значения - отрицательной. Статистика учитывает только автокорреляцию первого порядка. Оценки, получаемые по критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели. Значения этих границ для уровня значимости EMBED Equation.3 = 0,05 даны в специальных таблицах (см. Приложение 2, табл. П-3). При сравнении расчетного значения dw статистики (3.3.9) с табличным могут возникнуть такие ситуации: d2 < dw < 2 – ряд остатков не коррелирован; dw < d1 – остатки содержат автокорреляцию; d1 < dw < d2 – область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существовании автокорреляции. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед сравнением с табличными значениями dw критерий следует преобразовать по формуле dw´=4 – dw.
Установив наличие автокорреляции остатков, переходят к улучшению модели. Если же ситуация оказалась неопределенной (d1 < dw < d2 ), то применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции
EMBED Equation.3 . (4.10)
Для принятия решения о наличии или отсутствии автокорреляции в исследуемом ряду фактическое значение коэффициента автокорреляции r(1) сопоставляется с табличным (критическим) значением для 5%-ного уровня значимости (вероятности допустить ошибку при принятии нулевой гипотезы о независимости уровней ряда). Если фактическое значение коэффициента автокорреляции меньше табличного, то гипотеза об отсутствии автокорреляции в ряду может быть принята, а если фактическое значение больше табличного – делают вывод о наличии автокорреляции в ряду динамики.
Обнаружение гетероскедастичности
Для обнаружения гетероскедастичности обычно используют три теста, в которых делаются различные предположения о зависимости между дисперсией случайного члена и объясняющей переменной: тест ранговой корреляции Спирмена, тест Голдфельда - Квандта и тест Глейзера [Доугерти].
При малом объеме выборки для оценки гетероскедастичности может использоваться метод Голдфельда — Квандта.
Данный тест используется для проверки такого типа гетероскедастичности, когда дисперсия остатков возрастает пропорционально квадрату фактора. При этом делается предположение, что, случайная составляющая EMBED Equation.DSMT4 распределена нормально.
Чтобы оценить нарушение гомоскедастичности по тесту Голдфельда - Квандта необходимо выполнить следующие шаги.
Упорядочение п наблюдений по мере возрастания переменной х.
Разделение совокупности на две группы (соответственно с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии.
Определение остаточной суммы квадратов для первой регрессии EMBED Equation.DSMT4 и второй регрессии EMBED Equation.DSMT4 .
Вычисление отношений EMBED Equation.DSMT4 (или EMBED Equation.DSMT4 ). В числителе должна быть большая сумма квадратов.
Полученное отношение имеет F распределение со степенями свободы k1=n1-m и k2=n-n1-m, (m– число оцениваемых параметров в уравнении регрессии).
Если EMBED Equation.DSMT4 , то гетероскедастичность имеет место.
Чем больше величина F превышает табличное значение F -критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.

Оценка влияния отдельных факторов на зависимую переменную на основе модели (коэффициенты эластичности, ? - коэффициенты).
Важную роль при оценке влияния факторов играют коэффициенты регрессионной модели. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(j) и бета-коэффициенты ?(j), которые рассчитываются соответственно по формулам:
EMBED Equation.DSMT4 (4.11.)
EMBED Equation.DSMT4 (4.12.)
где Sxj — среднеквадратическое отклонение фактора j
где EMBED Equation.3 EMBED Equation.3
.
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент. Однако он не учитывает степень колеблемости факторов.
Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy изменится зависимая переменная Y с изменением соответствующей независимой переменной Хj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных.
Указанные коэффициенты позволяют упорядочить факторы по степени влияния факторов на зависимую переменную.
Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта - коэффициентов ? (j):
EMBED Equation.DSMT4
где EMBED Equation.DSMT4 — коэффициент парной корреляции между фактором j (j = 1,...,m) и зависимой переменной.
Использование многофакторных моделей для анализа и прогнозирования развития экономических систем.
Одна из важнейших целей моделирования заключается в прогнозировании поведения исследуемого объекта. Обычно термин «прогнозирование» используется в тех ситуациях, когда требуется предсказать состояние системы в будущем. Для регрессионных моделей он имеет, однако, более широкое значение. Как уже отмечалось, данные могут не иметь временной структуры, но и в этих случаях вполне может возникнуть задача оценки значения зависимой переменной для некоторого набора независимых, объясняющих переменных, которых нет в исходных наблюдениях. Именно в этом смысле — как построение оценки зависимой переменной — и следует понимать прогнозирование в эконометрике.
При использовании построенной модели для прогнозирования делается предположение о сохранении в период прогнозирования существовавших ранее взаимосвязей переменных.
Построение точечных и интервальных прогнозов на основе регрессионной модели. Какие факторы влияют на ширину доверительного интервала?
Для того чтобы определить область возможных значений результативного показателя, при рассчитанных значениях факторов следует учитывать два возможных источника ошибок: рассеивание наблюдений относительно линии регрессии и ошибки, обусловленные математическим аппаратом построения самой линии регрессии. Ошибки первого рода измеряются с помощью характеристик точности, в частности, величиной Sy. Ошибки второго рода обусловлены фиксацией численного значения коэффициентов регрессии, в то время как они в действительности являются случайными, нормально распределенными.
Для линейной модели регрессии доверительный интервал рассчитывается следующим образом. Оценивается величина отклонения от линии регрессии (обозначим ее U):.
EMBED Equation.DSMT4 (4.13)
где EMBED Equation.DSMT4

Пример 4.1.
Задача состоит в построении модели для предсказания объема реализации одного из продуктов фирмы.
Объем реализации – это зависимая переменная Y(млн. руб.) В качестве независимых, объясняющих переменных выбраны: время - X1, расходы на рекламу X 2 (тыс. руб.), цена товара X3 (руб.), средняя цена товара у конкурентов X4 (руб.), индекс потребительских расходов X5 (%).
Требуется:
Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.
Рассчитать параметры модели.
Для оценки качества всего уравнения регрессии определить:
линейный коэффициент множественной корреляции,
коэффициент детерминации,
Осуществить оценку значимости уравнения регрессии.
Оценить с помощью t - критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
Оценить влияние факторов на зависимую переменную по модели
Построить точечный и интервальный прогноз результирующего показателя на два шага вперед EMBED Equation.3
1 Построение системы показателей (факторов). Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели.
Статистические данные по всем переменным приведены в таблице 4.1. В этом примере n = 16, m = 5.
Таблица 4.1
Использование инструмента Корреляция (Анализ данных в EXCEL).
Для проведения корреляционного анализа выполните следующие действия:
Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.
Выберите команду Сервис?Анализ данных.
В диалоговом окне Анализ данных выберите инструмент Корреляция, а затем щелкните на кнопке ОК.
В диалоговом окне Корреляця в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные. Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.
Выберите параметры вывода. В данном примере Новый рабочий лист.
ОК.
Таблица 4.2. Результат корреляционного анализа.
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем реализации имеет тесную связь с индексом потребительских расходов (ryx5= 0.816), с расходами на рекламу (ryx2 = 0.646) и со временем (ryx1 = 0.678). Однако факторы Х2 и Х5 тесно связаны между собой (rх 1x5 = 0.96), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х5 - индекс потребительских расходов. В этом примере n = 16, m = 5, после исключения незначимых факторов n = 16, k =2.
Выбор вида модели и оценка ее параметров
Оценка параметров регрессии осуществляется по методу наименьших квадратов по формуле EMBED Equation.DSMT4 , используя данные Для вычисления а0 добавлен столбец Х0.
, приведенные в таблице 4.3
Таблица 4.3

EMBED Equation.3 EMBED Equation.3
(Xт X ) = EMBED Equation.3
(Xт X )-1 = EMBED Equation.3
a = (Xт X )-1 X т Y = EMBED Equation.3 = EMBED Equation.3
Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:
y = -1471.314 + 9.568х1 + 15.754х2
Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого наблюдения.
Применение инструмента Регрессия (Анализ данных в EXCEL).
Для проведения регрессионного анализа выполните следующие действия:
Выберите команду Сервис?Анализ данных.
В диалоговом окне Анализ данных выберите инструмент Регрессия, а затем щелкните на кнопке ОК
В диалоговом окне Регрессия в поле Входной интервал Y введите адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х введите адреса одного или нескольких диапазонов, которые содержат значения независимых переменных (Рисунок 4.1.).
Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.
Выберите параметры вывода. В данном примере Новая рабочая книга
В поле Остатки поставьте необходимые флажки.
ОК.


Рисунок 4.1. Диалоговое окно Регрессия подготовлено к выполнению анализа данных.
Результат регрессионного анализа содержится в таблицах 4.4 –4.7. Рассмотрим содержание этих таблиц.
Таблица 4.4.
Таблица 4.5
Таблица 4.6
Таблица 4.7

Пояснения к таблице 4.4.
Пояснения к таблице 4.5.
Пояснения к таблице 4.6.
Во втором столбце таблицы 4.6. содержатся коэффициенты уравнения регрессии a0, a1, a2. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии, а в четвертом - t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.
Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:
y = -1471.314 + 9.568х1 + 15.754х2
3.Оценка качества всего уравнения регрессии
В таблице 4.7 приведены вычисленные (предсказанные) по модели значения зависимой переменной Y и значения остаточной компоненты EMBED Equation.DSMT4 .
Значение коэффициентов детерминации и множественной корреляции можно найти в таблице Регрессионная статистика.
Коэффициент детерминации:
EMBED Equation.3
= 1- 22360.104/158718.44 = 136358.3/158718.44 = 0.859
Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 86% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Коэффициент множественной корреляции R:
EMBED Equation.3 = 0.927.
Он показывает тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами.
4. Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:
EMBED Equation.3
Значение F-критерия Фишера можно найти в таблице 4.6 протокола EXCEL.
Табличное значение F-критерия при доверительной вероятности 0,95 при EMBED Equation.2 = k =2 и EMBED Equation.2 =n – k -1= 16 – 2 - 1=13 составляет 3.81. Табличное значение F-критерия можно найти с помощью функции FРАСПОБР (Рис. 4.3)

Рисунок 4.3. Определение табличного значения F-критерия.
Поскольку F EMBED Equation.2 >F EMBED Equation.2 , уравнение регрессии следует признать адекватным.
4.Оценить с помощью t - критерия Стъюдента статистическую значимость коэффициентов уравнения множественной регрессии.
Значимость коэффициентов уравнения регрессии a0, а EMBED Equation.2 , а EMBED Equation.2 оценим с использованием t-критерия Стьюдента.
Значения t-критерия вычислим по формулам:
taj=aj/Saj
Saj = EMBED Equation.3 ? EMBED Equation.3 ,
где bjj - диагональный элемент матрицы (ХТ Х)-1.
(Xт X )-1 = EMBED Equation.3
b11 =39.2314
b22 = 0.00299
b33 = 0.00354
ta0 = -1471.314 /259.766 = -1471.314 / 41.473 EMBED Equation.3 = - 5.664
ta1 = 9.5684/2.2659 = 9.5684 / 41.473 EMBED Equation.3 =4.223
ta2 = 15.7529/2.4669 = 15.7529/ 41.473 EMBED Equation.3 =6.3858
Расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии а EMBED Equation.2 , а EMBED Equation.2 приведены в четвертом столбце таблицы 4.7 протокола EXCEL. Табличное значение t-критерия Стьюдента можно найти с помощью функции СТЬЮДРАСПОБР (Рис. 4.4)

Рисунок 4.4. Определение табличного значения t-критерия Стьюдента.
Табличное значение t-критерия при 5% уровне значимости и степенях свободы (16-2-1=13) составляет 2,16. Так как |t EMBED Equation.2 |>t EMBED Equation.2 , то коэффициенты a1, а EMBED Equation.2 и существенны (значимы).

EMBED Excel.Sheet.8 .
Рисунок 4.2. График остатков.
5. Проанализировать влияние факторов на зависимую переменную по модели (для каждого коэффициента регрессии вычислить коэффициент эластичности, ?-коэффициент.
Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем коэффициент эластичности (Э) и бета-коэффициент, которые соответственно рассчитываются по формулам:
EMBED Equation.2
EMBED Equation.2 9.568?9.294/306.813=0.2898
EMBED Equation.2 15.7529?107.231/306.813=5.506
EMBED Equation.2
EMBED Equation.2 9.568?4.913/102.865=0.457
EMBED Equation.2 15.7529?4.5128/102.865=0.691
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.
Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных. Это означает, что при увеличении затрат на рекламу в нашем примере на 4.91 тыс. руб. объем реализации увеличится на 47 тыс. руб. (0.457*102.865).
6. Определить точечные и интервальные прогнозные оценки объема реализации на два квартала вперед (t0,7 = 1,12)
Исходные данные представлены временными рядами, поэтому прогнозные значения EMBED Equation.2 , EMBED Equation.2 и EMBED Equation.2 , EMBED Equation.2 можно определить с помощью методов экспертных оценок, с помощью средних абсолютных приростов или вычислить на основе экстраполяционных методов.
Для фактора Х1 Затраты на рекламу выбрана модель
Х1 = 12.83-11.616t +4.319t2 –0.552t3+0.020t4-0.0006t5,
по которой получен прогноз на 2 месяца вперед Внимание!!! Полиномы таких высоких порядков редко используются при прогнозировании экономических показателей.
. График модели временного ряда Затраты на рекламу приведен на Рисунке 4.5.

EMBED Excel.Sheet.8
Рисунок 4.5. Прогноз показателя Затраты на рекламу.
Для временного ряда Индекс потребительских расходов в качестве аппроксимирующей функции выбран полином второй степени (парабола), по которой построен прогноз на 2 шага вперед. На рисунке 4.6. приведен результат построения тренда для временного ряда Индекс потребительских расходов.
Х2 = 97.008+1.739t – 0.0488t2.
EMBED Excel.Sheet.8
Рисунок 4.6. Прогноз показателя Индекс потребительских расходов.
Для получения прогнозных оценок зависимостей переменной по модели
Y = -1471.438 + 9.568X1 + 15.754X2
подставим в нее найденные прогнозные значения факторов X1 и X2.
Yt=17 = -1471.438 + 9.568*5.75 + 15.754*112.468=355.399
Yt=18 = -1471.438 + 9.568*4.85 + 15.754*112.488=344.179
Доверительный интервал прогноза будет иметь следующие границы:
Верхняя граница прогноза: EMBED Equation.2 (n+l)+ U(l),
Нижняя граница прогноза: EMBED Equation.2 (n+ l) - U(l).
u(l) = Se tкр EMBED Equation.3 = Se tкр EMBED Equation.3
S EMBED Equation.3 = 41.473
tкр = 1,77 (Значение tкр получено с помощью функции СТЬЮДРАСПРОБР(0.1;13) для выбранной вероятности 90% с числом степеней свободы равным 13. )
На первый шаг:
l =1
ХпрТ = (1; 5.75; 112.468)
(Xт X )-1 = EMBED Equation.3
u(1) = 81,45
На второй шаг:
l=2
ХпрТ = (1; 4.85; 112.488)
u(2) = 82б47
Результаты прогнозных оценок модели регрессии представим в табл. 4.8.
Табл. 4.8.






Тема 5. Системы линейных одновременных уравнений.
Экономические показатели, часто оказываются взаимозависимы. Структура связей между такими показателями (переменными) может быть описана с помощью системы одновременных (структурных) уравнений. В этих уравнениях присутствуют переменных следующих типов:
-эндогенные, зависимые переменные y, определяемые внутри системы;
-экзогенные, независимые переменные x, значения которых задаются извне, они являются управляемыми, планируемыми;
-предопределенные переменные, включающие в себя как экзогенные переменные за текущий период времени, так и лаговые переменные (т.е. экзогенные и эндогенные переменные за предыдущие периоды времени).
Выделяют следующие виды эконометрических систем.
Системы независимых уравнений, в которых каждая зависимая переменная yi (i=1,…,n) представлена как функция одного и того же набора независимых переменных xj (j=1,…,m):
y1 = a11 x1 + a12 x2 + …+a1m xm + ?1
y2 = a21 x1 + a22 x2 + …+a2m xm + ?2 (5.1)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
yn = an1 x1 + an2 x2 + …+anm xm + ?n
Каждое уравнение этой системы можно рассматривать самостоятельно как уравнение регрессии. В него может быть введен свободный член и коэффициенты регрессии могут быть найдены методом наименьших квадратов (МНК).
Системы рекурсивных уравнений, в которых зависимые переменные yi (i=1,…,n) представлены как функции независимых переменных xj (j=1,…,m) и определенных ранее зависимых переменных
y1 , y2 ,…, yi-1:
y1 = a11 x1 + a12 x2 + …+a1m xm + ?1
y2 = b21 y1 + a21 x1 + a22 x2 + …+a2m xm + ?2 (5.2)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
yn = bn1 y1 + bn2 y2 +,…,+bnn-1 yn-1 +an1 x1 + an2 x2 + …+anm xm + ?n
Параметры каждого уравнения системы определяются отдельно, в последовательном порядке начиная с первого уравнения методом наименьших квадратов.
Системы взаимозависимых уравнений, в которых каждая зависимая переменная yi (i=2,…,n) представлена как функция остальных зависимых переменных yk (k ? i) и независимых (предопределенных) переменных xj (j=1,…,m):
y1= b12 y2 + b13 y3 + … + b1n yn +a11 x1 + a12 x2 + …+a1m xm + ?1
y2= b21 y1 + b23 y3 + … + b2n yn +a21 x1 + a22 x2 + …+a2m xm + ?2 (5.3)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
yn= bn1 y1 + bn2 y2 + … + bnn-1 yn-1 +an1 x1 + an2 x2 + …+anm xm + ?n
Эта система наиболее распространенная, она получила также название системы совместных, одновременных уравнений. Ее так же называют структурной формой модели (СФМ).
Отдельные коэффициенты при переменных СФМ могут быть равны нулю, что означает отсутствие в уравнении этих переменных. Например, модель динамики цены и заработной платы может быть описана СФМ вида
y1= b12 y2 +a11 x1 + ?1
y2= b21 y1 + a22 x2 +a23 x3 + ?2 (5.4)

где y1 – темп изменения заработной платы;
y2 – темп изменения цен;
x1 – процент безработных;
x2 – темп изменения постоянного капитала;
x3 – темп изменения цен на импорт сырья.
Данная система из двух уравнений содержит две зависимые, эндогенные (y1 , y2) и три независимые, экзогенные (x1,x2,x3) переменные. В первом уравнении отсутствуют переменные x2 и x3 . Это значит, что коэффициенты a12 = 0 и a13= 0.
В СФМ для нахождения параметров модели bij и aij (называемых также структурными коэффициентами модели), простой МНК неприменим.
Обычно для определения структурных коэффициентов модели СФМ преобразуется в приведенную форму модели (ПФМ).
y1 = ?11 x1 + ?12 x2 + …+?1m xm
y2 = ?21 x1 + ?22 x2 + …+?2m xm (5.5)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
yn = ?n1 x1 + ?n2 x2 + …+?nm xm
Параметры приведенной формой модели ?ij могут быть оценены по методу наименьших квадратов. По этим параметрам затем можно рассчитать структурные коэффициенты модели bij и aij. Для существования однозначного соответствия между параметрами структурной и приведенной формами необходимо выполнение условия идентификации.
Структурные формы модели могут быть
идентифицируемые;
неидентифицируемые;
сверхиндетифицируемые.
Для того, чтобы СФМ была идентифицируема, необходимо чтобы каждое уравнение системы было идентифицируемо. В этом случае число параметров СФМ равно числу параметров приведенной формы.
Если хотя бы одно уравнение СФМ неидентифицируемо, то вся модель считается неидентифицируемой. В этом случае число коэффициентов приведенной формы модели меньше, чем число коэффициентов СФМ.
Модель сверхидентифицируема, если число приведенных коэффициентов больше числа структурных коэффициентов. В этом случае можно получить два и более значений одного структурного коэффициента на основе коэффициентов приведенной формы модели. В сверхидентифицируемой модели хотя бы одно уравнение сверхидентифицируемо, а остальные уравнения идентифицируемы.
Если обозначить число эндогенных переменных в i-том уравнении СФМ через Н, а число предопределенных переменных, которые содержатся в системе, но не входят в данное уравнение через D, то условие идентифицируемости модели может быть записано в виде следующего счетного правила:
если D+1 < H уравнение неидентифицируемо;
если D+1 = H уравнение идентифицируемо;
если D+1 > H уравнение сверхидентифицируемо;
Счетное правило является необходимым, но не достаточным условием идентификации. Кроме этого правила для идентифицируемости уравнения должно выполняться дополнительное условие.
Отметим в системе эндогенные и экзогенные переменные, отсутствующие в рассматриваемом уравнении, но присутствующие в системе. Из коэффициентов при этих переменных в других уравнениях составим матрицу. При этом если переменная стоит в левой части уравнения, то коэффициент надо брать с обратным знаком. Если определитель полученной матрицы не равен нулю, а ранг не меньше, чем количество эндогенных переменных в системе без одного, то достаточное условие индетификации для данного уравнения выполнено.
Поясним это на примере следующей структурной модели.
y1= b12 y2 + b13 y3 + a11 x1 + a12 x2
y2= b21 y1 + a22 x2 + a23 x3 + a24 x4 (5.6)
y3= b31 y1 + b32 y2 +a31 x1 + a32 x2
Проверим каждое уравнение системы на выполнение неоходимого и достаточного условия идентификации.
В первом уравнении три эндогенных переменных: y1 ,y2 и y3 (H=3). В нем отсутствуют экзогенные переменные x3 и x4 (D=2). Необходимое условие идентификации D+1=H выполнено.
Для проверки на достаточное условие составим матрицу из коэффициентов при переменных x3 и x4 (см. таблицу 5.1). В первом столбце таблицы показано, что коэффициенты при экзогенных переменных x3 и x4 взяты из уравнений 2 и 3 системы. Во втором уравнении эти переменные присутствуют и коэффициенты при них равны a23 и a24 соответственно. В третьем уравнении эти переменные отсутствуют, т.е. коэффициенты при них равны нулю. Так как вторая строка матрицы состоит из нулей, определитель матрицы равен нулю. Значит, достаточное условие не выполнено, и первое уравнение нельзя считать идентифицируемым.
Таблица 5.1
Матрица, составленная из коэффициентов при переменных x3 и x4.
Во втором уравнении две эндогенные переменные: y1 и y2 (H=2). В нем отсутствует экзогенная переменная x1 (D=1). Необходимое условие идентификации D+1=H выполнено.
Для проверки на достаточное условие составим матрицу из коэффициентов при переменных y3 и x1 , которые отсутствуют во втором уравнении (см. таблицу 5.2).

Таблица 5.2
Матрица, составленная из коэффициентов при переменных y3 и x1.
В третьем уравнении при переменной y3 коэффициент равен –1, так как эта переменная стоит в левой части уравнения. Действительно, третье уравнение можно записать в виде 0= b31 y1 + b32 y2 -1 y3 +a31 x1 + a32 x2 и тогда равенство b33 = –1 становится очевидным.
В общем случае СФМ может быть представлена в виде матрицы коэффициентов при переменных. В этом случае второе уравнение может быть задано вектором (b31 , b32 , -1, a31 , a32 , 0 , 0) , а вся система одновременных уравнений (5.6) будет представлена матрицей
(5.7)
EMBED Equation.DSMT4
В примерах и задачах для контрольных работ мы будем представлять СФМ в виде такой матрицы коэффициентов при переменных модели.
Определитель представленной в таблице 5.2 матрицы не равен нулю, а ранг матрицы равен 2. Значит, достаточное условие выполнено, и второе уравнение идентифицируемо.
В третьем уравнении три эндогенные переменные: y1 ,y2 и y3 (H=3). В нем отсутствует экзогенные переменные x3 и x4 (D=2). Необходимое условие идентификации D+1=H выполнено.
Для проверки на достаточное условие составим матрицу из коэффициентов при переменных х3 и x4 , которые отсутствуют в третьем уравнении (см. таблицу 5.3). Согласно таблице определитель матрицы равен нулю (первая строка состоит из нулей). Значит, достаточное условие не выполнено, и третье уравнение нельзя считать идентифицируемым.
Таблица 5.3
Матрица, составленная из коэффициентов при переменных x3 и x4.
В эконометрических моделях иногда используются балансовые тождества переменных (например, вида y3= y1 + y2 + x1 ). Коэффициенты при переменных при этом не требуют оценок и уравнение не надо исследовать на идентификацию, но в проверке на идентификацию всей системы эти уравнения участвуют. Присутствующие иногда в моделях свободные и остаточные члены (а01 , а02 , а03 ,…?1 , ?2 , ?3 ,…) не влияют на решение вопроса об идентификации.
При оценивании коэффициентов структурной модели используется ряд методов. С этими методами можно ознакомиться в рекомендованной литературе [1,2]. Рассмотрим косвенный метод наименьших квадратов (КМНК) , который применяется в случае точно идентифицируемой структурной модели. Рассмотрим этот метод на примере следующей идентифицируемой модели, содержащей две эндогенные и две экзогенные переменные:
y1= b12 y2 + a11 x1 + ?1 (5.8)
y2= b21 y1 + a22 x2 + ?2
Для построения модели мы располагаем информацией, представленной в таблице 5.4
Таблица 5.4.
Фактические данные для построения модели

Структурную модель преобразуем в приведенную форму модели.
y1= d11 x1 + d12 x2 + u1
y2= d21 x1 + d22 x2 + u2
u1 и u1 – случайные ошибки.
Для каждого уравнения приведенной формы при расчете коэффициентов d можно применить МНК.
Для упрощения расчетов можно работать с отклонениями от средних уровней y=y-ycp и x=x-xcp (ycp и xcp –средние значения). Преобразованные таким образом данные таблицы 5.4 сведены в таблицу 5.5. Здесь же показаны промежуточные расчеты, необходимые для определения коэффициентов dik. Переменные, означающие отклонение от средних значений изображаются далее жирным шрифтом и курсивом.
Для нахождения коэффициентов d1k первого приведенного уравнения можно использовать следующую систему нормальных уравнений:
? y1 x1= d11 ? x12 + d12 ? x1 x2
? y1 x2= d11 ? x1 x2 + d12 ? x22
Таблица 5.5
Преобразованные данные для построения приведенной формы модели

Подставляя рассчитанные в таблице 5.5 значения сумм, получим
83,102= 33,5 d11 - 29,001d12
-20,667= -29,001d11 + 155,334d12
Решение этих уравнений дает значения d11 = 2,822 и d12 = 0,394. Первое уравнение приведенной формы модели примет вид
y1= 2,822 x1 + 0,394 x2 + u1
Для нахождения коэффициентов d2k второго приведенного уравнения можно использовать следующую систему нормальных уравнений:
? y2 x1= d21 ? x12 + d22 ? x1 x2
? y2 x2= d21 ? x1 x2 + d22 ? x22
Подставляя рассчитанные в таблице 5.5 значения сумм, получим
21,755 = 33,5 d21 - 29,001d22
134,417= -29,001d21 + 155,334d22
Решение этих уравнений дает значения d21 =1,668 и d22 =1,177. Второе уравнение приведенной формы модели примет вид
y2= 1,668 x1 + 1,177 x2 + u2
Для перехода от приведенной формы к структурной форме модели найдем x2 из второго уравнения приведенной формы модели
x2 = (y2 - 1,668 x1 ) / 1,177
Подставим это выражение в первое уравнение приведенной модели, найдем структурное уравнение
y1= 2,822 x1 + 0,394 (y2 - 1,668 x1 ) / 1,177 =
= 2,822 x1 + 0,335 y2 - 0,558 x1 = 0,335 y2 + 2,264 x1
Таким образом, b12 = 0,335; a11 = 2,264.
Найдем x1 из первого уравнения приведенной формы модели
x1 = (y1 - 0,394 x2 ) / 2,822
Подставим это выражение во второе уравнение приведенной модели, найдем структурное уравнение
y2= 1,177 x2 + 1,668 (y1 - 0,394 x2 ) / 2,822 =
= 1,177 x2 + 0,591 y1 - 0,233 x2 = 0,591 y1 + 0,944 x2
Таким образом, b21 = 0,591; a22 = 0,944.
Свободные члены структурной формы находим из уравнений
А01= y1,cp - b12 y2,cp - a11 x1,cp =
45,133 – 0,335 * 43,93 –2,264* 7,5 = 13,436
А02= y2,cp - b21 y1,cp - a22 x2,cp =
43,93 – 0,591* 45,133 - 0,944 * 10,333= 7,502
Окончательный вид структурной модели
y1= a01+ b12 y2 + a11 x1 + ?1= 13,436 + 0,335 y2 + 2,264 x1 + ?1
y2= a02+ b21 y1 + a22 x2 + ?2= 7,502 + 0,591 y1 + 0,944 x2 + ?2
Литература по теме 5:
1. Елисеева И.И. Эконометрика: Учебник. - М.: Финансы и статистика, 2001.
2. Елисеева И.И. Практикум по эконометрике: Учебное пособие. –
М. : Финансы и статистика, 2001.
Тема 6. Многомерный статистический анализ
Данная тема знакомит студентов с некоторыми методами многомерного статистического анализа (МСА), которые получили наибольшее распространение. При изучении данной темы необходимо уделить особое внимание типам задач, для решения которых используются методы МСА. Технология решения задач подробно рассмотрена в [7] См. список литературы к теме 6.
. Практическое применение методов МСА требует обязательного использования вычислительной техники и специального программного обеспечения. Программа курса предусматривает по данной теме выполнение лабораторной работы с помощью программы СтатЭксперт.
Факторный и компонентный анализ в большинстве случаев проводятся совместно.
Компонентный анализ является методом определения структурной зависимости между случайными переменными. В результате его использования получается сжатое описание малого объема, несущее почти всю информацию, содержащуюся в исходных данных. Главные компоненты получаются из исходных переменных путем целенаправленного вращения, т.е. как линейные комбинации исходных переменных. Вращение производится таким образом, чтобы главные компоненты были ортогональны и имели максимальную дисперсию среди возможных линейных комбинаций исходных переменных X. При этом переменные не коррелированы между собой и упорядочены по убыванию дисперсии (первая компонента имеет наибольшую дисперсию). Кроме того, общая дисперсия после преобразования остается без изменений.
Факторный анализ является более общим методом преобразования исходных переменных по сравнению с компонентным анализом.
Факторный анализ
Факторный анализ - выявление и обоснование действия различных признаков и их комбинаций на исследуемый процесс путем снижения их размерности. Такая задача решается, как правило, путем "сжатия" исходной информации и выделения из нее наиболее "существенной" информации, т.е. описание объектов меньшим числом обобщенных признаков, называемых факторами.
При использовании методов факторного анализа решаются следующие задачи: [3]
отыскание скрытых, но объективно существующих закономерностей исследуемого процесса, определяемых воздействием внутренних и внешних причин;
описание изучаемого процесса значительно меньшим числом факторов по сравнению с первоначально взятым количеством признаков;
выявление первоначальных признаков, наиболее тесно связанных с основными факторами;
прогнозирование процесса на основе уравнения регрессии, построенного по полученным факторам.
Кластерный анализ
Кластерный анализ — это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается набором признаков (параметров) Х1, Х2, ..., Хk. Целью кластерного анализа является образование групп схожих между собой объектов, которые принято называть кластерами (класс, таксон, сгущение).
Кластерный анализ — одно из направлений статистического исследования. Особо важное место он занимает в тех отраслях науки, которые связаны с изучением массовых явлений и процессов. Необходимость развития методов кластерного анализа и их использования продиктована тем, что они помогают построить научно обоснованные классификации, выявить внутренние связи между единицами наблюдаемой совокупности. Кроме того, методы кластерного анализа могут использоваться с целью сжатия информации, что является важным фактором в условиях постоянного увеличения и усложнения потоков статистических данных.
Методы кластерного анализа позволяют решать следующие задачи [2]:
• проведение классификации объектов с учетом признаков, отражающих сущность, природу объектов. Решение такой задачи, как правило, приводит к углублению знаний о совокупности классифицируемых объектов;
• проверка выдвигаемых предположений о наличии некоторой структуры в изучаемой совокупности объектов, т.е. поиск существующей структуры;
• построение новых классификаций для слабоизученных явлений, когда необходимо установить наличие связей внутри совокупности и попытаться привнести в нее структуру.
Дискриминантный анализ
Дискриминантный анализ является разделом многомерного статистического анализа, который включает в себя методы классификации многомерных наблюдений по принципу максимального сходства при наличии обучающих признаков.
Напомним, что в кластерном анализе рассматриваются методы многомерной классификации без обучения. В дискриминантном анализе новые кластеры не образуются, а формулируется правило, по которому объекты подмножества подлежащего классификации относятся к одному из уже существующих (обучающих) подмножеств (классов), на основе сравнения величины дискриминантной функции классифицируемого объекта, рассчитанной по дискриминантным переменным, с некоторой константой дискриминации.
Предположим, что существуют две или более совокупности (группы) и что мы располагаем множеством выборочных наблюдений над ними. Основная задача дискриминантного анализа состоит в построении с помощью этих выборочных наблюдений правила, позволяющего отнести новое наблюдение к одной из совокупностей.
Постановка задачи дискриминантного анализа
Пусть имеется множество M единиц N объектов наблюдения, каждая i–я единица которого описывается совокупностью p значений дискриминантных переменных (признаков) xij , (i=1,2,..., N; j = 1,2,..., р). Причем все множество M объектов включает q обучающих подмножеств (q EMBED Equation.3 2) Mk размером пk каждое и подмножество M0 объектов подлежащих дискриминации (под дискриминацией понимается различие). Здесь k - номер подмножества (класса), (k = 1,2,..., q).
Требуется установить правило (линейную или нелинейную дискриминантную функцию f(Х)) распределения m-объектов подмножества M0 по подмножествам Mk.
Наиболее часто используется линейная форма дискриминантной функции, которая представляется в виде скалярного произведения векторов A=(a1,a2,…,ap) дискриминантных множителей и вектора Xi=(xi,1,xi,2,…,xi,p) дискриминантных переменных: EMBED Equation.3 , (6.1)
или EMBED Equation.3 .
Здесь EMBED Equation.3 i - транспонированный вектор дискриминантных переменных xij - значений j -ых признаков у i –го объекта наблюдения.
Дискриминантный анализ проводится в условиях следующих основных предположений:
множество M объектов разбито на два или более (q EMBED Equation.3 2) подмножеств Mk (класса), которые отличаются от других групп переменными xij;
в каждом подмножестве Mk находится, по крайней мере, два объекта (nk EMBED Equation.3 2), причем все объекты наблюдения множества M должны принадлежать какому либо из подмножеств (классов);
число N объектов наблюдения должно превышать число р дискриминантных переменных (0< р< N-2) не менее чем на две единицы;
линейная независимость между признаками (j), т.е. ни один из признаков не должен быть линейной комбинацией других признаков, в противном случае он не несет новой информации;
нормальный закон распределения дискриминантных переменных xij (по признакам).
Если приведенные предположения не удовлетворяются, то ставится вопрос о целесообразности использования дискриминантного анализа для классификации новых наблюдений.
Основными проблемами дискриминантного анализа являются отбор дискриминантных переменных и выбор вида дискриминантной функции. Для получения наилучших различий обучающих подмножеств могут использоваться критерии последовательного отбора переменных [6] или пошаговый дискриминантный анализ. После определения набора дискриминантных переменных решается вопрос о выборе вида дискриминантной функции (линейной или нелинейной).
В качестве дискриминантных переменных могут выступать не только исходные (наблюдаемые) признаки, но и главные компоненты или главные факторы, выделенные в факторном анализе.
Дискриминантный анализ может использоваться и для прогнозирования поведения наблюдаемых единиц статистической совокупности путем сопоставления их с поведением аналогичных объектов обучающих подмножеств.

Алгоритм выполнения дискриминантного анализа
Алгоритм дискриминантного анализа рассмотрен применительно к линейной дискриминантной функции вида (6.1). Рассмотрим основные этапы алгоритма.
Исходные данные представляются либо в табличной форме

*) Здесь nk – объем обучающей выборки в k-ом подмножестве
в виде q подмножеств (обучающих выборок) Mk и подмножества M0 объектов подлежащих дискриминации, либо сразу в виде матриц X(1),X(2),…,X(q) размером (nk ? p):
EMBED Equation.3 ; EMBED Equation.3 ;…
EMBED Equation.3 , EMBED Equation.3 ,
где X(k), - матрицы с обучающими признаками (k=1,2,…,q), X(0) матрица новых m-объектов, подлежащих дискриминации (размером m?p), p- количество свойств, которыми характеризуется каждый i-ый объект. Здесь должно выполняться условие: общее количество объектов N множества M должно быть равно сумме количества объектов m (в подмножестве M0) подлежащих дискриминации и общего количества объектов EMBED Equation.3 в обучающих подмножествах: EMBED Equation.3 , где q- количество обучающих подмножеств (q EMBED Equation.3 2). В реальной практике наиболее часто реализуется случай q=2, поэтому и алгоритм дискриминантного анализа приведен для данного варианта.
2. Определяются EMBED Equation.3 элементы векторов EMBED Equation.3 средних значений по каждому j-му признаку для i объектов внутри k-го подмножества (k=1,2):
EMBED Equation.3 , j=1,2,…,p.
Результаты расчета представляются в виде векторов столбцов EMBED Equation.3 :
EMBED Equation.3 .
3. Для каждого обучающего подмножества рассчитываются ковариационные матрицы EMBED Equation.3 (размером p? p):
EMBED Equation.3
4. Рассчитывается объединенная ковариационная матрица EMBED Equation.3 по формуле: EMBED Equation.3 .
5. Рассчитывается матрица EMBED Equation.3 обратная к объединенной ковариационной матрице EMBED Equation.3 : EMBED Equation.3 ,
где | EMBED Equation.3 | - определитель матрицы EMBED Equation.3 , (причем | EMBED Equation.3 | EMBED Equation.3 ),
EMBED Equation.3 - присоединенная матрица, элементы которой являются алгебраическими дополнениями элементов матрицы EMBED Equation.3 ?.
6. Рассчитывается вектор-столбец EMBED Equation.3 дискриминантных множителей с учетом всех элементов обучающих подмножеств, по формуле: EMBED Equation.3 .
Данная расчетная формула получена с помощью метода наименьших квадратов из условия обеспечения наибольшего различия между дискриминантными функциями. Наилучшее разделение двух обучающих подмножеств обеспечивается сочетанием минимальной внутригрупповой вариации и максимальной межгрупповой вариации.
7. По каждому i-му объекту (i=1,2,…,N) множества M определяется соответствующее значение дискриминантной функции:
EMBED Equation.3 .
8. По совокупности найденных значений EMBED Equation.3 рассчитываются средние значения EMBED Equation.3 для каждого подмножества Mk
EMBED Equation.3 , k=1,2.
9. Определяется общее среднее (константа дискриминации) для дискриминантных функций
EMBED Equation.3 .
10. Выполняется распределение (дискриминация) объектов подмножества M0 подлежащих дискриминации по обучающим выборкам M1 и M2. С этой целью рассчитанные в п.7. по каждому i-му объекту значения дискриминантных функций
EMBED Equation.3 , i=1,2,…,m
сравниваются с величиной EMBED Equation.3 общего среднего. На основе сравнения данный объект относят к одному из обучающих подмножеств.
Если EMBED Equation.3 , то i-ый объект подмножества M0 относят к подмножеству M1 при EMBED Equation.3 и к подмножеству M2 при EMBED Equation.3 . Если же EMBED Equation.3 , то заданный объект относят к подмножеству M1 при EMBED Equation.3 и к подмножеству M2 в противном случае.
11. Далее делается оценка качества распределения новых объектов, для чего
оценивается вклад переменных в дискриминантную функцию.
Влияние признаков на значение дискриминантной функции и результаты классификации, может оцениваться по дискриминантным множителям (коэффициентам дискриминации), по дискриминантным нагрузкам признаков или по дискриминантной матрице.
Дискриминантные множители зависят от масштабов единиц измерения признаков, поэтому они не всегда удобны для оценки. Дискриминантные нагрузки более надежны в оценке признаков, они вычисляются как парные линейные коэффициенты корреляции между рассчитанными уровнями дискриминантной функции F и признаками, взятыми для ее построения.
Дискриминантная матрица характеризует меру соответствия результатов классификации фактическому распределению объектов по подмножествам и используется для оценки качества анализа. В этом случае дискриминантная функция F формируется по данным объектов (с измеренными p признаками) обучающих подмножеств, а затем проверяется качество этой функции путем сопоставления фактической классовой принадлежности объектов с той, что получена в результате формальной дискриминации.
Пример применения дискриминантного анализа при наличии двух обучающих выборок (q=2) *)
Имеются данные по двум группам промышленных предприятий отрасли:
Х1 — среднегодовая стоимость основных производственных фондов, млн. д.ед.;
X2 — среднесписочная численность персонала тыс. чел;
X3 — балансовая прибыль млн. д. ед.
Исходные данные представляются в табличной форме
*) Расчеты данного примера выполнялись в среде EXCEL.
Необходимо провести классификацию (дискриминацию) трех новых предприятий, образующих группу М0 с известными значениями исходных переменных.
Решение
Значения исходных переменных для обучающих подмножеств М1 и М2 (групп предприятий) записываются в виде матриц Х(1) и Х(2):
EMBED Equation.3 ; EMBED Equation.3 ;
и для подмножества М0 группы предприятий подлежащих классификации в виде матрицы X(0):
EMBED Equation.3 .
Общее количество предприятий, составляющих множество M, будет равно N=3+4+5=12 ед.
2. Определяются элементы векторов EMBED Equation.3 средних значений по j признакам для i-х объектов по каждой k-ой выборке (k=1,2), которые представляются в виде двух векторов EMBED Equation.3 (по количеству обучающих выборок):
EMBED Equation.3 , EMBED Equation.3 .
3. Для каждого обучающего подмножества М1 и М2 рассчитываются ковариационные матрицы EMBED Equation.3 (размером pxp):
EMBED Equation.3 ; EMBED Equation.3
4. Рассчитывается объединенная ковариационная матрица EMBED Equation.3
EMBED Equation.3 .
5. Рассчитывается матрица EMBED Equation.3 обратная к объединенной ковариационной матрице: EMBED Equation.3 EMBED Equation.3 .
6. Рассчитываются дискриминантные множители (коэффициенты дискриминантной функции) по всем элементам обучающих подмножеств:
EMBED Equation.3
7. Для каждого i-го объекта k-го подмножества M определяется значение дискриминантной функции:
EMBED Equation.3 = EMBED Equation.3 .224,228+ EMBED Equation.3 . 17,115+( EMBED Equation.3 ).22,981 =55,38211
EMBED Equation.3 = EMBED Equation.3 .151,827+ EMBED Equation.3 . 14,904+( EMBED Equation.3 ). 21,481=43,47791
EMBED Equation.3 = EMBED Equation.3 .147,313+ EMBED Equation.3 . 13,627+( EMBED Equation.3 ). 28,669=39,41138
EMBED Equation.3 = EMBED Equation.3 .152,253+ EMBED Equation.3 . 10,545+( EMBED Equation.3 ). 10,199=36,13924
EMBED Equation.3 = EMBED Equation.3 .46,757+ EMBED Equation.3 . 4,428+( EMBED Equation.3 ). 11,124=12,44351
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
EMBED Equation.3 = EMBED Equation.3 .63,979+ EMBED Equation.3 . 4,211+( EMBED Equation.3 ). 12,860=13,56655
8. По совокупности найденных значений EMBED Equation.3 рассчитываются средние значения EMBED Equation.3 для каждого подмножества Mk:
EMBED Equation.3 43,60266,
EMBED Equation.3 13,10853.
9. Определяется общее среднее (константа дискриминации) для дискриминантных функций
EMBED Equation.3 .
10. Выполняется распределение объектов подмножества M0 по обучающим подмножествам М1 и М2 , для чего по каждому объекту (i=1,2,3) рассчитываются дискриминантные функции
EMBED Equation.3 = EMBED Equation.3 .55,451+ EMBED Equation.3 . 9,592+( EMBED Equation.3 ). 12,840=23,68661
EMBED Equation.3 = EMBED Equation.3 .78,575+ EMBED Equation.3 . 11,727+( EMBED Equation.3 ). 15,535=30,11366
EMBED Equation.3 = EMBED Equation.3 .98,353+ EMBED Equation.3 . 17,572+( EMBED Equation.3 ). 20,458=43,47699
и затем рассчитанные значения дискриминантных функций EMBED Equation.3 сравниваются с общей средней EMBED Equation.3 EMBED Equation.3 .
Поскольку EMBED Equation.3 , то i-ый объект подмножества M0 относят к подмножеству M1 при EMBED Equation.3 и к подмножеству M2 при EMBED Equation.3 . С учетом этого в данном примере предприятия 2 и 3 подмножества М0 относятся к М1, а предприятие 1 к М2.
Если бы выполнялось условие EMBED Equation.3 , то объекты М0 относились к подмножеству M1 при EMBED Equation.3 и к подмножеству M2 в противном случае.
11. Оценку качества распределения новых объектов выполним путем сравнения с константой дискриминации EMBED Equation.3 значений дискриминантных функций EMBED Equation.3 обучающих подмножеств М1 и M2. Поскольку для всех найденных значений выполняются неравенства EMBED Equation.3 > EMBED Equation.3 , и EMBED Equation.3 < EMBED Equation.3 , то можно предположить о правильном распределении объектов в уже существующих двух классах и верно выполненной классификации объектов подмножества M0 .
Литература по теме 6.
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.- М.: ЮНИТИ, 1998. 1022 с.
Глинский В.В., Ионин В.Г. Статистический анализ. Учебное пособие. –М.: Информационно-издательский дом «Филинъ», 1998.- 264 с.
Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы: Учебник.- М.: Финансы и статистика, 1998. –352 с.
Клаичев А.П. Методы и средства анализа данных в среде Windows. STADIA 6.0. –M.: Информатика и компьютеры, 1998. 270 с.
Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шефер М. Многомерный статистический анализ в экономике: Учеб. Пособие для вузов/Под ред. проф. В.Н. Тамашевича.- М.: ЮНИТИ-ДАНА, 1999.-558 с.
Факторный, дискриминантный и кластерный анализ: Пер. с англ./Дж.Щ.Ким, Ч.У. Мьюллер, У.Р. Клекка и др.; Под ред. И.С. Енюкова.-М.: Финансы и статистика, 1989.-215 с.
Задание для выполнения контрольной работы по дисциплине
Задача 1.
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции ( EMBED Equation.3 , млн. руб.) от объема капиталовложений ( EMBED Equation.3 , млн. руб.)
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков EMBED Equation.DSMT4 ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента EMBED Equation.3
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью EMBED Equation.3 - критерия Фишера EMBED Equation.3 , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя EMBED Equation.3 при уровне значимости EMBED Equation.3 , если прогнозное значения фактора Х составит 80% от его максимального значения.
Представить графически: фактические и модельные значения EMBED Equation.3 точки прогноза.
Составить уравнения нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.

Вариант 1
Вариант 2
Вариант 3
Вариант 4
Вариант 5
Вариант 6
Вариант 7
Вариант 8
Вариант 9
Вариант 10




Задача 2.
Задача 2а и 2б. Для каждого варианта даны по две СФМ, которые заданы в виде матриц коэффициентов модели. Необходимо записать системы одновременных уравнений и проверить обе системы на идентифицируемость.
Номер вариантаНомер уравненияЗадача 2аЗадача 2бпеременныепеременныеу1у2у3х1х2х3x4у1у2у3х1х2х3x411-1b12b1300a13a14-1b12b130a12a13020-1b23a21a22a2300-1b23a21a220a2430b32-1a310a33a34b31b32-10a32a33021-10b13a11a12a130-1b120a11a12a1302b21-1b2300a23a240-1b23a210a23a2430b32-1a310a33a340b32-1a310a33a3431-10b13a11a120a14-1b12b13a1100a142b21-10a21a220a24b21-100a22a23a243b31b32-100a33a34b31b32-1a3100a3441-1b12b130a120a14-10b13a11a12a1302b21-10a210a23a240-1b23a21a220a243b31b32-1a31a3200b310-1a31a32a33051-10b13a110a13a14-10b13a11a12a1302b21-1b230a220a24b21-1b2300a23a243b310-10a32a33a34b310-1a31a32a33061-1b12b13a11a1200-10b13a11a120a142b21-1b23a2100a24b21-10a210a23a2430b32-1a31a32a330b310-1a31a320a3471-10b130a12a13a14-1b12b130a120a142b21-1b230a22a230b21-10a210a23a2430b32-1a31a32a330b31b32-10a320a3481-1b12b130a12a130-10b13a110a13a1420-1b23a21a220a24b21-1b230a220a2430b32-1a31a32a330b310-1a310a33a3491-1b120a11a12a130-1b12b13a11a120020-1b23a210a23a24b21-1b2300a23a2430b32-1a31a32a330b31b32-100a33a34101-1b12b13a1100a14-10b130a12a13a142b23-100a22a23a24b21-1b23a210a23030b32-10a32a33a34b310-10a32a33a34
Задача 2в
По данным таблицы для своего варианта, используя косвенный метод наименьших квадратов, построить структурную форму модели вида
y1= a01 + b12 y2 + a11 x1 + ?1
y2= a02 + b21 y1 + a22 x2 + ?2
.

Задания для выполнения аудиторной работы
Пояснения к задачам по аудиторной работе.
Условия задач к вариантам 1 - 6 взяты из «Практикума по эконометрике» под ред. Елисеевой И.И. (стр. 91-94.)
Числовые данные в формате EXCEL будут переданы преподавателям в электронном виде.
Числовые данные в формате EXCEL для студентов будут размещены на сетевом диске.
Перед выполнением аудиторной работы преподаватель указывает студенту номер варианта и количество наблюдений, используемых для расчетов.

Вариант 1.
Имеются данные о деятельности крупнейших компаний США в 1996 г. (табл. 1).
Таблица 1
…………………………………………………………………..
Задание
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов.
Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения проверьте с помощью F-критерия; оцените качество уравнения регрессии с помощью коэффициента детерминации EMBED Equation.DSMT4 .
Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, EMBED Equation.DSMT4 и EMBED Equation.DSMT4 коэффициентов.
Оцените точность уравнения через среднюю относительную ошибку аппроксимации.
Отберите информативные факторы в модель по t-критерию для коэффициентов регрессии. Постройте модель только с информативными факторами и оцените ее параметры.
Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (а = 0,05; а = 0,10).
Вариант 2.
В табл. 2 представлены данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 1996 г.).
Таблица 2.
………………………………………………………………………………………..
Принятые в таблице обозначения:
Y - цена квартиры, тыс. долл.;
X1 - число комнат в квартире;
X2 - район города (1 - Приморский, Шувалове - Озерки, 2 - Гражданка, 3 – Юго -запад, 4 - Красносельский);
X3 - общая площадь квартиры (м2);
X4- жилая площадь квартиры (м2);
X5 - площадь кухни (м2);
Х6 - тип дома (1 - кирпичный, 0 - другой);
X7 - наличие балкона (1 - есть, 0 - нет);
X8 - число месяцев до окончания срока строительства.
Задание
Введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово - Озерки, Гражданка) и на юге города (Юго-запад, Красносельский район).
Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z.
Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме. Установите, какие факторы мультиколлинеарны.
Постройте модель у = f(х3, х6, х7, х8, z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?
Существует ли разница в ценах квартир, расположенных в северной и южной частях Санкт-Петербурга?
Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения проверьте с помощью F-критерия; оцените качество уравнения регрессии с помощью коэффициента детерминации EMBED Equation.DSMT4 .


Вариант 3
По данным, представленным в табл. 3, изучается зависимость
индекса человеческого развития  Специальный индекс человеческого развития, который объединяет три показателя (валовой внутренний продукт на душу населения, грамотность и продолжительность предстоящей жизни) и дает обобщенную оценку человеческого прогресса. Впервые данный показатель был предложен в 1990 г. группой исследователей Программы развития ООН.
_у от переменных:
x1 - ВВП 1997 г., % к 1990 г.;
х2 - расходы на конечное потребление в текущих ценах, % к ВВП;
x3 - расходы домашних хозяйств, % к ВВП;
х4 - валовое накопление, % к ВВП;
х5 - суточная калорийность питания населения, ккал на душу населения;
х6- ожидаемая продолжительность жизни при рождении 1997 г. число лет.
Таблица 3.
…………………………………………………………………

Задание
Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны.
Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.
Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.
Отберите информативные факторы по пп.1 и 3. Постройте уравнение регрессии со статистически значимыми факторами.
Проверьте выполнение предпосылок МНК, в том числе, проведите тестирование ошибок уравнения множественной регрессии на гетероскедастичность,



Вариант 4.
Имеются данные по странам за 1997 г. (табл. 4).
Таблица 4.
………………………………………………………………………………………
Задание
Постройте матрицу парных коэффициентов корреляции.
Постройте парные уравнения регрессии, отобразите результаты моделирования на графиках.
Оцените статистическую значимость уравнений и их параметров с помощью критериев Фишера и Стьюдента.
Постройте уравнение множественной регрессии.
Постройте график остатков.
Проверьте выполнение предпосылок МНК, в том числе, проведите тестирование ошибок уравнения множественной регрессии на гетероскедастичность.
Оцените статистическую значимость уравнения множественной регрессии. Определите, какое уравнение лучше использовать для прогноза индекса человеческого развития:
• парную регрессию у на х1;
• парную регрессию у на х2
• множественную регрессию.
Вариант 5.
Изучается зависимость средней ожидаемой продолжительности жизни от нескольких факторов по данным за 1995 г., представленным в табл. 5.
Таблица 5.
………………………………………………………………
Принятые в таблице обозначения:
Y - средняя ожидаемая продолжительность жизни при рождении, лет;
X1 - ВВП в паритетах покупательной способности;
X2- цепные темпы прироста населения, %;
X3- - цепные темпы прироста рабочей силы, %;
Х4 - коэффициент младенческой смертности, %..
Задание
Постройте матрицу парных коэффициентов корреляции, оцените статистическую значимость коэффициентов корреляции. Установите, какие факторы коллинеарны.
Постройте уравнение множественной регрессии, обосновав отбор факторов.
Постройте график остатков.
Проверьте выполнение предпосылок МНК.
Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней ожидаемой продолжительности жизни в этом уравнении?
Постройте уравнение множественной регрессии только со статистическизначимыми факторами.
Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (а = 0,05; а = 0,10).

Вариант 6.
Имеются данные о продаже квартир на вторичном рынке жилья в Санкт-Петербурге на 01.05.2000 г. (табл. 6).
Таблица 6.
………………………………………………………………………
Принятые в таблице обозначения:
Y - цена квартиры, тыс. долл.;
X1 - число комнат в квартире;
X2 - район города (1 - центральные, 0 - периферийные);
X3 - общая площадь квартиры (м2);
X4 - жилая площадь квартиры (м2);
X5 - площадь кухни (м2);
X6 - тип дома (1 - кирпичный, 0 - другой);
X7 - расстояние от метро, минут пешком.
По этим данным необходимо определить факторы, формировавшие цену квартир на вторичном рынке жилья в Санкт-Петербурге весной 2000 г.
Задание
1.Составьте матрицу парных коэффициентов корреляции.
Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов. Установите, какие факторы коллинеарны.
Оцените значимость полученного уравнения. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?
Значима ли разница в ценах квартир, расположенных в центральных и в периферийных районах Санкт-Петербурга?
Значима ли разница в ценах квартир разных типов домов?
Постройте модель формирования цены квартиры за счет значимых факторов.
Оцените качество построенной модели.
Приложения
Приложение 1. Значения F-критерия Фишера при уровне значимости ?=0,05.

Приложение 2. Значения t-критерия Стьюдента при уровне значимости 0,10; 0,05; 0,01 (двухсторонний)

Приложение 3. Критические границы отношения R/S

Приложение 4. d-статистика Дарбина - Уотсона: d1 и d2, уровень значимости в 5%

Литература
Основная
Экономико – математические методы и прикладные модели: Учебн. пособие для вузов / В.В.Федосеев, А.Н. Гармаш, Д.М. Дайтбегов, И.В. Орлова, .А.Половников.- М.:ЮНИТИ, 1999.- 391 с.
Орлова И.В. Экономико-математические методы и модели. Выполнение расчетов в среде ЕХСЕL / Практикум: Учебное пособие для вузов. - М.:ЗАО Финстатинформ, 2000.-136 с.
Эконометрика: Учебник/Под ред. И.И. Елисеевой – М.: Финансы и статистика, 2001.
Практикум по эконометрике: Учеб. пособие/Под ред. И.И.Елисеевой – М.: Финансы и статистика, 2001.
Дополнительная
Магнус Я. Р., Катышев П.К., Персецкий А.А. Эконометрика. Начальный курс: Учебник 6-е изд. – М.: Дело, 2004. –576 с.
Доугерти К. Введение в эконометрику. –М.: ИНФРА-М, 1997.
Джонстон Дж. Эконометрические методы. – М.: Статистика, 1980. – 444 с.
Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. – М.: Статистика, 1974.
Тихомиров Н.П., Дорохина Е.Ю. Эконометрика: Учебник – М.: Издательство «Экзамен», 2003. – 512с.
Полезные ссылки на интернет - ресурсы
HYPERLINK http://www.nsu.ru/ef/tsy/ecmr/study.htm http://www.nsu.ru/ef/tsy/ecmr/study.htm
УЧЕБНЫЕ МАТЕРИАЛЫ ПО ЭКОНОМЕТРИКЕ И СТАТИСТИКЕ
HYPERLINK http://www.nsu.ru/ef/tsy/ecmr/index.htm http://www.nsu.ru/ef/tsy/ecmr/index.htm
Эконометрическая страничка
Учебные материалы по эконометрике (методички, лекции, программы). Ссылки на материалы аналогичной тематики. HYPERLINK http://www.nsu.ru/ef/tsy/ecmr/soft.htm http://www.nsu.ru/ef/tsy/ecmr/soft.htm
КОМПЬЮТЕРНЫЕ ПРОГРАММЫ
(статистика и эконометрика)
HYPERLINK "http://www.iet.ru/archiv/zip/nosko.zip"http://www.iet.ru/archiv/zip/nosko.zip
В.П. Носко «Эконометрика для начинающих. Основные понятия, элементарные методы, границы применимости, интерпретация результатов» Москва, ИЭПП, 2000.
HYPERLINK http://www.statsoft.ru/home/textbook/ http://www.statsoft.ru/home/textbook/
HYPERLINK "http://www.list.ru/cgi-bin/site_jump.asp?site_id=101910&url=http://www.statsoft.ru/home/textbook/"Электронный учебник по статистике. StatSoft Учебник помогает понять основные понятия статистики и более полно представить диапазон применения статистических методов.
HYPERLINK http://jenpc.nstu.nsk.su/uchebnik2/sod-nav.htm http://jenpc.nstu.nsk.su/uchebnik2/sod-nav.htm
учебник по Математической статистике
HYPERLINK http://infoscope.forth.ru/Statistics/trends/ARIMA/ModellingRules/index.html http://infoscope.forth.ru/Statistics/trends/ARIMA/ModellingRules/index.html
Правила построения АРПСС-моделей
HYPERLINK http://molchanov.narod.ru/econometrics.html http://molchanov.narod.ru/econometrics.html
HYPERLINK http://molchanov.narod.ru/ucheb_posob/econometr_pract_2000.html http://molchanov.narod.ru/ucheb_posob/econometr_pract_2000.html
Ссылки по использованию программы Eviews
HYPERLINK "http://www.vzfei.nm.ru/" http://www.vzfei.nm.ru/
Неофициальный сайт ВЗФЭИ