
- •Ход исследования.
- •Модель 1: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price__rub_
- •Исключено пропущенных или неполных наблюдений: 68 Зависимая переменная: l_Price__rub_
- •Исключено пропущенных или неполных наблюдений: 78 Зависимая переменная: l_Price__rub_
- •Модель 2: мнк, использованы наблюдения 1-222 Зависимая переменная: sq_e
- •Модель 3: мнк, использованы наблюдения 1-222 Зависимая переменная: sq_e
- •Модель 3: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price_new
- •Модель 4: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price_new
- •Модель 5: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price_new
- •Заключение.
- •Вклад участников во время выполнения проекта.
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ИМ. М.В. ЛОМОНОСОВА
КАФЕДРА ММАЭ
ПРОЕКТ ПО КУРСУ «ЭКОНОМЕТРИКА-1»
ПО ТЕМЕ: «Анализ факторов, влияющих на формирование цен на российском автомобильном рынке»
Проект выполнила команда в составе:
Гренкова Анастасия, э311
Калиничева Надежда, э311
Фатихова Аделя, э311
Пяк Хе Су, э302
Руководитель проекта:
Калиничева Надежда, э311
Москва
2012
Цель и актуальность исследования.
Формирование цен является одной из наиболее широких, но нетривиальных сфер исследования, которая сосредотачивает в себе различные подходы: начиная от прямого маркетинга, заканчивая математическим моделированием. Мы не будем погружаться в просторы комплекса маркетинга, однако, математическим путем попробуем выявить те факторы, которые наиболее четко отражают взаимосвязь в формировании цен.
Спектром исследования этого проекта является отечественный рынок иномарок – выбор сделан не случайно: на сегодняшний день модельный ряд различных автомобилей настолько разнообразен, что, казалось бы, способен удовлетворить любому спросу. Тем не менее, для нас представилось интересным провести исследование с целью выявления прямых зависимых переменных, отвечающих за итоговое формирование цены; а так же внести предположения о нетривиальных переменных и попробовать доказать выдвигаемые гипотезы. В частности, были рассмотрены такие факторы как безопасность при вождении согласно рейтингу EURO NCAP, а так же степень экологической безопасности (в основу брались выбросы СО2).
Мы проанализировали данные по моделям наиболее популярных иномарок, имеющих официального дилера в России. Все данные взяты с официальных сайтов компаний и нескольких дополнительных ресурсов (см. в примечании). При этом, в целях сохранения объективности исследования, данные о ценах взяты только с официальных сайтов.
Цель проекта – определить важнейшие факторы ценообразования на рынке иномарок в России. Поэтому в качестве зависимой переменной выбрана цена автомобиля.
В ходе исследования были протестированы следующие гипотезы:
В основном на цену автомобиля влияют его технические показатели, такие как объем двигателя, количество лошадиных сил, скорость разгона и т. д.;
На цены автомобиля значительное влияние оказывает страна производителя и марка;
Показатели безопасности и экологичности машин не оказывают влияния на ее стоимость.
Важно отметить, что в целях объективности данных была принята следующая предпосылка:
Цена и все параметры были взяты минимальные для каждой из моделей машин, то есть из самой низкой комплектации. 2 варианта одной и той же модели машины были приняты как отдельные наблюдения только в случае разных коробок передач или разных типов кузова, представленных для взятой модели при прочих равных. Учитываются только комплектации с бензиновым двигателем.
В качестве факторов, влияющих на формирование цен на автомобили (независимых переменных) выбраны следующие переменные:
- Объем двигателя (л);
- Мощность (л. с.);
- Максимальная скорость (км/ч);
- Разгон до 100 км/ч (сек);
- Расход бензина (л/100 км);
- Выбросы CO2 (г/км).
Примечание: данные по этому показателю были использованы с различных сайтов, в том числе и с сайта http://www.nextgreencar.com, на котором опубликованы официальные данные по экологичности многих моделей машин. К сожалению, данные о данном показатели опубликованы не для всех моделей, поэтому мы были вынуждены анализировать значимость этого показателя только на основе сокращенной выборки.
- Рейтинг Euro NCAP (*);
Примечание: Рейтинг Euro NCAP – это рейтинг европейского комитета по проведению независимых краш-тестов авто с оценкой активной безопасности и пассивной безопасности. В соответствии с действующей рейтинговой системой каждой модели присваивается суммарный пятизвёздочный рейтинг безопасности автомобиля. Результаты рейтингов опубликованы на официальном сайте http://www.euroncap.com. К сожалению, на данный момент рейтинг присвоен не всем рассмотренным моделям, поэтому мы были вынуждены анализировать значимость этого показателя только на основе сокращенной выборки.
Также был введен ряд фиктивных переменных:
- Тип коробки передач (механика/автомат);
- Страны производителя (количество переменных соответствует количеству стран);
- Марки машин (количество переменных соответствует количеству марок).
Ход исследования.
В процессе работы над моделью мы рассмотрели ряд спецификаций: линейную, несколько вариаций логарифмически-линейной и линейно-логарифмической, чисто логарифмическую.
Следует отметить, что изначально в качестве независимых переменных были использованы следующие показатели: константа, объем двигателя, кол-во лошадиных сил, максимальная скорость, разгон до 100 км/ч и потребление топлива, а также фиктивные переменные, обозначающие тип коробки передач и страну производителя. В процессе усовершенствования модели были исключены переменные:
- количество лошадиных сил - в виду возникновения проблемы мультиколлинеарности;
- потребление топлива и ряд фиктивных переменных, обозначающих страну производителя – в виду незначимости переменных.
В конечном итоге, наилучшей моделью оказалась следующая:
Модель 1: мнк, использованы наблюдения 1-222 Зависимая переменная: l_Price__rub_
|
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|
const |
9,79135 |
0,989214 |
9,8981 |
<0,00001 |
*** |
l_Vehicle__l_ |
1,20995 |
0,0672532 |
17,9909 |
<0,00001 |
*** |
l_Max_speed__ |
0,747687 |
0,161437 |
4,6315 |
<0,00001 |
*** |
Mechanical_tran |
-0,0754905 |
0,0388567 |
-1,9428 |
0,05336 |
* |
l_Acceleratio |
-0,292666 |
0,0991637 |
-2,9513 |
0,00352 |
*** |
Italy |
0,379793 |
0,0708162 |
5,3631 |
<0,00001 |
*** |
China |
-0,362298 |
0,0786428 |
-4,6069 |
<0,00001 |
*** |
Germany |
0,306031 |
0,0495176 |
6,1802 |
<0,00001 |
*** |
UK |
0,678165 |
0,102086 |
6,6431 |
<0,00001 |
*** |
Среднее зав. перемен |
14,01053 |
|
Ст. откл. зав. перемен |
0,897124 |
Сумма кв. остатков |
12,51804 |
|
Ст. ошибка модели |
0,242425 |
R-квадрат |
0,929622 |
|
Испр. R-квадрат |
0,926978 |
F(8, 213) |
351,6874 |
|
Р-значение (F) |
3,1e-118 |
Лог. правдоподобие |
4,176912 |
|
Крит. Акаике |
9,646175 |
Крит. Шварца |
40,27027 |
|
Крит. Хеннана-Куинна |
22,01028 |
Модель достаточно высокого качества, поскольку:
Все переменные значимы, причем, за исключением переменной «тип коробки передач», на самом высоком (10%) уровне значимости;
Коэффициенты при переменных соответствуют реальным представлениям о модели: так, например, с ростом объема двигателя или максимальной скорости машины ее стоимость растет, а вот отсутствие автоматической коробки передач, наоборот, снижает стоимость автомобиля;
В модели отсутствует мультиколлинеарность (ниже приведен результат соответствующего теста);
Метод инфляционных факторов
Минимальное возможное значение = 1.0
Значения > 10.0 могут указывать на наличие мультиколлинеарности
l_Vehicle__l_ 3,373
l_Max_speed__ 3,836
Mechanical_tran 1,423
l_Acceleratio 4,853
Italy 1,340
China 1,100
Germany 1,368
UK 1,202
VIF(j) = 1/(1 - R(j)^2), где R(j) - это коэффициент множественной корреляции между переменной и другими независимыми переменными
Свойства матрицы X'X:
1-я норма = 11930,069
Детерминант = 2,1554691e+011
Обратное условное число = 3,9989488e-006
Высокий показатель коэффициента детерминации: R-квадрат=0,929622, при этом значение исправленного R-квадрат также высоко;
Тест Рамсея подтверждает правильность спецификации модели (ниже приведен результат соответствующего теста).
Вспомогательная регрессия для теста Рамсея
МНК, использованы наблюдения 1-222
Зависимая переменная: l_Price__RUB_
Коэффициент Ст. ошибка t-статистика P-значение
const 11,3070 1,48005 7,640 7,50e-013 ***
l_Vehicle__l_ 1,22105 0,0678878 17,99 1,82e-044 ***
l_Max_speed__ 0,767089 0,163348 4,696 4,77e-06 ***
Mechanical_tran -0,0742413 0,0389390 -1,907 0,0579 *
l_Acceleratio -0,270701 0,100723 -2,688 0,0078 ***
Italy 0,386407 0,0713992 5,412 1,69e-07 ***
China -0,352931 0,0789713 -4,469 1,28e-05 ***
Germany 0,309043 0,0499188 6,191 3,08e-09 ***
UK 0,685038 0,102624 6,675 2,14e-010 ***
yhat^2 -0,0242906 0,0176517 -1,376 0,1702
yhat^3 0,00111692 0,000811092 1,377 0,1700
Тестовая статистика: F = 0,948145,
р-значение = P(F(2,211) > 0,948145) = 0,389
Заметим, что при независимой переменной China отрицательное значение коэффициента, что, казалось бы, невозможно, учитывая, что этот показатель отвечает за страну-производителя. Однако здесь этот феномен объясняется следующим образом: в Китае весьма специфический внутренний рынок автомобилей. Китай, будучи наиболее населенной страной во всем мире, имеет ряд соглашений с именитыми странами-производителями автомобилей, особенно это касается Германии, Италии, Великобритании, Франции. Эти соглашения позволяют Китаю производить марки «европейцев» внутри Китая, сохраняя одновременно и первоначальное обозначение, и китайскую адаптацию. Таким образом, часть дохода европейских стран перекрывается посредством отчисления от Китая, в обмен на право производить «отечественные» иномарки.
Однако, несмотря на весьма высокие качественные показатели модели, она все же, обременена некоторыми недостатками:
Главным недостатком модели является наличие гетероскедастичности. Она подтверждается двумя проведенными нами тестами (тестом Вайта и тестом Бреуша-Пагана)
Тест Вайта (White) на гетероскедастичность -
Нулевая гипотеза: гетероскедастичность отсутствует
Тестовая статистика: LM = 90,7164
р-значение = P(Хи-квадрат (24) > 90,7164) = 1,09675e-009
Тест Бриша-Пэгана (Breusch-Pagan) на гетероскедастичность -
Нулевая гипотеза: гетероскедастичность отсутствует
Тестовая статистика: LM = 44,0859
р-значение = P(Хи-квадрат (7) > 44,0859) = 2,05675e-007
Результаты тестов также подтвердились видом графика остатков регрессии: как видно на рисунке ниже, наш вариант хоть и не самый наглядный пример проявления гетероскедастичности, но все же подтверждает ее наличие.
Проведение теста Чоу (результаты приведены ниже) показал наличие структурного сдвига в модели
Расширенная регрессия для теста Чоу
МНК, использованы наблюдения 1-222
Зависимая переменная: l_Price__RUB_
Коэффициент Ст. ошибка t-статистика P-значение
l_Vehicle__l_ 1,11238 0,0962127 11,56 3,74e-024 ***
l_Max_speed__ 2,49520 0,0576610 43,27 2,32e-105 ***
l_Acceleratio 0,0909886 0,101608 0,8955 0,3716
Mechanical_tran -0,163216 0,0619425 -2,635 0,0091 ***
Italy 0,169533 0,114456 1,481 0,1401
China -0,306573 0,0849109 -3,611 0,0004 ***
Germany 0,341735 0,123955 2,757 0,0064 ***
Коэффициент Ст. ошибка t-статистика P-значение
UK 0,717525 0,164202 4,370 1,97e-05 ***
splitdum 4,55809 3,13579 1,454 0,1476
sd_l_Vehicle__l -0,0546448 0,146136 -0,3739 0,7088
sd_l_Max_speed_ -0,851633 0,502040 -1,696 0,0913 *
sd_l_Accelerati -0,168508 0,276564 -0,6093 0,5430
sd_Mechanical_t 0,114207 0,0835176 1,367 0,1730
sd_Italy 0,207618 0,154088 1,347 0,1793
sd_Germany -0,0361429 0,139068 -0,2599 0,7952
sd_UK -0,0903125 0,219580 -0,4113 0,6813
Среднее зав. перемен 14,01053 Ст. откл. зав. перемен 0,897124
Сумма кв. остатков 13,48741 Ст. ошибка модели 0,255877
R-квадрат 0,999692 Испр. R-квадрат 0,999669
F(16, 206) 41755,68 Р-значение (F) 0,000000
Лог. правдоподобие -4,102180 Крит. Акаике 40,20436
Крит. Шварца 94,64720 Крит. Хеннана-Куинна 62,18499
Тест Чоу для структурных изменений в точке 111
F(8, 206) = 9,14211 р-значение 0,0000
P-значение для уравнения в целом крайне мало, что говорит о том, что уравнение в целом незначимо. Часто подобный результат (значимость всех переменных при незначимости уравнения в целом) свидетельствует о том, что в модели наблюдается мультиколлинеарность, однако, как было доказано выше, мультиколлинеарность отсутсвует.
Теперь обратимся к проверке наших гипотез о возможности влияния экологической безопасности и безопасности согласно Euro NCAP на итоговое формирование цены:
Мы рассмотрели две модели: зависящая от выхлопов СО2 и зависящую от места в рейтинге EuroNCAP. Модели были рассмотрены отдельно и независимо друг от друга ввиду того, что не для всех моделей машин информация по данным разделам лежит в общем доступе.
Ниже приведена модель, в которую включена переменная выхлоп СО2.
Как показали проведенные тесты, выхлопы СО2 являются значимой переменной и в данной модели отсутствует мультиколлинеарность.
Модель 15: МНК, использованы наблюдения 1-222 (n = 154)