Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LR5-Dvumernye_dannye (1).doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
363.01 Кб
Скачать

Лабораторная работа №5 Двумерные данные

Наборы двумерных данных содержат информацию о двух признаках (переменных) для каждого из объектов. В дополнение к изучению обобщающих характеристик каждой из этих двух переменных, рассматриваемых как отдельные наборы одномерных данных, статистические методы анализа двумерных данных используются для изучения связи между этими двумя переменными. При таком анализе необходимо выяснить следующие вопросы.

  • Существует ли между этими двумя переменными простая связь?

  • Насколько сильно взаимосвязаны переменные?

  • Можно ли предсказать значение одной переменной на основании другой? Если да, то с какой степенью надежности?

  • Существуют ли отдельные объекты или группа объектов, которые требуют особого внимания?

Приведем пример. Цена одной акции (первая переменная) регистрировалась каждый день (вторая переменная) в течение последних шести месяцев. Если установить связь между ценой и временем (датой), то можно увидеть тенденции в изменении стоимости инвестиций. Однако на основании таких данных трудно предсказать будущую стоимость инвестиций. Для этого требуется выяснить, является ли изменение стоимости непредсказуемым (случайным) явлением или существует некоторая реальная закономерность.

При изучении зависимости между двумя переменными рекомендуется в качестве первоначальной цели провести визуальное исследование, а затем вычислить общие характеристики: корреляцию и ковариацию.

Исследование взаимосвязи переменных с помощью диаграмм рассеяния

Для визуального анализа зависимости между двумя переменными используются графики рассеяния. В Excel данный вид графиков называется точечной диаграммой или диаграммой рассеяния. Диаграмма рассеяния позволяет увидеть структуру двумерных данных. Если ваши данные содержат какие-то проблемы (например, выбросы), чаще всего единственный способ их обнаружения состоит как раз в анализе диаграммы рассеяния.

При построении диаграмм рассеяния одна переменная (обозначается буквой Y) рассматривается как зависимая переменная, другая переменная (обозначается буквой X) является независимой переменной, оказывающей влияние на переменную Y. На диаграмме рассеяния переменой X соответствует горизонтальная ось, а переменной Y – вертикальная ось.

Задание 1.

Исследовать визуально зависимость между размером жилой площади и ценой объекта.

В таблице 1 приведены данные, которые представляют 15 объектов недвижимости, проданных в определенном районе города в течение одного календарного года.

Таблица 1. Объекты недвижимости

Объект

Площадь

Цена

Объект

Площадь

Цена

1

521

26,0

9

965

37,2

2

661

31,0

10

1011

38,4

3

694

37,4

11

1047

43,6

4

743

34,8

12

1060

44,8

5

787

39,2

13

1079

40,6

6

825

38,0

14

1164

41,8

7

883

39,6

15

1298

45,2

8

920

31,2

В данной задаче естественно ожидать, что цена зависит от жилой площади объекта. Введем обозначения: X – независимая переменная, определяющая размер жилой площади (в квадратных метрах); Y – зависимая переменная, определяющая цену продажи жилого объекта (в тысячах долларов).

  1. Откройте программу Excel. Щелкните на кнопке Сохранить на панели инструментов Стандартная. В появившемся диалоговом окне откройте папку Статистика и задайте имя файлу Двумерные данные.xls.

  2. На Листе1 расположите данные в столбцах таким образом, чтобы значения X были слева, а значения Y – справа. Для этого в ячейку A1 введите метку Площадь, в ячейку B1 введите метку Цена, а в диапазон A2:B16 введите соответствующие данные из Таблицы 1.

  3. Выделите диапазон данных A2:B16 и откройте мастер диаграмм.

  4. На шаге 1 выберите тип диаграммы Точечная диаграмма позволяет сравнить пары значений. Щелкните на кнопке Далее>.

  5. На шаге 2 на вкладке Диапазон данных убедитесь, что выбран диапазон A2:B16 и включена опция Ряды в: столбцах. На вкладке Ряд проверьте, что ячейки A2:A16 используются как значения для X, а ячейки B2:B16 как значения для Y. Щелкните на кнопке Далее>.

  6. На шаге 3 на вкладке Заголовки в текстовом поле Название диаграммы: введите Объекты недвижимости, в текстовом поле Ось X (категорий): введите Жилая площадь, в квадратных метрах, в текстовом поле Ось Y (значений): введите Цена продажи, в тысячах долларов. На вкладке Линии сетки уберите все отметки. На вкладке Легенда снимите флажок Добавить легенду. Щелкните на кнопке Далее>.

  7. На шаге 4 убедитесь, что диаграмма будет расположена на имеющемся: листе. Щелкните на кнопке Готово. Расположите диаграмму в диапазоне D1:J16.

  8. Для лучшей наглядности отформатируем диаграмму. Измените ось X, чтобы она отображала значения от 400 до 1400. Щелкните правой кнопкой на Оси X (категорий): и в контекстном меню выберите команду Формат оси… На вкладке Шкала в области Авто снимите флажок с опции минимальное значение: и в текстовом поле введите 400, снимите флажок с опции максимальное значение: и в текстовом поле введите 1400, снимите флажок с опции цена основных делений: и в текстовом поле введите 200. Щелкните на кнопке ОК.

  9. Измените ось Y, чтобы она отображала значения от 20 до 50 тысяч долларов. Щелкните правой кнопкой на Оси Y (значений): и в контекстном меню выберите команду Формат оси… На вкладке Шкала в области Авто снимите флажок с опции минимальное значение: и в текстовом поле введите 20, снимите флажок с опции максимальное значение: и в текстовом поле введите 50, снимите флажок с опции цена основных делений: и в текстовом поле введите 10. Щелкните на кнопке ОК.

  10. Щелкните по названию диаграммы и установите размер шрифта 12. Поочередно щелкните на значениях и заголовках осей (горизонтальной и вертикальной) и установите размер шрифта 10. Дважды щелкните на серой области диаграммы и в диалоговом окне Формат области построения в области Рамка выберите опцию невидимая, а в области Заливка выберите опцию прозрачная. Щелкните на кнопке ОК.

  11. Анализ полученной диаграммы показывает определенную зависимость между переменными, а именно: в среднем, чем больше жилая площадь, тем выше отпускная цена.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]