Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР5-2007Двумерные данные.doc
Скачиваний:
3
Добавлен:
18.07.2019
Размер:
377.86 Кб
Скачать

Лабораторная работа №5 Двумерные данные

Наборы двумерных данных содержат информацию о двух признаках (переменных) для каждого из объектов. Помимо исследования общих характеристик переменных статистические методы анализа используются для изучения связи между этими двумя переменными. При таком анализе необходимо выяснить следующие вопросы.

  • Существует ли между этими двумя переменными простая связь?

  • Насколько сильно взаимосвязаны переменные?

  • Можно ли предсказать значение одной переменной на основании другой? Если да, то с какой степенью надежности?

  • Существуют ли отдельные объекты или группа объектов, которые требуют особого внимания?

Пример. Цена одной акции (первая переменная) регистрировалась каждый день (вторая переменная) в течение последних шести месяцев. Если установить связь между ценой и временем (датой), то можно увидеть тенденции в изменении стоимости инвестиций. Однако на основании таких данных трудно предсказать будущую стоимость инвестиций. Для этого требуется выяснить, является ли изменение стоимости непредсказуемым (случайным) явлением или существует некоторая реальная закономерность.

При изучении зависимости между двумя переменными рекомендуется в качестве первоначальной цели провести визуальное исследование, а затем вычислить общие характеристики: корреляцию и ковариацию.

Исследование взаимосвязи переменных с помощью диаграмм рассеяния

Для визуального анализа зависимости между двумя переменными используются графики рассеяния. В Excel данный вид графиков называется точечной диаграммой или диаграммой рассеяния. Диаграмма рассеяния позволяет увидеть структуру двумерных данных. Если ваши данные содержат какие-то проблемы (например, выбросы), чаще всего единственный способ их обнаружения состоит как раз в анализе диаграммы рассеяния.

При построении диаграмм рассеяния одна переменная (обозначается буквой Y) рассматривается как зависимая переменная, другая переменная (обозначается буквой X) является независимой переменной, оказывающей влияние на переменную Y. На диаграмме рассеяния переменой X соответствует горизонтальная ось, а переменной Y – вертикальная ось.

Задание 1.

Исследовать визуально зависимость между размером жилой площади и ценой объекта.

В таблице 1 приведены данные, которые представляют 15 объектов недвижимости, проданных в определенном районе города в течение одного календарного года.

Таблица 1. Объекты недвижимости

Объект

Площадь

Цена

Объект

Площадь

Цена

1

521

26,0

9

965

37,2

2

661

31,0

10

1011

38,4

3

694

37,4

11

1047

43,6

4

743

34,8

12

1060

44,8

5

787

39,2

13

1079

40,6

6

825

38,0

14

1164

41,8

7

883

39,6

15

1298

45,2

8

920

31,2

В данной задаче естественно ожидать, что цена зависит от жилой площади объекта. Введем обозначения: X – независимая переменная, определяющая размер жилой площади (в квадратных метрах); Y – зависимая переменная, определяющая цену продажи жилого объекта (в тысячах долларов).

  1. Откройте программу Excel. Щелкните на кнопке Сохранить на Панели быстрого доступа. В появившемся диалоговом окне откройте папку Статистика ххх и задайте имя файлу Двумерные данные.xlsх. Зашифруйте файл, задав пароль.

  2. На Листе1 расположите данные в столбцах таким образом, чтобы значения X были слева, а значения Yсправа. Для этого в ячейку A1 введите метку Площадь, в ячейку B1 введите метку Цена, а в диапазон A2:B16 введите соответствующие данные из Таблицы 1.

  3. Выделите диапазон данных A1:B16, откройте на ленте вкладку Вставка и выберите тип диаграммы Точечная с маркерами.

  4. Выделите название диаграммы, щелкните в строке формул и введите новое название Объекты недвижимости. Нажмите клавишу [Enter].

  5. На дополнительной вкладке Работа с диаграммами откройте вкладку Макет, в группе Подписи щелкните на стрелке кнопки Названия осей и выберите команду:

Название основной горизонтальной осиНазвание под осью.

  1. В строке формул введите название горизонтальной оси (ось Х)

Жилая площадь, в квадратных метрах. Нажмите клавишу [Enter].

  1. На дополнительной вкладке Работа с диаграммами откройте вкладку Макет, в группе Подписи щелкните на стрелке кнопки Названия осей и выберите команду:

Название основной вертикальной осиПовернутое название.

  1. В строке формул введите название вертикальной оси (ось Y)

Цена продажи, в тысячах долларов. Нажмите клавишу [Enter].

  1. Для лучшей наглядности отформатируем диаграмму. Измените ось X, чтобы она отображала значения от 400 до 1400. Щелкните правой кнопкой на Горизонтальной оси (значений): и в контекстном меню выберите команду Формат оси… В диалоговом окне на вкладке Параметры оси параметр минимальное значение: установите в положение фиксированное и в текстовом поле введите значение 400. Параметр максимальное значение: установите в положение фиксированное и в текстовом поле введите значение 1400. Параметр цена основных делений: установите в положение фиксированное и в текстовом поле введите значение 200. Щелкните на кнопке Закрыть.

  2. Измените ось Y, чтобы она отображала значения от 20 до 50 тысяч долларов. Щелкните правой кнопкой на Вертикальной оси (значений): и в контекстном меню выберите команду Формат оси… В диалоговом окне на вкладке Параметры оси параметр минимальное значение: установите в положение фиксированное и в текстовом поле введите значение 20. Параметр максимальное значение: установите в положение фиксированное и в текстовом поле введите значение 50. Параметр цена основных делений: установите в положение фиксированное и в текстовом поле введите значение 10. Щелкните на кнопке Закрыть. Построенная диаграмма рассеяния имеет следующий вид:

  1. Анализ полученной диаграммы показывает определенную зависимость между переменными, а именно: в среднем, чем больше жилая площадь, тем выше отпускная цена.