Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ПОСОБИЕ ИНФОРМАТИКА

.pdf
Скачиваний:
23
Добавлен:
01.04.2015
Размер:
2.51 Mб
Скачать
SSфакт

148

Ввод: последовательно нажать клавишиCtrl и Shift, затем, удерживая эти клавиши, нажать Ввод (Enter).

Результат в ячейках D22:E26:

 

 

 

D

 

 

E

 

 

 

… …

 

 

 

 

22

 

0,00976

 

-4 724,67266

 

 

 

23

 

0,00108

 

2 797,37688

 

 

 

24

 

0,91104

 

1 164,91479

 

 

 

25

81,92328

 

8,00000

 

 

 

26

111 172 052,4493

10 856 211,65071

 

 

Полученные

 

числовые

значения

соответствуют

следующим

статистическим показателям:

 

 

D

E

… …

22

b

a

23

 

 

24

R2

 

25

Fфакт

 

26

SSфакт

SSост

Коэффициенты «b» и «a» известны из предыдущих расчётов.

стандартная ошибка коэффициента b.

стандартная ошибка коэффициента a.

R2 – коэффициент детерминации, известный из предыдущих расчётов.

– среднее квадратичное отклонение результата.

Fфакт – фактическое значение статистического критерия Фишера.

– число степеней свободы

(sum of squares) – факторная (объяснённая) сумма квадратов отклонений регрессии.

SSост (sum of squares) – остаточная сумма квадратов отклонений регрессии.

149

12.2 Обработка данных правовой статистики с помощью ППП

«Wolfram Mathematica»

Среда «Wolfram Mathematica» позволяет реализовать множество аспектов анализа данных: от импорта и выявления зависимостей до построения моделей. В этой среде предоставлены различные возможности получения данных: из встроенных источников, импорт данных различных форматов, подключение к внешним базам данных. Первый уровень анализа представлен в «Wolfram Mathematica» простейшими видами обработки информации: количественными статистическими расчётами, сглаживанием, проверкой гипотез, визуализацией.

Функции описательной статистики обрабатывают и собственно данные, и символьные представления статистических распределений. При этом массивы могут содержать как числа, так и символы(переменные величины, параметры).

Одной из таких функций в«Wolfram Mathematica», позволяющих формально оценивать зависимость между экономическими случайными величинами, является функция «Correlation»: расчёт корреляции, подробный алгоритм которого рассмотрен ранее на примере расчёта в

«MS-Excel».

После запуска «Wolfram Mathematica» в меню «File» выбрать опции «New» и «Notebook». Файл с расширением «.nb» сохранить на диске под названием «ПравСтат_Вольфрам_ФамилияНомерГруппы».

В «Wolfram Mathematica» рабочий файл называется«notebook» и

имеет расширение «.nb». Среда включает в себя оболочку«FrontEnd», и ядро «Kernel». С помощью оболочки пользователь вводит данные, задание на их обработку(числовой расчёт, визуализация …) и получает результаты. Собственно обработку выполняет ядро.

Синяя скобка в правой части поля и мерцающий горизонтальный курсор означают, что открыта клетка ввода, и ввод начнётся с того места, где находится курсор. Команда на выполнение введённого в ячейку задания подаётся сочетанием клавиш Shift Ввод.

Написание всех функций в«Wolfram Mathematica» начинается с большой буквы. Аргументы функций заключаются в квадратные скобки, а списки значений, заключаются в фигурные скобки.

Некоторые клавиши набора в «Wolfram Mathematica». Ctrl _ нижний индекс

Ctrl 6 верхний индекс

Ctrl / дробь

Ctrl 2 квадратный корень Ctrl 7 элемент сверху Ctrl = элемент снизу

1вывода,

150

Исходные данные из таблицы12.1 вводятся обязательно в виде списков, заключённых в фигурные скобки. После ввода списки могут быть представлены в матричной или векторной форме(инструмент «MatrixForm») и подлежат тем же операциям, которые выполняются с матрицами. Операции со списками могут выполняться без представления их в матричной форме. Первый аргумент функции «Correlation» ― список из десяти значений показателя «Кражи» из таблицы 1, второй аргумент ― список из десяти значений показателя «Убийства» из той же таблицы: рис. 12.2.1.

Рис. 12.2.1 Ввод аргументов функции Correlation.

Для выполнения команды последовательно нажимаются клавиши Shift и Ввод, при этом мигающий курсор может находиться в любой части клетки ввода. После выполнения команды в левой части экрана появляется номер ввода и соответствующий ему номер окрашенные синим цветом: рис. 12.2.2.

1 У разных пользователей номера вводов и, соответственно, выводов могут отличаться. Система «Wolfram Mathematica» ведёт сквозной учёт вводов/выводов пользователя на протяжении всего текущего сеанса его работы. Счётчик вводов/выводов обнуляется после полного выхода пользователя из программы, а не после закрытия отдельного файла. То же относится к именам переменных и массивов, определённым пользователем в ходе текущего сеанса.

151

Рис. 12.2.2 Результат выполнения команды и присвоение номера ввода / вывода.

В левой части экрана появился номер ввода и соответствующий ему номер вывода.

Для приведения результата к числовому виду нужно в следующую клетку ввести функцию «N», аргументом которой, в данном случае, будет ссылка на выражение Out[1]. Ссылка на последний результат обозначается символом «%» (на предпоследний – «%%»). Ответ rXY= 0,954482 совпадает с ответом, полученным ранее с помощью«MS-Excel», расчёт вёлся по уже известному алгоритму. Последний результат возводится в квадрат и получается известное значение коэффициента ПирсонаR2: рис. 12.2.3.

Рис. 12.2.3 Ссылка на последний результат

152

Для того, чтобы получить уравнение аппроксимированной линейной зависимости между ежегодными количествами краж и убийст используется инструмент «LinearModelFit». Но сначала, нужно ввести данные по годам попарно и присвоить массиву любое имя, «data» в этом примере: рис. 12.2.4.

Рис. 12.2.4 Формирование массива для получения уравнения аппроксимированной линейной зависимости

Теперь инструмент «LinearModelFit» готов к использованию, аргумент вводится как показано на рис. 12.2.5

Рис. 12.2.5 Ввод аргумента и результат работы инструмента

«LinearModelFit»

153

В квадратных скобках уже полученное ранее на точечной диаграмме

«MS-Excel» линейное уравнение y = 0.0098x – 4724.7, которое «Wolfram Mathematica» представляет в привычном виде с помощью инструмента «Normal». Затем, в полученную линейную зависимость, названную «LM» (linear model), в качестве числа кражx может быть подставлено любое

значение, которого

нет

среди

данных

одиннадцати

наблюдений.

Например, числу краж x = 2 000 000 соответствует в данной модели число

убийств y=14 787.4. Посколько число

убийств

не может быть

дробным,

расчёт по модели«вкладывается» в качестве аргумента в функцию «Round» (округлить), как показано на рис. 12.2.6.

Рис. 12.2.6 Приведение уравнения парной зависимости к обычному виду и его использование для получение расчётного значения зависимой переменной

Для построения точечной диаграммы и графической аппроксимации зависимости служат инструменты«Show», «ListPlot» и «Plot», как показано на рис. 12.2.7. Следует, в соответствии с таблицей опытных данных, определить диапазон изменения аргумента: от двух до трёх с половиной миллионов (от 2*106 до 3.5*106).

154

Изображение стрелки: «Esc» - > «Esc». Ввод верхнего индекса(в частности, при возведении в степень): «Ctrl» и «6».

Рис. 12.2.7 Построение точечной диаграммы

Для построения графика функции(например, графика линейной функции LM y = 0.0098x – 4724.7), используется инструмент «Plot»: рис. 12.2.8. С помощью опции«PlotStyle» задаётся внешний вид линии(в данном примере «Black», чёрная, и «Thick», толстая). Диапазон изменения аргумента задаётся также, как в предыдущем случае (2*106 – 3.5*106).

Рис. 12.2.8 Построение графика функции

155

Для представления данных в виде временных рядов с помощью функции «TemporalData» создаются упорядоченные по годам массивы

«TD1» и «TD2»: рис. 12.2.9. Результаты работы функции «TemporalData»

используются функцией «ListLinePlot» при визуализации временных рядов. Функции «TemporalData» и «ListLinePlot» для обоих массивов помещены в одну ячейку, что достигается разделением строк внутри ячейки клавишей Ввод, расположенной на основной клавиатуре. Так на одну клетку ввода приходится четыре клетки вывода.

Рис. 12.2.9 Визуализация ежегодного количества краж и убийств

С помощью инструмента «LinearModelFit» была построена линейная модель вида y = a + bx, (y = - 4724.7 + 0.0098x). Параметры a и b рассчитываются по формулам (12.1.1) и (12.1.2). Эти формулы конструируются в «Wolfram Mathematica» с помощью встроенных функций «Mean» (среднее арифметическое) и «Power» (возведение в степень). Первые аргументы

156

этих функций – числа или списки чисел1, второй аргумент функции «Power» - показатель степени: рис. 12.2.10. Для удобства записи создаются два списка «larcenies» (кражи) и «homicides» (убийства).

Рис. 12.2.10 Расчёт параметров парной линейной модели с помощью функций «Mean» и «Power»

Для конструирования формулы(12.1.3) понадобятся функции «Apply» и «Map». Функция «Apply» применяет свой первый аргумент (тоже функцию) к своему второму аргументу. Например, с её помощью может быть найдена сумма элементов списка «larcenies». Функция «Map», в отличие от функции «Apply», применяет свой первый аргумент к каждому элементу второго аргумента - списка. Например, «Map» позволяет из каждого элемента списка «larcenies» вычесть среднее арифметическое значение этого

столбца. Функция «MatrixForm» придаст полученному списку из десяти разностей вид столбца, как показано на рис. 12.2.11.

1 Аргументом функции «Mean» может быть функция распределения случайной величины.

157

Рис. 12.2.11 Применение функций «Apply», «Map» и «MatrixForm» к

элементам списка

Два варианта конструирования формулы(12.1.3) представлены на рис. 12.2.12. Первый вариант – запись в несколько строк, второй вариант - одной строкой.