ПОСОБИЕ ИНФОРМАТИКА
.pdf148
Ввод: последовательно нажать клавишиCtrl и Shift, затем, удерживая эти клавиши, нажать Ввод (Enter).
Результат в ячейках D22:E26:
|
|
|
D |
|
|
E |
|
|
|
… … |
… |
|
… |
|
|
||
|
22 |
… |
|
0,00976 |
|
-4 724,67266 |
|
|
|
23 |
… |
|
0,00108 |
|
2 797,37688 |
|
|
|
24 |
… |
|
0,91104 |
|
1 164,91479 |
|
|
|
25 |
… |
81,92328 |
|
8,00000 |
|
|
|
|
26 |
… |
111 172 052,4493 |
10 856 211,65071 |
|
|
||
Полученные |
|
числовые |
значения |
соответствуют |
следующим |
статистическим показателям:
|
|
D |
E |
… … |
… |
… |
|
22 |
… |
b |
a |
23 |
… |
|
|
24 |
… |
R2 |
|
25 |
… |
Fфакт |
|
26 |
… |
SSфакт |
SSост |
Коэффициенты «b» и «a» известны из предыдущих расчётов.
–стандартная ошибка коэффициента b.
–стандартная ошибка коэффициента a.
R2 – коэффициент детерминации, известный из предыдущих расчётов.
– среднее квадратичное отклонение результата.
Fфакт – фактическое значение статистического критерия Фишера.
– число степеней свободы
(sum of squares) – факторная (объяснённая) сумма квадратов отклонений регрессии.
SSост (sum of squares) – остаточная сумма квадратов отклонений регрессии.
149
12.2 Обработка данных правовой статистики с помощью ППП
«Wolfram Mathematica»
Среда «Wolfram Mathematica» позволяет реализовать множество аспектов анализа данных: от импорта и выявления зависимостей до построения моделей. В этой среде предоставлены различные возможности получения данных: из встроенных источников, импорт данных различных форматов, подключение к внешним базам данных. Первый уровень анализа представлен в «Wolfram Mathematica» простейшими видами обработки информации: количественными статистическими расчётами, сглаживанием, проверкой гипотез, визуализацией.
Функции описательной статистики обрабатывают и собственно данные, и символьные представления статистических распределений. При этом массивы могут содержать как числа, так и символы(переменные величины, параметры).
Одной из таких функций в«Wolfram Mathematica», позволяющих формально оценивать зависимость между экономическими случайными величинами, является функция «Correlation»: расчёт корреляции, подробный алгоритм которого рассмотрен ранее на примере расчёта в
«MS-Excel».
После запуска «Wolfram Mathematica» в меню «File» выбрать опции «New» и «Notebook». Файл с расширением «.nb» сохранить на диске под названием «ПравСтат_Вольфрам_ФамилияНомерГруппы».
В «Wolfram Mathematica» рабочий файл называется«notebook» и
имеет расширение «.nb». Среда включает в себя оболочку«FrontEnd», и ядро «Kernel». С помощью оболочки пользователь вводит данные, задание на их обработку(числовой расчёт, визуализация …) и получает результаты. Собственно обработку выполняет ядро.
Синяя скобка в правой части поля и мерцающий горизонтальный курсор означают, что открыта клетка ввода, и ввод начнётся с того места, где находится курсор. Команда на выполнение введённого в ячейку задания подаётся сочетанием клавиш Shift Ввод.
Написание всех функций в«Wolfram Mathematica» начинается с большой буквы. Аргументы функций заключаются в квадратные скобки, а списки значений, заключаются в фигурные скобки.
Некоторые клавиши набора в «Wolfram Mathematica». Ctrl _ нижний индекс
Ctrl 6 верхний индекс
Ctrl / дробь
Ctrl 2 квадратный корень Ctrl 7 элемент сверху Ctrl = элемент снизу
150
Исходные данные из таблицы12.1 вводятся обязательно в виде списков, заключённых в фигурные скобки. После ввода списки могут быть представлены в матричной или векторной форме(инструмент «MatrixForm») и подлежат тем же операциям, которые выполняются с матрицами. Операции со списками могут выполняться без представления их в матричной форме. Первый аргумент функции «Correlation» ― список из десяти значений показателя «Кражи» из таблицы 1, второй аргумент ― список из десяти значений показателя «Убийства» из той же таблицы: рис. 12.2.1.
Рис. 12.2.1 Ввод аргументов функции Correlation.
Для выполнения команды последовательно нажимаются клавиши Shift и Ввод, при этом мигающий курсор может находиться в любой части клетки ввода. После выполнения команды в левой части экрана появляется номер ввода и соответствующий ему номер окрашенные синим цветом: рис. 12.2.2.
1 У разных пользователей номера вводов и, соответственно, выводов могут отличаться. Система «Wolfram Mathematica» ведёт сквозной учёт вводов/выводов пользователя на протяжении всего текущего сеанса его работы. Счётчик вводов/выводов обнуляется после полного выхода пользователя из программы, а не после закрытия отдельного файла. То же относится к именам переменных и массивов, определённым пользователем в ходе текущего сеанса.
151
Рис. 12.2.2 Результат выполнения команды и присвоение номера ввода / вывода.
В левой части экрана появился номер ввода и соответствующий ему номер вывода.
Для приведения результата к числовому виду нужно в следующую клетку ввести функцию «N», аргументом которой, в данном случае, будет ссылка на выражение Out[1]. Ссылка на последний результат обозначается символом «%» (на предпоследний – «%%»). Ответ rXY= 0,954482 совпадает с ответом, полученным ранее с помощью«MS-Excel», расчёт вёлся по уже известному алгоритму. Последний результат возводится в квадрат и получается известное значение коэффициента ПирсонаR2: рис. 12.2.3.
Рис. 12.2.3 Ссылка на последний результат
152
Для того, чтобы получить уравнение аппроксимированной линейной зависимости между ежегодными количествами краж и убийст используется инструмент «LinearModelFit». Но сначала, нужно ввести данные по годам попарно и присвоить массиву любое имя, «data» в этом примере: рис. 12.2.4.
Рис. 12.2.4 Формирование массива для получения уравнения аппроксимированной линейной зависимости
Теперь инструмент «LinearModelFit» готов к использованию, аргумент вводится как показано на рис. 12.2.5
Рис. 12.2.5 Ввод аргумента и результат работы инструмента
«LinearModelFit»
153
В квадратных скобках уже полученное ранее на точечной диаграмме
«MS-Excel» линейное уравнение y = 0.0098x – 4724.7, которое «Wolfram Mathematica» представляет в привычном виде с помощью инструмента «Normal». Затем, в полученную линейную зависимость, названную «LM» (linear model), в качестве числа кражx может быть подставлено любое
значение, которого |
нет |
среди |
данных |
одиннадцати |
наблюдений. |
Например, числу краж x = 2 000 000 соответствует в данной модели число |
|||||
убийств y=14 787.4. Посколько число |
убийств |
не может быть |
дробным, |
расчёт по модели«вкладывается» в качестве аргумента в функцию «Round» (округлить), как показано на рис. 12.2.6.
Рис. 12.2.6 Приведение уравнения парной зависимости к обычному виду и его использование для получение расчётного значения зависимой переменной
Для построения точечной диаграммы и графической аппроксимации зависимости служат инструменты«Show», «ListPlot» и «Plot», как показано на рис. 12.2.7. Следует, в соответствии с таблицей опытных данных, определить диапазон изменения аргумента: от двух до трёх с половиной миллионов (от 2*106 до 3.5*106).
154
Изображение стрелки: «Esc» - > «Esc». Ввод верхнего индекса(в частности, при возведении в степень): «Ctrl» и «6».
Рис. 12.2.7 Построение точечной диаграммы
Для построения графика функции(например, графика линейной функции LM y = 0.0098x – 4724.7), используется инструмент «Plot»: рис. 12.2.8. С помощью опции«PlotStyle» задаётся внешний вид линии(в данном примере «Black», чёрная, и «Thick», толстая). Диапазон изменения аргумента задаётся также, как в предыдущем случае (2*106 – 3.5*106).
Рис. 12.2.8 Построение графика функции
155
Для представления данных в виде временных рядов с помощью функции «TemporalData» создаются упорядоченные по годам массивы
«TD1» и «TD2»: рис. 12.2.9. Результаты работы функции «TemporalData»
используются функцией «ListLinePlot» при визуализации временных рядов. Функции «TemporalData» и «ListLinePlot» для обоих массивов помещены в одну ячейку, что достигается разделением строк внутри ячейки клавишей Ввод, расположенной на основной клавиатуре. Так на одну клетку ввода приходится четыре клетки вывода.
Рис. 12.2.9 Визуализация ежегодного количества краж и убийств
С помощью инструмента «LinearModelFit» была построена линейная модель вида y = a + bx, (y = - 4724.7 + 0.0098x). Параметры a и b рассчитываются по формулам (12.1.1) и (12.1.2). Эти формулы конструируются в «Wolfram Mathematica» с помощью встроенных функций «Mean» (среднее арифметическое) и «Power» (возведение в степень). Первые аргументы
156
этих функций – числа или списки чисел1, второй аргумент функции «Power» - показатель степени: рис. 12.2.10. Для удобства записи создаются два списка «larcenies» (кражи) и «homicides» (убийства).
Рис. 12.2.10 Расчёт параметров парной линейной модели с помощью функций «Mean» и «Power»
Для конструирования формулы(12.1.3) понадобятся функции «Apply» и «Map». Функция «Apply» применяет свой первый аргумент (тоже функцию) к своему второму аргументу. Например, с её помощью может быть найдена сумма элементов списка «larcenies». Функция «Map», в отличие от функции «Apply», применяет свой первый аргумент к каждому элементу второго аргумента - списка. Например, «Map» позволяет из каждого элемента списка «larcenies» вычесть среднее арифметическое значение этого
столбца. Функция «MatrixForm» придаст полученному списку из десяти разностей вид столбца, как показано на рис. 12.2.11.
1 Аргументом функции «Mean» может быть функция распределения случайной величины.
157
Рис. 12.2.11 Применение функций «Apply», «Map» и «MatrixForm» к
элементам списка
Два варианта конструирования формулы(12.1.3) представлены на рис. 12.2.12. Первый вариант – запись в несколько строк, второй вариант - одной строкой.