Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Statisticheskaya_kompyuternaya_obrabotka

.docx
Скачиваний:
1
Добавлен:
01.01.2020
Размер:
17.86 Кб
Скачать

Статистическая компьютерная обработка социальной информации

Математическая статистика (Колмогоров и Прохоров) – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов.

Статистические данные – это данные, полученные в результате обследования большого числа объектов или явлений.

Статистические методы — методы анализа статистических данных. Математическая статистика не раскрывает сущности исследуемых явлений. Она может фиксировать статистически достоверные различия между двумя исследуемыми явлениями, но не может объяснить причины этих различий.

Математическая статистика подразделяется на две основные области: описательную и аналитическую статистику.

Описательная статистика раскрывает методы описания статистических данных, представляет их в форме таблиц, графиков и распределений.

Аналитическая статистика (теория статистических выводов) ориентирована на обработку данных, полученных в ходе эксперимента, с целью формулировки выводов, имеющих прикладное значение для самых различных областей человеческой деятельности.

Общая характеристика основных программ для статистической обработки информации (Microsoft Excel, StatSoft Statistica, SPSS).

StatSoft Statistica. STATISTICA Base

Продукт предоставляет широкий набор основных статистик в понятном интерфейсе со всеми преимуществами, простотой и мощностью технологий STATISTICA.

STATISTICA Base включает все графические инструменты STATISTICA, а также следующие процедуры:

- Описательные и внутригрупповые статистики, разведочный анализ данных

- Корреляции

- Быстрые основные статистики и блоковые статистики

- Интерактивный вероятностный калькулятор

- T-критерии (и другие критерии групповых различий)

- Таблицы частот, сопряженности, флагов и заголовков, анализ многомерных откликов

- Множественная регрессия

- Непараметрические статистики

- Дисперсионный анализ (ANOVA/MANOVA)

- Подгонка распределений

SPSS SPSS Statistics (аббревиатура англ. «Statistical Package for the Social Sciences» — «статистический пакет для социальных наук») — компьютерная программа для статистической обработки данных, один из лидеров рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных науках.

Между 2009 и 2010 название программного обеспечения SPSS было изменено на PASW (Predictive Analytics SoftWare) Statistics.

28 июля 2009 компания объявила, что она была приобретена компанией IBM за 1,2 млрд долл. США. По состоянию на январь 2010 года компания стала называться «SPSS: An IBM Company».

По мнению некоторых авторов, SPSS «занимает ведущее положение среди программ, предназначенных для статистической обработки информации».

Возможности

• Ввод и хранение данных.

• Возможность использования переменных разных типов.

• Частотность признаков, таблицы, графики, таблицы сопряжённости, диаграммы.

• Первичная описательная статистика.

• Маркетинговые исследования

• Анализ данных маркетинговых исследований

Microsoft Excel является широко распространенной компьютерной программой, с помощью которой производятся расчеты, составляются таблицы и диаграммы, вычисляются простые и сложные функции.

Эта программа входит в пакет Microsoft Office, а потому установлена практически на всех компьютерах.

По своей сути Microsoft Excel – это большая таблица, предназначенная для внесения в нее данных. Функции программы позволяют проводить практически любые манипуляции с цифрами. Электронная таблица является основным средством, которая используется для обработки и анализа цифровой информации с помощью средств вычислительной техники.

При этом, кроме числовых и финансовых операций, Microsoft Excel может использоваться в процессе анализа данных, открывая пользователям широкие возможности для удобной автоматизации и обработки данных.

Особенность программы заключается в том, что она позволяет осуществлять сложные расчеты. То есть в процессе вычисления одновременно можно оперировать данными, которые располагаются в разных зонах электронной таблицы и при этом связаны определенной зависимостью. Выполнение таких расчетов осуществляется благодаря возможности введения различных формул в ячейки таблицы. После выполнения вычисления результат будет отображаться в ячейке с формулой. В доступном диапазоне формул находятся разные функции – от сложения и вычитания до вычислений, связанных с финансами или статистикой.

Важная особенность использования электронной таблицы заключается в автоматическом пересчете результатов, если изменяются значения ячеек. Excel может применяться при выполнении финансовых расчетов, учете и контроле кадрового состава той или иной организации, в построении и обновлении графиков, которые основаны на введенных числах.

Файл, с которым предполагает работу Excel, называется книгой. Она включает в себя несколько рабочих листов, в которых могут содержаться самые разные данные, начиная от таблиц и текстов и заканчивая диаграммами и рисунками. Microsoft Excel рассчитан на поддержку и использование XML-форматов, а также может открывать такие форматы, как CSV, DBF, SYLK, DIF.

Принципы организации социальной информации, подлежащей статистическому анализу (правила организации таблиц данных). Таблицы могут иметь весьма сложную структуру с несколькими уровнями записей в строках и столбцах.

Табличный способ обеспечивает, как правило, более компактное размещение данных на листе. Для данных, организованных табличным способом, удобнее создавать диаграммы; в отдельных случаях удобнее производить вычисления. С другой стороны, данные, организованные в виде таблицы, сложнее обрабатывать: производить выборки, сортировки и т. п.

Размещение данных

Как правило, на листе размещают одну таблицу.

Таблицу обычно помещают в левом верхнем углу листа. Первый столбец таблицы размещается в столбце А, соответственно следующие столбцы таблицы занимают следующие столбцы листа. Первая строка таблицы размещается в строке 1, соответственно следующие строки таблицы занимают следующие строки листа. При необходимости несколько первых строк листа могут быть заняты названием таблицы. Иное размещение затруднит печать таблицы.

При создании таблиц нельзя оставлять пустые столбцы и строки внутри таблицы.

Характеристика практически используемых методов статистического анализа информации в социальной сфере (частотный анализ, процентный анализ, корреляционный и сравнительный анализ).

Частотный анализ, частотный криптоанализ — один из методов криптоанализа, основывающийся на предположении о существовании нетривиального статистического распределения отдельных символов и их последовательностей как в открытом тексте, так и в шифротексте, которое, с точностью до замены символов, будет сохраняться в процессе шифрования и дешифрования.

Упрощённо, частотный анализ предполагает, что частота появления заданной буквы алфавита в достаточно длинных текстах одна и та же для разных текстов одного языка. При этом в случае моноалфавитного шифрования если в шифротексте будет символ с аналогичной вероятностью появления, то можно предположить, что он и является указанной зашифрованной буквой. Аналогичные рассуждения применяются к биграммам (двубуквенным последовательностям), триграммам и т.д. в случае полиалфавитных шифров.

Начиная с середины XX века большинство используемых алгоритмов шифрования разрабатываются устойчивыми к частотному криптоанализу, поэтому он применяется, в основном, для обучения.

процентный анализ Процентный анализ структуры форм финансовой отчетности, при котором определяется отношение отдельных статей баланса к суммарным активам и отдельных статей отчета о прибылях и убытках — к чистому объему продаж (реализации). При процентном анализе выражаются компоненты баланса в процентах от общей суммы средств компании. То же самое можно делать и для отчета о прибылях и убытках, но здесь имеются в виду удельные веса компонентов в общей выручке от продаж.

Рассчитывая удельный вес данного компонента в общей сумме, мы тем самым достигаем более глубокого понимания, чем при рассмотрении абсолютных цифр.

Анализ дает представление как распределяются средства предприятия и какова структура их источников.

Другое название этого метода - вертикальный анализ.

Корреляционный анализ Корреляционный анализ – это совокупность методов обнаружения так называемой корреляционной зависимости между случайными величинами.

Для двух случайных величин Х и Y корреляционный анализ состоит из следующих этапов:

- построение корреляционного поля и составление корреляционной таблицы;

- вычисление выборочного коэффициента корреляции;

- проверка статической гипотезы о значимости корреляционной связи.

Рассмотрим подробнее каждый из указанных этапов.

Корреляционное поле и корреляционная таблица являются исходными данными при корреляционном анализе.

Сравнительный анализ – метод анализа объектов, при котором производится сравнение нового состояния объекта со старым состоянием или сравнение состояния одного объекта с другим, с которым сравнение может быть уместным. Сравнительный анализ является одним из основных методов, применяемых в научных исследованиях экономики. Практически всегда формулировка или уточнение экономических понятий осуществляется с помощью сравнительного анализа.