
- •Оглавление
- •1.Арифметические основы эвм. Типы данных, представление, перевод чисел. Коды чисел – прямой обратный дополнительный
- •2.Классификация структур данных, задачи обработки, массивы, списки
- •3.Древовидные и табличные структуры.
- •4.Методы поиска в массиве.
- •5.Методы внутренней сортировки.
- •6.Внешняя сортировка наборов данных.
- •7.Устройства ввода информации. Устройства вывода информации. Устройства хранения информации.
- •8.Операционная система. Понятие, основные функции и составные части операционной системы. Классификация операционных систем. WindowsNt;.Windows7, NovellNetWare; unix; os/2
- •9.Файловые системы (фс). Основные функции фс. Файлы и каталоги. Физическая организация данных на носителе. Права доступа к файлу. Другие функции фс. Фс fat32, ntfs.
- •10. Принципы построения вычислительных сетей.
- •11. Программные и аппаратные компоненты вычислительной сети.
- •12.Особенности операционной системы Windows7. Основные элементы графической оболочки Windows.
- •13.Операционная система Windows 7. Подключение драйверов. Сервисные и служебные программы.
- •14. Сервисные программные средства. Служебные программы. Архивация данных
- •1. Стандартные программы
- •2. Служебные программы.
- •3. Программы архивирования данных
- •15. Антивирусные программные средства
- •16. История создания сети Интернет. Организационная структура Интернета
- •17. Основные протоколы сети Интернет
- •18. Система доменных имен dns
- •19. Поиск информации в Интернете
- •20. Основные понятия и характеристики текстовых процессоров. Ms Word 2007 (2010) и его новые функциональные возможности
- •21. Ms Excel 2007 (2010): общая характеристика и функциональные возможности
- •22. Технология ввода данных в ms Excel. Формулы, функции, мастер функций
- •23. Графические возможности Excel 2007 (2010)
- •24. Средства структуризации и первичной обработки данных в msExcel 2007(2010)
- •25. Модели организации данных. Реляционная модель данных
- •26. Субд msAccess 2007 и ее основные возможности. Общая характеристика субд msAccess
- •27. Основные этапы разработки базы данных в среде msAccess
- •1. Определение цели создания базы данных
- •2. Определение таблиц, которые должна содержать база данных
- •3. Определение необходимых в таблице полей
- •4. Задание индивидуального значения каждому полю
- •5. Определение связей между таблицами
- •6. Обновление структуры базы данных
- •7. Добавление данных и создание других объектов базы данных
- •8. Использование средств анализа в Microsoft Access
- •28. Субд msAccess. Cоздание таблиц и схем данных
- •29. Субд msAccess. Разработка запросов к базе данных
- •30. Субд msAccess. Конструирование экранных форм для работы с данными
- •31. Субд msAccess. Конструирование отчетов
- •32. Современные способы организации презентаций. Microsoft PowerPoint 2007 (2010) и его новые возможности
- •33. Перспективные технологии на основе Интернета. Электронная коммерция, ip- телефония, дистанционное обучение.
- •34. Принципы защиты информации. Криптография. Электронная цифровая подпись
- •35. Электронная почта. Настройка клиента электронной почты
- •36. Статистическая обработка данных с использованием прикладной программы statistica
- •37.Анализ данных с помощью статистического пакета spss forWindows
- •38.Основные виды компьютерной графики: векторная, растровая, фрактальная. Основные области применения
- •39.Анализ требований к программному обеспечению
- •40.Жизненный цикл программного обеспечения.
- •41.Обеспечения качества программного обеспечения
- •42.Тестирование программного обеспечения
36. Статистическая обработка данных с использованием прикладной программы statistica
Система STATISTICA (фирма-производитель StatSoft Inc, USA) занимает устойчиво лидирующее положение среди программ статистической обработки данных, имеет более 250 тысяч зарегистрированных пользователей в мире.
Система STATISTICA организована по модульному принципу. Это означает, что все методы статистической обработки, реализованные в системе, разбиты на несколько групп – модулей – в соответствии с разделами статистического анализа. Каждый модуль является отдельным Windows-приложением и может работать независимо от остальных модулей системы. Модули STATISTICA открываются щелчком мыши из Переключателя модулей STATISTICA (STATISTICA Module Switcher). После выбора модуля в Переключателе модулей открывается стартовая панель выбранного модуля. Далее необходимо выбрать файл данных, задавая, при необходимости, условия выбора и веса переменных (кнопки «Select cases» и «Weight» соответственно). Далее необходимо: выбрать вычислительную процедуру и задать ее параметры; запустить вычислительную процедуру; В окне «Results» можно осуществить всесторонний просмотр и анализ результатов, используя широкие графические возможности и специальные таблицы вывода.
Первичный анализ данных представлен модулем «Basic statistics». Основные инструменты: Вероятностный калькулятор (Basic statistics / Tables / Probability calculator) – построение графиков наиболее употребляемых функций распределения и плотностей, вычисление процентных точек. Генератор случайных чисел на отрезке [0, 1]: создаем файл данных → открываем окно спецификации «Var 1.» → в поле «Long name (Formula)» прописываем =Rnd (1) [0, 1].
Регрессионный анализ данных реализуется в модуле «Multiple Regression». Предполагается, что наблюдаемые величины связаны зависимостью вида: Y(i) = B1*X(i) + B0 + e(i), где: B1, B0 - неизвестные константы, e(i) - наблюдаемые случайные величины.
Дискриминантный анализ данных реализуется в модуле «Discriminant Analysis» Результаты дискриминантного анализа представляются в отдельном окне. Основные формы представления результатов: Функции классификации «Classification functions», Квадрат расстояния Махаланобиса «Squared Mahalanobis distance», Априорные вероятности классификации «A priori classifications probabilities», Апостериорные вероятности «Posterior Probabilities».
Кластерный анализ данных реализуется в модуле «Claster Analysis». Данные модуль позволяет варьировать такими параметрами, как: выбор метода (например метод «К-средних» «k-means»), число кластеров «Number of clasters», число итераций «Number of iterations». В строке «Missing data» задается способ обработки пропущенных данных. Группа опций «Initial claster centres» позволяет задать начальные центры кластеров.
37.Анализ данных с помощью статистического пакета spss forWindows
Пакет SPSS для Windows является в настоящее время одним из лидеров среди универсальных статистических пакетов. SPSS предлагает полный набор инструментов, обеспечивающих эффективную работу на всех этапах аналитического процесса – от планирования до управления данными, анализа данных и представления результатов.
Программное обеспечение SPSS позволяет:
Эффективно осуществлять сбор и ввод данных;
Организовывать простой доступ к данным;
Эффективно управлять данными;
Использовать различные стат. процедуры для анализа данных и строить более точные модели;
Наглядно представлять результаты тем;
Публиковать результаты в Интернете.
Для прогнозирования числовых переменных в системе SPSS можно использовать такие процедуры как:
Линейная регрессия – исследование взаимосвязей между предикторами и прогнозируемой переменной. Например, прогнозирование продаж на основе данных о ценах и доходе покупателей.
Линейная регрессия доступна в SPSS Base
Регрессия на основе взвешенного метода наименьших квадратов используется, когда дисперсия независимой переменной в генеральной совокупности непостоянна.
Регрессия на основе взвешенного метода наименьших квадратов доступна в SPSS Regression Models
Двухэтапный метод наименьших квадратов – применяется, когда предиктор и прогнозируемая переменная оказывают взаимное влияние друг на друга.
Двухэтапный метод наименьших квадратов доступен в SPSS Regression Models
Анализ выживаемости – оценка распределения временных интервалов между двумя событиями, например, временных интервалов от момента привлечения клиента до момента ухода клиента к конкурентам, даже если второе событие не регистрируется (например, клиенты остаются лояльными).
Анализ выживаемости доступен в SPSS Advanced Models
– Регрессия Кокса с ковариатами, зависящими от времени
– Процедура Каплана-Мейера
– Таблицы дожития
Процедуры доступны в SPSS Advanced Models.
Мощным инструментом анализа временных рядов и прогнозирования является модуль SPSS Trends. SPSS Trends позволяет анализировать информацию о прошлом и предсказывать будущее.
SPSS Trends позволяет воспользоваться следующими процедурами оценивания:
Анализ Бокса-Дженкинса для несезонных и одномерных моделей
Процедуры для обработки сезонных составляющих
Оценка до четырех параметров в 12 различных моделях экспоненциального сглаживания
Различные регрессионные методы: регрессия тренда, регрессионные модели с авторегрессионными ошибками первого порядка
Разложение временных рядов на гармонические составляющие
На каждом этапе построения модели в SPSS Trends можно воспользоваться альтернативными методами. Для оценки степени адекватности модели в SPSS Trends выводятся статистики и нормальные вероятностные графики.
SPSS для Windows обладает целым рядом графических возможностей позволяющих визуально оценить полученные числовые результаты анализа и прогноза данных. Многочисленные типы диаграмм позволяют представлять результаты в наглядной форме.
Категориальные диаграммы (включая несколько типов столбиков, линий, областей, кругов и ящиков).
Диаграммы для контроля качества (включая диаграммы Парето, Х-среднего и Сигма).
Гистограммы и диаграммы рассеяния (включая перекрывающиеся, матричные и трехмерные).
Диагностические и исследовательские графики (включая графики по наблюдениям и графики временных рядов).
Вероятностные графики (включая графики наблюденных и ожидаемых значений).
Графики автокорреляционной и частной автокорреляционной функции (включая преобразование натурального логарифма и сезонное и несезонное дифференцирование).
Графики кросс-корреляционной функции (включая преобразование при помощи натурального логарифмирования, сезонное и несезонное дифференцирование).
Система презентационной графики SPSS для Windows позволяет без лишних усилий создавать диаграммы, наилучшим образом описывающие результаты анализа, а также редактировать созданные диаграммы для их более тонкой настройки
Для представления данных в табличном виде в системе SPSS имеется дополнительный модуль SPSS Tables. Интерактивный интерфейс построения таблиц обновляется в режиме реального времени, так что Вы можете видеть, как будет выглядеть таблица, и изменять ее в процессе построения. Такие возможности, как объединение несколько категорий в одну, вставка итогов и подитогов сверху, снизу, справа или слева в таблице, добавление подкатегорий, изменение типов переменных и исключение категорий позволяют быстро и эффективно управлять внешним видом таблиц. Кроме того, вместе с таблицами можно рассчитывать статистические критерии, что позволяет устанавливать и подчеркивать достоверность полученных результатов.
Скорость работы и производственные возможности SPSS Tables позволяют создавать большие отчеты, и обеспечивают быстрое и эффективное представление информации, заложенной в огромных массивах данных, в удобной и понятной форме. SPSS Tables обладает целым рядом возможностей, обеспечивающих удобную и быструю доставку получаемых табличных отчетов. Интерактивные мобильные таблицы, создаваемые в SPSS Tables, можно экспортировать в Word и Excel.