Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информац.технологии

.docx
Скачиваний:
10
Добавлен:
08.06.2020
Размер:
30.27 Кб
Скачать

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПОЧВОВЕДЕНИИ

Процесс проведения научного исследования с использованием ЭВМ.

Понятие об испытании с точки зрения анализа данных.

Активные и пассивные эксперименты.

Пассивный эксперимент – значения факторов не зависят от воли исследователя и берутся такими, какими они наблюдаются в опыте.

1. Метеонаблюдения (t, осадки и т.п.)

2. Описание неведомой страны, ее флоры и фауны

3. Определяем средний урожай на угодьях и находим, чем они отличаются

Активный эксперимент предполагает возможность устанавливать значение факторов по своему усмотрению.

1. Обстреливаем облака хлоридом серебра (чтоб вызвать дождь)

2. Изменяем геном существующих видов

3. Вносим удобрения на делянках и сравниваем урожай

Способы обеспечения репрезентативности выборки.

Систематический (механический) отбор

 Образцы отбираются по всей территории через равные промежутки, например по сетке

 При мониторинге - через равные временные промежутки

Случайный отбор (Перед каждым следующим выбором все шары в урне перемешиваются.)

Выборка называется случайной, если она построена таким образом, что каждое значение признака в пределах совокупности имеет равные возможности быть отобранным.

Особенности данных в почвоведении и агрохимии.

Проблемы обеспечения непротиворечивости и целостности данных.

Данные - это зарегистрированные факты, описания явлений реального мира или идей

Основные методы анализа данных и их реализация в программном обеспечении Excel, Statistica и R.

Виды «коробочек с усиками».

ДИАГРАММА РАЗМАХА. Такие диаграммы называются также «Коробочки с усиками».

Нормальная вероятностная бумага.

График на нормальной вероятностной бумаге предназначен для визуальной оценки близости распределения к нормальному. Если наблюдаемые значения распределены нормально, то все значения на графике должны попасть на прямую линию

 Если значения не являются нормально распределенными, они будут отклоняться от линии. На этом графике можно легко обнаружить выбросы

Квантильное представление распределения как свертка информации.

Квартили - это квантили (он же персентиль), делящие ранжированную совокупность на 4 равные части. Нижний квантиль отсекает 25% наименьших значений в ранжированной совокупности, а верхний квантиль, соответственно, - 75%. Квантиль, делящий ранжированную совокупность на две равные по числу половины, называется медианой. Медиана совпадает с 5-тым децилем и вторым квартилем. Все квантили измеряются в тех же единицах, что и случайная величина. Децели - 0,1 и 0,9

Квантили используют для свертки информации. Представление о распределении случайной величины можно получить по 7 точкам. Обычно вычисляют нижний и верхний децили (0,1 и 0,9), нижний и верхний квартили (0,25 и 0,75) и медиану. Наряду с вычисленными значениями квантилей приводят минимальное и максимальное значения и объем выборки. Результаты свертки информации представляют обычно в виде таблицы, где указаны все эти характеристики или в виде графика. На графике по оси абсцисс откладывают значения минимума, квантилей и максимума, а по оси ординат - соответствующие им значения γ *100%

Критерии проверки выборки на нормальность: хи-квадрат и КолмагороваСмирнова.

В настоящей заметке χ2-распределение используется для проверки согласованности набора данных с фиксированным распределением вероятностей. В критерии согласия частоты, принадлежащие определенной категории, сравниваются с частотами, которые являются теоретически ожидаемыми, если бы данные действительно имели указанное распределение. [1]

Проверка с помощью критерия согласия χ2 выполняется в несколько этапов. Во-первых, определяется конкретное распределение вероятностей, которое сравнивается с исходными данными. Во-вторых, выдвигается гипотеза о параметрах выбранного распределения вероятностей (например, о ее математическом ожидании) или проводится их оценка. В-третьих, на основе теоретического распределения определяется теоретическая вероятность, соответствующая каждой категории. В заключение, для проверки согласованности данных и распределения применяется тестовая χ2-статистика:

где f0 — наблюдаемая частота, fе — теоретическая, или ожидаемая частота, k — количество категорий, оставшихся после объединения, р — количество оцениваемых параметров.

Классический критерий Колмогорова (иногда говорят Колмогорова-Смирнова) предназначен для проверки простых гипотез о принадлежности анализируемой выборки некоторому полностью известному закону распределения.

В данном случае критерий Колмогорова используется для проверки гипотезы о принадлежности наблюдаемой выборки нормальному закону, параметры которого оцениваются по этой самой выборке методом максимального правдоподобия. То есть, проверяется сложная гипотеза и в качестве оценок параметров нормального закона используются выборочные оценки среднего и дисперсии.

В этом случае (Lilliefors) использовались модифицированные статистики вида:

.

Критические значения для статистики  приведены в следующей таблице (Lilliefors):

0,15

0,10

0,05

0,03

0,01

0,775

0,819

0,895

0,955

1,035

Критерии сравнение средних 2 независимых выборок (t-критерий и критерий Манна-Уитни).

Модель двухфакторного дисперсионного анализа без взаимодействия.

Множественная регрессия.