Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
нир 2.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
422.85 Кб
Скачать

МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ

УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ

Кафедра «Информационные системы и технологии»

Рассмотрен и одобрен на заседании кафедры

«Информационные системы и технологии»

(протокол № ____от ___________)

Зав. кафедрой: д.т.н., профессор

_________________ Кочеткова О.В.

(подпись)

ОТЧЕТ О НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ

РАБОТЕ МАГИСТРАНТА

Суханов Александр Валерьевич

__________________________________________________________________

(Фамилия, Имя, Отчество)

в __________ семестре

Направление подготовки « Прикладная информатика »

Программа магистратуры «Информационные системы и технологии корпоративного управления»

Научный руководитель магистранта Богданов Е.П., д.т.н., профессор____

(Фамилия И.О., уч. степень, уч. звание)

_____________________________________________________________________________

Тема магистерской диссертации

Интеллектуальный анализ данных студентов с целью прогнозирования успеваемости и возможности управления приемом абитуриентов

Волгоград 20__ г.

Методы и инструментальные средства для интеллектуального анализа влияния различных факторов на успеваемость.

Обоснование использованных методов сбора данных

В результате проведения анализа предметной области, было выявлено, что для анализа данных необходимо выявить данные, которые не хранятся в карточках студентов вуза. Это значит, что необходимо получить такие данных от самих студентов в виде опроса или тестирования.

Для этого необходимо выявить метод опроса, который будет наиболее оптимальным, чтобы получить необходимые данные. Проанализируем целесообразность применения используемых методов сбора информации.

Метод опроса — психологический вербально-коммуникативный метод, заключающийся в осуществлении взаимодействия между интервьюером и интервьюируемы посредством получения от субъекта ответов на заранее сформулированные вопросы. Иными словами, опрос представляет собой общение интервьюера и респондента, в котором главным инструментом выступает заранее сформулированный вопрос.

Опрос можно рассматривать как один из самых распространённых методов получения информации о субъектах — респондентах опроса. Опрос заключается в задавании людям специальных вопросов, ответы на которые позволяют исследователю получить необходимые сведения в зависимости от задач исследования. К особенностям опроса можно причислить его массовость, что вызвано спецификой задач, которые им решаются. Массовость обуславливается тем, что психологу, как правило, требуется получение сведений о группе индивидов, а не изучение отдельного представителя.

Опросы разделяют на стандартизированные и не стандартизированные. Стандартизированные опросы можно рассматривать как строгие опросы, дающие, прежде всего общее представление об исследуемой проблеме. Не стандартизированные опросы менее строгие в сравнении со стандартизированными, в них отсутствуют жёсткие рамки. Они позволяют варьировать поведение исследователя в зависимости от реакции респондентов на вопросы.

При создании опросов сначала формулируют программные вопросы, соответствующие задаче решения, но которые доступны для понимания лишь специалистам. Затем эти вопросы переводятся в анкетные, которые сформулированы на доступном неспециалисту языке.

Виды опросов:

  • Анкетирование.

  • Личностные тесты.

  • Метод лестницы.

  • Метод интервью относят, как и к методу опроса, так и к методу беседы.

В результате проведения анализа методов опроса и опираясь на практический опыт в других исследовательских работах и трудоёмкость процедур, для проведения опроса был выбран метод анкетирования.

Анкета – структурированная форма сбора данных, состоящая из серии вопросов, письменных или устных, на которые необходимо отвечать респонденту. Разработка анкеты начинается с определения и понимания, какая информация необходима для исследования и каким образом (с помощью каких вопросов ее можно получить от респондентов, а также какие решения можно принять на основании этой информации?)

Основные функции анкеты:

  • переводит цели исследования в вопросы;

  • стандартизирует вопросы и форму ответа на них;

  • способствует автоматизации обработки;

  • обеспечивает надежность и достоверность оценки, при грамотном заполнении.

После выбора метода опроса в виде анкетирование, выявить требования, по каким правилам создать анкету, вопросы которые бы не смущали в ответах студентов, но в тоже время давала более полный объём необходимой информации.

Требования к составлению анкеты:

  • информация, которую необходимо собрать, должна быть четко определена и соответствовать определенной ранее проблеме исследования;

  • вид анкеты и метод проведения опроса должны соответствовать целям исследования; количество вопросов не должно утомлять респондентов, а тематика вопросов – не выходить за рамки исследования;

  • информация, затрагивающая чувства респондентов должна находиться в конце анкеты; тактичность в отношении вопросов о возрасте и доходах;

  • вопросы сами по себе не должны подталкивать респондентов на конкретный, один единственный для всех ответ;

  • должна присутствовать логическая структура вопросов;

  • удобное размещение вопросов на странице;

  • проведение предварительного тестирования для выяснения мнения респондентов.

После проведения анализа создания анкеты, необходимо рассмотреть данные которые не получает деканат вуза, но которые были бы необходимы для интеллектуального анализа данных.

В результате проведения анализа сделаны выводы, что при проведении анкетирования необходимо выявить следующие факторы, влияющие на успеваемость:

  • Количество детей в семье родителей.

  • Тип общеобразовательного учреждения, которое закончил студент.

  • Место проживания.

  • Основной вид деятельности отца и матери.

  • Посещаемые секции в школе и в вузе.

  • Общественная работа.

  • Семейное положение студента при обучении.

  • Источники вашего дохода.

После выбора этих факторов, каждый из них необходимо рассмотреть в отдельности, что бы выявить основные критерии, по которым будет проводиться, интеллектуальны анализ данных.

Количество детей в семье необходимо для того что бы понять сколько детей было в семье студента, как повлияло количество детей, на то по сколько времени уделялось каждому из них, учились ли они в одной коле, был ли один или одна одарённые другого, помогали ли они друг другу или были соперниками.

Тип общеобразовательного учреждения, которое закончил, влияет на уровень обучаемости. Ведь от того какой учреждение закончил, будет влиять уровень успеваемости. Если студент обучался в городской школе или в сельской, окружение, которое окружало его. Всё это должно повлиять на его успеваемость. Исходя из информации необходимо в анкете в факторе тип общеобразовательного учреждения, которое закончил выделить данные такие как: школа, гимназия, лицей, сельская школа.

В факторе место проживания интерес представляет выяснение, как влияет атмосфера общежития и условия съемной квартиры на успехи в учебе. Будет предпринята попытка выявить влияние соседей при совместном проживании, их количества и успеваемости соседей. Важно подтвердить или рассеять мнение большинства родителей, что общежитие вредно влияет на учебный процесс. Возможно, наибольшее влияние оказывает не место проживания, а настрой на учебу и успеваемость соседей по проживанию, наличие или отсутствие компьютера, телевизора, степень увлеченности компьютерными и другими азартными играми. Исходя из сказанного, необходимо выявить, где проживает студент. Будет то квартира с родителями, общежитие или съёмная квартира.

Основной вид деятельности отца и матери будет влиять на социальный статус студента, так как необходимо выяснить в какой семье рос студент, как повлияло социально положение отца и матери на успеваемость в школьной жизни и в успеваемости в институте. В результате этого необходимо выделить основной вид деятельности отца и матери: госслужащий, военнослужащий, предприниматель, рабочий (в промышленном производстве), рабочий (в с/x производстве), фермер (индивидуальный предприниматель) или безработный.

Фактор посещаемые секции в школе и в вузе необходим для того что бы понять как повлияло дополнительное образование на успеваемость студента. Приходилось ли ему пропускать учёбу в общеобразовательном учреждении для того что бы участвовать в олимпиадах или секциях. И могли бы ему сделать поблажки в учебе, если бы он занимал призовые места.

Для фактора общественная работа необходимо понять в первую очередь, зачем студент выполняет эту работу и как это повлияло на его успеваемость. Основной общественной работой для студента является староста, профорг, член студсовета (факультета, института, общежития).

Фактор семейное положение студента при обучении влияет, прежде всего на его успеваемость, так как холостой студент не обременён семейной жизнью и предоставлен сам себе, он может делать всё что хочет и когда захочет, а замужней паре или паре проживающей в месте приходится находить время на совместное время провождения, а так же если у пары есть ребёнок то он должен повлиять на личную и на студенческую жизнь, так как ему необходим постоянный присмотр и паре придётся пропускать пары или же уходить в академический отпуск, что бы следить за ребёнком.

В факторе основной источник дохода необходим для того что бы выяснить как студен платит за обучение подрабатывая в институте лаборантом работая в сторонней фирме и как график его работы влияет на посещаемость и успеваемость. Или же если он находится на бесплатном обучении и поучает ли он стипендию.

При выявлении всех этих факторов было составлено и проведено анкетирование, которое позволило выявить, какие данные будет храниться в базе данные, какие данные будут использоваться для интеллектуального анализа данные, а какие данные будут вспомогательными, но без которых невозможно будет полностью наполнить базу данных.

В процессе интеллектуального анализа данных необходимо провести оценку степени влияния каждого фактора, и отбросить не значимые.

База данных для хранения информации о студентах Обоснование выбора субд для хранения информации по студентам

Для того что было возможно провести интеллектуальный анализ данных необходимо собрать данные с которыми, будет проведена исследовательская работа. Что бы накопить эти данные, необходима база данных, которая включала бы в себя все необходимые возможности для хранения, обработки, экспорта и импорта данных.

Для того чтобы сделать правильный выбор программного продукта необходимо понять что такое база данных и обосновать выбор необходимой СУБД.

База данных (БД) представляет собой организованную структуру, используемую для хранения данных, т.е. любых сведений о явлениях, процессах, действиях и т.д.

Данные несут в себе информацию о событиях, происходящих в материальном мире, и, по сути, являются зарегистрированными сигналами, возникшими в результате этих событий. Данные становятся информацией, если пользователь обработает их и осмыслит, применив при этом адекватные этим данным методы.

Сегодня большинство СУБД размещают в своих структурах не только данные, но и методы (программные коды), поэтому можно утверждать, что Microsoft Access - это СУБД, предлагающая широкий диапазон средств, для хранения информации и эффективного управления этой информацией.

Базы данных содержат различные объекты, основными из которых являются таблицы. Структура простейшей базы данных соответствует структуре её двухмерной таблицы, содержащей столбцы и строки. Их аналогами в структуре простейшей базы данных являются поля и записи.

Основными свойствами полей являются имя поля, тип поля, его размер, определяющий предельную длину данных, размещаемых в этом поле, и др.

При работе с Microsoft Access 2010 используются следующие типы данных:

  • текстовый - тип данных, используемый для хранения простого неформатированного текста, число символов в котором не должно превышать 255;

  • поле MEMO - специальный тип данных, применяемый для хранения больших объёмов текста (до 65 535 символов);

  • числовой - тип данных для хранения чисел;

  • дата/время - тип данных для хранения значений даты и времени;

  • денежный - тип данных для хранения денежных значений (длина поля 8 байт);

  • счётчик - специальный тип данных, используемый для автоматической нумерации записей;

  • логический - для хранения логических данных, которые могут иметь одно из двух возможных значений Да или Нет;

  • поле объекта OLE - специальный тип данных, предназначенный для хранения объектов OLE (электронных таблиц Microsoft Excel, документов Microsoft Word, звукозаписей и др.);

  • гиперссылка - специальное поле для хранения адресов URL Web-объектов;

  • мастер подстановок - тип данных, запускающий мастер подстановок, что позволяет выбирать данные из раскрывающегося списка, а не вводить их в поле вручную.

Числовые поля могут иметь следующие размеры:

  • байт (Byte) - целые числа от 0 до 255 (1 байт);

  • целое (Integer) - целые числа от минус 32768 до +32767 (2 байта);

  • длинное целое (Long Integer) - целые числа от минус 2147483648 до +2147483647 (4 байта);

  • одинарное с плавающей точкой (Single) - числа от минус 3,41038 до +3,41038 с точностью до 7 знаков (4 байта);

  • двойное с плавающей точкой (Double) - числа от минус 1,79710308 до +1,79710308 с точностью до 15 знаков (8 байт).

Основным выбором MS Access является то, что она уже установлена на рабочем месте и выбор другого программного средства увеличил затраты на покупку и обучения персонала.