Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсовой проект по ЛОИ.doc
Скачиваний:
0
Добавлен:
06.05.2019
Размер:
138.24 Кб
Скачать

5. Отчетность и требования к оформлению

Отчет должен быть представлен в виде файла формата MS Word и в виде распечатки на листах формата А4 с использованием шрифта Times New Roman Cyr 14. Список литературных источников должен включать 10-20 наименований не более чем 5-7 летней давности. До защиты курсового проекта необходимо сделать доклад на 5-10 минут, содержащий тему работы, исходные данные, рассмотренные методы решения, достигнутые в ходе работы результаты.

Курсовой проект по лои Вариант №5. Задание на разработку программы определения принадлежности текста определённой тематике

1. Общее

1 Программа предназначена для определения принадлежности текста определённой тематике на основе анализа частоты вхождений лексем в текстах.

2 Для каждого предложенного текста программа определяет частоту вхождения лексем в тексте.

3 Программа сохраняет информацию о лексемах в базе данных.

4 Программа сверяет полученную частоту вхождения лексем для данного текста с частотой вхождения лексем для определённых тематик в базе данных и делает предположение о принадлежности текста на основании корреляции частот в тексте и базе.

2. Функции программы

1 Программа должна позволять создавать внутреннюю базу данных на основе анализа текстовых файлах в кодировках ANSI и OEM (использованных в MS-DOS и Windows). База данных должна сохраняться на диске между сеансами работы программы, т.е. она является кумулятивной.

2 Программа читает исходный файл, разделяет его на лексемы и определяет число вхождений каждой лексемы в файле.

3 Программа делает предположение о принадлежности заданного текста определённой тематике, сравнивая частоты вхождения лексем с текстами, имеющимися в базе данных (на основе корреляции частот).

4 После подтверждения пользователя текст заносится в соответствующий раздел базы данных.

5 Под лексемами понимаются слова английского или русского языка (с учётом регистра).

3. Интерфейс программы

1 Программа должна быть выполнена с использованием компилятора Visual C++ NET. По желанию разработчика может быть использована (рекомендуется) библиотека MFC.

2 Программа должна представлять собой приложение Windows c графическим интерфейсом пользователя, удовлетворяющим основным стандартам на пользовательский интерфейс.

3 Пользователь может указать, какой файл необходимо добавить к базе данных, выбрав его в соответствующем диалоговом окне.

4 После анализа файла программа делает предположение о принадлежности определённой тематике и выводит эту информацию пользователю. Пользователю выводится список (в виде таблицы), отсортированный по убыванию вероятности принадлежности определённой тематике. В таблице выводятся два поля – название тематики и вероятность принадлежности текста данной тематике.

5 После того, как пользователь выбирает тематику, информация о частоте вхождения лексем добавляется в соответствующий раздел базы данных.

6 Программа предоставляет автоматический режим, в котором текст может быть автоматически причислен к определённой тематике (по наибольшей вероятности). В этом случае информация в базе данных дополняется автоматически и формируется протокол программы, в котором пишется какой файл и на основании какой вероятности был занесён в определённый раздел базы данных.

 

4. Защита и сдача курсовой работы Для защиты и сдачи курсовой работы необходимо оформить отчёт по курсовой работе, предоставить исходный текст программы и выполняемый модуль. Программы должны комплектоваться набором тестов или тестовых исходных данных, которые показывают правильность её функционирования при различных исходных данных. Если программа установленная с помощью инсталляционного комплекта не работает в отсутствии специфичных библиотек или среды разработки - это является ошибкой автора программы и соответствующим образом оценивается. Весь исходный код программы должен сопровождаться значимыми комментариями. Это означает, что любая последовательность строк, смысл которой неочевиден для читающего, должна быть прокоментирована.