
МИНОБРНАУКИ РОССИИ
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ
ЭЛЕКТРОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
«ЛЭТИ» ИМ. В. И. УЛЬЯНОВА (ЛЕНИНА)
Кафедра АПУ
ОТЧЕТ
по проекту 2 “Достижения систем перевода”
по дисциплине «Инженерия знаний»
Студент гр. 0391 |
|
Чащин Д. |
Преподаватель |
|
Котова Е. Е. |
Санкт-Петербург
2023
Представление результатов обработки документа 1 “ТЕОРИЯ ПЕРЕВОДА: ОСНОВНЫЕ ПОНЯТИЯ И ПРОБЛЕМЫ” [1]
Таблица №1 Фрагмент таблицы терминов
Номер |
logN |
logF |
Термин |
Частота |
Fc |
Fcnorm, % |
1 |
0,000 |
2,740 |
перевод |
550 |
550 |
9,112 |
2 |
0,301 |
2,396 |
язык |
249 |
799 |
13,237 |
3 |
0,477 |
2,260 |
слово |
182 |
981 |
16,252 |
4 |
0,602 |
2,049 |
текст |
112 |
1093 |
18,108 |
5 |
0,699 |
1,944 |
единица |
88 |
1181 |
19,566 |
6 |
0,778 |
1,940 |
переводчик |
87 |
1268 |
21,007 |
7 |
0,845 |
1,857 |
теория |
72 |
1340 |
22,200 |
8 |
0,903 |
1,851 |
значение |
71 |
1411 |
23,376 |
9 |
0,954 |
1,833 |
соответствие |
68 |
1479 |
24,503 |
.. |
…....... |
…....... |
…....... |
….. |
….. |
…....... |
1566 |
3,195 |
0,000 |
сдоба |
1 |
6492 |
107,555 |
Рис 1. Закон Ципфа.
Рис 2. Закон Ципфа-Мандельброта. Линейная линия тренда.
Рис 3. Кумулятивная частота.
Рис 4. Нормализованная частота.
Рис 5. Облако тегов.
Представление результатов обработки документа 2 “КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ В ПЕРЕВОДЕ” [2]
Таблица №2 Фрагмент таблицы терминов
Номер |
logN |
logF |
Термин |
Частота |
Fc |
Fcnorm, % |
1 |
0,000 |
2,723 |
данные |
529 |
529 |
3,949 |
2 |
0,301 |
2,669 |
модель |
467 |
996 |
7,435 |
3 |
0,477 |
2,619 |
обучение |
416 |
1412 |
10,540 |
4 |
0,602 |
2,511 |
значение |
324 |
1736 |
12,959 |
5 |
0,699 |
2,502 |
алгоритм |
318 |
2054 |
15,333 |
6 |
0,778 |
2,413 |
признак |
259 |
2313 |
17,266 |
7 |
0,845 |
2,396 |
вектор |
249 |
2562 |
19,125 |
8 |
0,903 |
2,378 |
функция |
239 |
2801 |
20,909 |
9 |
0,954 |
2,330 |
набор |
214 |
3015 |
22,507 |
.. |
…....... |
…....... |
…....... |
….. |
….. |
…....... |
1685 |
3,227 |
0,000 |
методфакторизация |
1 |
13971 |
104,292 |
Рис 6. Закон Ципфа.
Рис 7. Закон Ципфа-Мандельброта. Линейная линия тренда.
Рис 8. Кумулятивная частота.
Рис 9. Нормализованная частота.
Рис 10. Облако тегов.
Представление результатов обработки документа 3 “ПРАКТИЧЕСКИЙ КУРС ПО НЕЙРОННЫМ СЕТЯМ” [3]
Таблица №3 Фрагмент таблицы терминов
Номер |
logN |
logF |
Термин |
Частота |
Fc |
Fcnorm, % |
1 |
0,000 |
2,158 |
сеть |
144 |
144 |
3,389 |
2 |
0,301 |
2,158 |
функция |
144 |
288 |
6,778 |
3 |
0,477 |
1,964 |
персептрон |
92 |
380 |
8,943 |
4 |
0,602 |
1,924 |
обучение |
84 |
464 |
10,920 |
5 |
0,699 |
1,875 |
точка |
75 |
539 |
12,685 |
6 |
0,778 |
1,869 |
сигнал |
74 |
613 |
14,427 |
7 |
0,845 |
1,820 |
вектор |
66 |
679 |
15,980 |
8 |
0,903 |
1,799 |
модель |
63 |
742 |
17,463 |
9 |
0,954 |
1,792 |
слой |
62 |
804 |
18,922 |
.. |
…....... |
…....... |
…....... |
….. |
….. |
…....... |
802 |
2,904 |
0,000 |
ееприложение |
1 |
4249 |
100,000 |
Рис 11. Закон Ципфа.
Рис 12. Закон Ципфа-Мандельброта. Линейная линия тренда.
Рис 13. Кумулятивная частота.
Рис 14. Нормализованная частота.
Рис 15. Облако тегов.