Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Праграма да ДЭ_зводны варыянт2014.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
308.74 Кб
Скачать

Змест вучэбнага матэрыялу Камп'ютарнае забеспячэнне філалагічнай дзейнасці

Камп'ютарная філалогія як напрамак падрыхтоўкі спецыялістаў: мэты і задачы. Камп'ютарная лінгвістыка як адзін з напрамкаў штучнага інтэлекту. Сферы дачынення камп'ютарнай лінгвістыкі. Суадносіны традыцыйнай тэарэтычнай і камп'ютарнай лінгвістыкі.

Лінгвістычна / філалагічна арыентаваны інфармацыйны пошук як лінгвістычная праблема.

Інфармацыйна-пошукавыя сістэмы. Віды інфармацыі. Асноўныя паняцці інфармацыйнага пошуку. Сучасныя ІПС (Google, Яндекс, Nigma, Asknet і інш.). Магчымасці пашыранага пошуку ў ІПС. Сінтаксіс запытаў. Агульныя прынцыпы індэксацыі і ранжыравання дакументаў. Паняцце лінгвістычнага забеспячэння інфармацыйнага пошуку.

Задачы камп'ютарнай лексікаграфіі. Лексікаграфія як прыкладная дысцыпліна. Выкарыстанне камп'ютарных тэхналогій пры складанні слоўнікаў. Камп'ютарныя праграмы падтрымкі лексікаграфічных работ. Электронныя і машынныя слоўнікі, іх прызначэнне. Віды машынных слоўнікаў.

Камп'ютарная тэрмінаграфія: тэрміналагічныя базы і банкі даных. Найважнейшыя напрамкі дзейнасці ў тэрміназнаўстве і тэрмінаграфіі. Распрацоўка тэрміналагічных стандартаў. Пераклад навукова-тэхнічнай тэрміналогіі. Нарматыўныя тэрміналагічныя слоўнікі. Інфармацыйна-пошукавыя тэзаўрусы.

Машынны пераклад, яго лінгвістычнае забеспячэнне. Прамысловыя сістэмы машыннага перакладу. Стратэгіі машыннага перакладу:падрадкоўны пераклад, пераклад з дапамогай мовы-пасярэдніка, пераклад з дапамогай універсальнай семантычнай мовы, звужэнне прадметнай галіны, статыстычны (фразеалагічны) пераклад. Лінгвістычныя праблемы МП: непаўната слоўнікаў, лексічная аманімія і полісемія, граматычная аманімія, несупадзенне граматычных сістэм моў і інш. Прамысловыя сістэмы МП, іх прызначэнне, стратэгіі, памылкі.

Аўтаматызацыя працэсаў анатавання і рэферыравання тэкстаў. Паняцце пра анатаванне і рэферыраванне тэкстаў. Статыстычныя метады вызначэння ключавых слоў і інфарматыўных сказаў. Больш і менш інфарматыўныя пазіцыі тэксту. Цяжкасці аўтаматычнага пошуку тэрмінаў у тэксце, іх прычыны і спосабы вырашэння. Праблема займеннікавай анафары пры аўтаматычным рэферыраванні. Аўтаматычнае анатаванне як сінтэз новага тэксту па зададзеным клішэ.

Класы метадаў аўтаматычнай апрацоўкі тэксту: статыстыка-імавернасныя, лінгвістычна арыентаваныя, камбінаваныя.

Падмова рэгулярных выразаў як сродак апрацоўкі тэкставай інфармацыі: азначэнне, функцыі, прыклады запісу лінгвістычных правілаў.

Аўтаматычны марфалагічны аналіз тэксту. Канцавая задача марфалагічнага аналізу. Машынныя слоўнікі для лексіка-марфалагічнага аналізу, сістэма запісу марфалагічнай інфармацыі ў іх. Марфалагічнае тэгіраванне. Распрацоўка тэг-сэта. Праблема марфалагічнага аналізу слоў, якія адсутнічаюць у машынным слоўніку.

Аўтаматычны сінтаксічны аналіз тэксту. Пабудова сінтаксічнага «дрэва» сказа як задача паверхневага сінтаксічнага аналізу. Семантыка-сінтаксічны (глыбінны сінтаксічны) аналіз як канцавая задача дадзенага этапа. Трансфармацыйная граматыка як метад апісання глыбінных сінтаксічных структур.

Аўтаматычнае выманне тэрмінаў з тэксту. Інфармацыйная роля тэрмінаў у тэкстах пэўнай прадметнай галіны. Аднаслоўныя і шматслоўныя тэрміны. Сінтаксічныя структуры тэрміналагічных словазлучэнняў, праблема аўтаматычнага вызначэння галоўнага слова ў іх. Прымяненне статыстыка-імавернасных метадаў вызначэння тэрмінаў.

Марфалагічная і сінтаксічная аманімія як праблема аўтаматычнай апрацоўкі тэксту. Азначэнне і класіфікацыя марфалагічных і лексіка-марфалагічных амонімаў. Лакальны сінтаксічны аналіз для пазбаўлення ад марфалагічнай аманіміі. Прыклады сінтаксічных амонімаў, прычыны іх узнікнення. Роля эталоннага корпусу тэкстаў для пазбаўлення ад аманіміі.

Фармальнае выдзяленне элементаў моўнай сістэмы: марфем, слоў, сказаў. Азначэнне слова і сказа ў тэарэтычнай і камп'ютарнай лінгвістыцы. Магчымыя памылкі пры фармальным выдзяленні слоў, іх прычыны. Фразеалагічныя адзінкі ў тэарэтычнай і камп'ютарнай лінгвістыцы. Магчымыя памылкі пры выдзяленні сказаў, іх прычыны і шляхі выпраўлення. Праблема выдзялення марфем.

Прынцып сіметрыі ў граматыцы. Фармальны вывад часцін мовы. Азначэнне сіметрыі як філасофскай катэгорыі. Сіметрычна-асіметрычныя матрыцы пры прадстаўленні словазмянення і словаўтварэння. Сіметрыя як аснова прадстаўлення і апісання фармальнай сінтаксічнай мадэлі словазлучэння і сказа.

Прынцып сіметрыі ў апісанні семантыкі моўных адзінак. Азначэнне сіметрыі як філасофскай катэгорыі. Спосабы тлумачэння слоў. Тлумачэнне праз аднакаранёвае слова як сіметрыя формы пры асіметрыі значэння. Тлумачэнне праз сінонімы як сіметрыя значэння пры асіметрыі формы. Тлумачэнне праз гіперонім як дысіметрыя.

Прыметы класіфікацыі камп'ютарных сістэм адукацыі.

Прыметы інтэлектуальнасці камп'ютарных сістэм адукацыі.

Азначэнне экспертнай сістэмы. Прыклады экспертных сістэм.

Азначэнне экспертнай адукацыйнай сістэмы.

Структура экспертнай сістэмы. База ведаў і яе функцыі. Механізм лагічных вывадаў. Карыстальніцкі механізм. Модуль набыцця ведаў. Модуль тлумачэнняў.

Структура лінгвістычнай базы ведаў у экспертнай сістэме. Модуль вызначэння ўваходнай мовы. Модуль машынных слоўнікаў. Машынная граматыка. Пытальна-адказная сістэма.

Гісторыя і перспектывы корпуснай лінгвістыкі. Першыя корпусы: The Brown Corpus, The Lancaster-Oslo-Bergen Corpus. Мегакорпусы, іх асаблівасці: British National Corpus; Чэшскі нацыянальны корпус, Нацыянальны корпус рускай мовы.

Тыпалогія карпусоў. Тыпы лінгвістычных карпусоў і падставы іх вылучэння. Паралельны корпус: выраўноўванне, сферы выкарыстання. Дыяхранія і сінхранія ў корпуснай лінгвістыцы.

Міжнародныя праекты корпуснай лінгвістыкі. Стандарты TEI/CES/XCES, XML/EAGLES.

Разметка ў корпусе. Перад- і постапрацоўка лінгвістычных дадзеных. Сродкі і віды разметкі.

Этапы стварэння корпусу.

Корпус-мэнеджэр. Корпусны інтэрфейс.

Інтэрнэт як корпус. Інтэрнэт-пошук. Пошукавыя сістэмы Інтэрнэта. Тэхналогія веб-краулінга.