Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
информатика. ответы на вопросы..doc
Скачиваний:
6
Добавлен:
28.10.2018
Размер:
441.34 Кб
Скачать
  1. Уровни понимания микротекста. Моделирование понимания в интеллектуальных системах.

Микротекст — это одна или несколько фраз, характеризующихся:

1) одной микротемой; 2) единством лексическим или семантическим; 3) структурным единством. Микротекст как мельчайшая текстовая единица осознается носителем языка. Микротекст осознается как 1)микротема, которую формулируем (тезис); 2) отправная точка для развития текста (формулировка первого предложения); 3) сокращенное изложение будущего текста или прочитанного (тезисы, план, конспект).

Три уровня понимания:

  • уровень слов,

  • уровень предложений,

  • уровень сложного синтаксического целого (смыслового куска)

Микротекст рассматривается как композиционное единство, которое отражает все особенности целого текста и может быть той микромоделью, на которой могут быть изучены все особенности текста, начиная от анекдота и заканчивая многотомными романами и монографиями.

(Макротекст — это такая текстовая единица, которая представляет собой объединение нескольких микротекстов. Может быть частью параграфа или главы, совпадать с параграфом, главой, может быть отдельным произведением (рассказом, статьей, романом).

Модели различаются по используемым средствам моделирования: алгоритму и исчислению. Любая модель должна быть представлена в виде алгоритма (или снабжена алгоритмом), чтобы быть реализованной на машине, потому что машина понимает только язык команд, но не язык разрешений.

Алгоритмом называется последовательность команд, выполнение которых ведет к выделению (или построению) желаемого объекта. Алгоритм должен допускать реализацию, доступную электронной вычислительной машине; в этом отношении алгоритм можно сравнить с инструкцией для лаборанта, который точно выполняет предписания, но не способен размышлять. Алгоритм, записанный на понятном для машины языке, называется программой.

Исчисление – это множество разрешающих правил (порядок выполнения не важен), а алгоритм - это строгая последовательность приказов (команд).

Обычно исчисление имеет вид математической системы, включающей: исходные (первичные, или неопределяемыe) понятия, имена которых образуют уже знакомый нам "алфавит символов" (аксиомы). Вместо аксиом иногда используются правила образования и преобразования выражений из элементов алфавита.

  1. Машинный (автоматический) перевод как одно из направлений искусственного интеллекта. Стратегии машинного перевода.

Маши́нный перево́д — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

Формы организации взаимодействия ЭВМ и человека при машинном переводе

С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат.

С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка.

С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.

Смешанные системы (например, одновременно с пред- и постредактированием).

Автоматизированный перевод

Вместо «машинный» иногда употребляется слово автоматический, что не влияет на смысл. Однако термин автоматизированный перевод имеет совсем другое значение — при нём программа просто помогает человеку переводить тексты.

Автоматизированный перевод предполагает такие формы взаимодействия:

Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.

Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё, не уложившееся в схему, отдаёт человеку.

История машинного перевода (курсивом отметила ,что не нужно вроде)

1946(9) году в США в Пентагоне, разослан меморанд в 200 университетов мира с предложением о созд.машинного перевода.

1954(2)году - первая публичная демонстрация машинного перевода (т.н. Джорджтаунский эксперимент) с русского на англ.яз текст по ядерной физике. Несмотря на примитивность той системы (словарь в 150 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс: начались исследования в Англии, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и других странах;

1955 году и в СССР созд. 1-я сист. фр.-р. Сист. Сократ – англ-р совр.пер., единств.перев: синтагма, предложение.

К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:

MARK (в Департаменте иностранной техники ВВС США);

GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).

Однако созданная для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинно переведённых текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом её выводы привели к росту пессимизма, снижению финансирования, часто к полному прекращению работ по этой тематике.

Исследования продолжались, особенно существенным фактором стало появление мини- и персональных компьютеров, а с ними всё более сложных словарных, поисковых и т. п. систем, ориентированных на работу с естественно-языковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъёму этой области, наступившему примерно с середины 1970-х. В 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

Но высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода: по оценкам конца 1980-х, до пяти раз.

В настоящее время существует множество коммерческих проектов машинного перевода. Одним из пионеров в области машинного перевода была компания Systran. В России большой вклад в развитие машинного перевода внесла группа под руководством проф. Р. Г. Пиотровского (Российский государственный педагогический университет имени А. И. Герцена, Санкт-Петербург).

Качество перевода

Качество перевода зависит от тематики и стиля исходного текста. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных бродящих по Интернету шуток. Из пространных примеров наиболее известен текст «Гуртовщики Мыши» (перевод компьютерной документации программой Poliglossum на основе медицинского, коммерческого и юридического словарей); из кратких — фраза «My cat has given birth to four kittens, two yellow, one white and one black», которую переводчик компании ПРОМТ превращает в «Моя кошка родила четырёх котят, два желтых цвета, одного белого и одного афроамериканца». Главной причиной того, почему программа перевела именно так, было то, что после слова black нужно было добавить kitten, тогда программа переведёт правильно: «Моя кошка родила четырёх котят: двух жёлтых, одного белого и одного чёрного котёнка».

Чаще всего подобные шутки связаны с тем, что программа не распознаёт контекст фразы и переводит термины дословно, к тому же не отличая собственных имён от обычных слов. Тот же переводчик ПРОМТ превращает «bra-ket notation» в «примечание Кети лифчика», «Lie algebra» — в «алгебру Лжи», «eccentricity vector» — в «вектор оригинальности», «Shawnee Smith» в «индеец племени шони Смит» и т. п.

Статистический машинный перевод

Статистический машинный перевод — это разновидность машинного перевода текста, основанная на сравнении больших объёмов языковых пар. Языковые пары — тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком — носителем двух языков, так и набором предложений и их переводов, выполненных человеком. Таким образом статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучше результат статистического машинного перевода. Под понятием "статистического машинного перевода" подразумевается общий подход к решению проблемы перевода, который основан на поиске наиболее вероятного перевода предложения с использованием данных, полученных из двуязычной совокупности текстов. В качестве примера двуязычной совокупности текстов можно назвать парламентские отчеты, которые представляют собой протоколы дебатов в парламенте. Двуязычные парламентские отчеты издаются в Канаде, Гонконге и других странах; официальные документы Европейского экономического сообщества издаются на 11 языках; а Организация объединенных наций публикует документы на нескольких языках. Как оказалось, эти материалы представляют собой бесценные ресурсы для статистического машинного перевода.

Интересные факты

Чарльз Э. Р. Хоар утверждает, что разработал метод, известный как «быстрая сортировка», именно для машинного перевода. Дело в том, что в те времена словарь можно было хранить только на магнитной ленте, и если отсортировать слова в исходном тексте, то их перевод можно получить за один прогон ленты.

Системы машинного перевода позволяют провести простой эксперимент, подтверждающий синтаксическое единство русского, украинского и белорусского языков. Для этого достаточно перевести произвольный текст с помощью одной из систем машинного перевода. Качество перевода в данном случае, как правило, получается очень высоким.

Иску́сственный интелле́кт (ИИ) (англ. Artificial intelligence, AI) — это наука и разработка интеллектуальных машин и систем, особенно интеллектуальных компьютерных программ, направленных на то, чтобы понять человеческий интеллект.[1] При этом используемые методы не обязательно биологически правдоподобны. Но проблема состоит в том, что неизвестно какие вычислительные процедуры мы хотим называть интеллектуальными. А так как мы понимаем только некоторые механизмы интеллекта, то под интеллектом в пределах этой науки мы понимаем только вычислительную часть способности достигать целей в мире.[1]

Различные виды и степени интеллекта существуют у многих людей, животных и некоторых машин, интеллектуальных информационных систем и различных моделей экспертных систем с различными базами знаний. При этом как видим такое определение интеллекта не связано с пониманием интеллекта у человека — это разные вещи. Более того, эта наука моделирует человеческий интеллект, так как с одной стороны, можно изучить кое-что о том, как заставить машины решить проблемы, наблюдая других людей, а с другой стороны, большинство работ в ИИ вовлекают изучение проблем, которые требуется решать человечеству в промышленном и технологическом смысле. Поэтому ИИ-исследователи вольны использовать методы, которые не наблюдаются у людей, если это необходимо для решения конкретных проблем.[1]

Именно в таком смысле термин ввел Джон Маккарти в 1956 году на конференции в Дартмутском университете, и до сих пор несмотря на критику тех, кто считает, что интеллект — это только биологический феномен, в научной среде термин сохранил свой первоначальный смысл, несмотря на явные противоречия с точки зрения человеческого интеллекта.( не знаю, может это и не надо))

про стратегии, друзья, наплетёте сами!!