
- •1. Диссертация как документ-контейнер
- •2 Способы систематизации научной информации средствами информационных технологий
- •3 Понятие информации и информационных технологий. Классификация и виды информационных технологий
- •4 Информатизация и компьютеризация. Техническое и программное обеспечение. Техническое и программное обеспечение современных процедур научной деятельности.
- •5. Понятие и виды информационных систем.
- •6 Вычислительная техника, классификация компьютеров по применению.
- •7 Персональные компьютеры. Периферийные устройства. Электронная оргтехника.
- •8. Компьютерные сети. Современные средства связи и их взаимодействие в с компьютерной техникой
- •По территориальной распространенности
- •По типу функционального взаимодействия
- •9 Понятие операционной системы. Функции ос.
- •10. Классификация операционных систем. Понятие файловой системы в ос.
- •11. Авторизация, разграничение доступа к объектам ос. Краткий обзор современных операционных систем.
- •12. Общая характеристика языков программирования. Виды языков программирования
- •13. Общая характеристика языков программирования. Классы языков программирования
- •14 Стандартизация языков программирования. Парадигма программирования
- •17 Процедурное, объектно-ориентированное и логическое программирование
- •18 Математическое обеспечение информационных технологий и компьютерное моделирование в предметной области.
- •19 Понятие модели. Основные принципы и этапы моделирования.
- •20 Статистические методы анализа данных
- •21 Пакеты прикладных программ по статистическому анализу данных
- •22 Пакет прикладных программ по статистическому анализу данных Statgraphics. Возможности и особенности пакета Statgraphics.
- •23 Пакет Statgraphics. Одномерный статистический анализ: оценка числовых характеристик, подбор закона распределения случайных величин.
- •24 Пакет Statgraphics. Одномерный статистический анализ. Сравнение нескольких случайных величин: сравнение числовых характеристик и законов распределения. Статистическая проверка гипотез.
- •25 Пакет Statgraphics. Анализ зависимостей между величинами: регрессионный и корреляционный анализ. Анализ временных рядов.
- •26 Пакет Statgraphics. Многомерный анализ: метод главных компонентов, кластерный, дискриминантный анализ.
- •27 Имитационное моделирование. Принципы построения имитационных моделей. Примеры решения инженерных и научных задач методом имитационного моделирования.
- •28 Имитационные эксперименты. Язык имитационного моделирования gpss – возможности, структура. Примеры решения инженерных и научных задач методом имитационного моделирования.
- •29 Элементы теории планирования экспериментов. Методы планирования эксперимента, методы оптимизации, методы экспертного анализа.
- •30 Системы поддержки принятия решений. Пакеты прикладных программ.
- •31 Экспертные системы. Оболочки для построения экспертных систем. Поисковая, диагностическая, интерпретирующая системы. Пакеты прикладных программ.
- •32. Системы компьютерной математики и математического моделирования, системы программирования. Инструментальные средства для решения прикладных задач.
- •33 Назначение и состав универсальной интегрированной системы компьютерной математики matlab (MathCad).
- •34 Интерфейс системы, основные объекты и форматы чисел matlab (MathCad).
- •35 Операторы и функции в matlab (MathCad).
- •36 Матричные вычисления в matlab (MathCad).
- •37 Построение графиков в matlab (MathCad).
- •38 Основы программирования в matlab (MathCad).
- •39 Исследование функций и оптимизация в matlab (MathCad). Исследование функций одной переменной. Исследование функций нескольких переменных.
- •40 Линейное программирование (решение задач оптимизации) в matlab (MathCad).
- •41.Понятие и классификация программного обеспечения. Обзор и характеристики пакетов программ в предметной области.
- •42 Текстовый процессор: основные объекты. Символ, абзац, страница, непечатаемые знаки, документ. Стиль, шаблон, перекрестные ссылки, оглавления, указатели.
- •43. Табличные процессоры. Системы поддержки принятия решения.
- •44. Статистический анализ данных средствами ms Excel.
- •45 Пакет анализа ms Excel. Описательная статистика. Решение задач описательной статистики.
- •46 Пакет анализа ms Excel. Генерация случайных чисел.
- •47. Пакет анализа ms Excel. Корреляционный анализ, регрессионный анализ.
- •48 Поиск корней уравнения с помощью подбора параметра в ms Excel.
- •49 Поиск решения. Решение задач оптимизации средствами ms Excel.
- •50.Системы подготовки презентаций.
- •51.Сервисные инструментальные средства: архиваторы, электронные словари, переводчики, программы распознавания текста
- •Электронные переводчики
- •Электронный переводчик как словарь.
- •Электронный переводчик как накопительная словарная база
- •Программа распознавания текста CuneiForm
- •Основные возможности программы
- •Достоинства CuneiForm
- •Недостатки
- •52 "Технология Compreno для обработки текстов на естественном языке. Множество прикладных задач по обработке текстов на естественном языке с помощью универсальной лингвистической платформы Compreno."
- •53 Основы компьютерной графики. Графические редакторы. Понятие о векторных и растровых графических редакторах.
- •54. Универсальный растровый графический редактор Photoshop – возможности, назначение , создание и редактирование рисунков.
- •55. Графический редактор Corel Draw – возможности, назначение, создание и редактирование рисунков.
- •56. Понятие системы автоматизированного проектирования. Обзор систем автоматизированного проектирования.
- •57 Универсальный векторный графический редактор AutoCad – возможности, назначение, создание и редактирование чертежей.
- •Разработка проекта в системе Autocad
- •58. Системы автоматизированного проектирования: возможности, назначение, принципы работы (пример ArchiCad)
- •59 Структуры данных, модели данных, создание базы данных и таблиц
- •60 Основы проектирования баз данных. Базы знаний.
- •Базы знаний
- •61 Системы управления базами данных (субд): понятие и основные объекты. Access, Oracle, MySql, Foxpro, dBase, sql Server и др.
- •62 Реляционные и объектно-ориентированные базы данных.
- •63 Объекты ms Access. Построение различных типов запросов в ms Access. Формы и отчеты в ms Access.
- •Построение различных типов запросов в ms Access
- •1 Создание запроса на выборку при помощи мастера
- •2 Создание запроса на выборку без помощи мастера
- •3. Создание запроса с параметрами, запрашивающего ввод условий отбора при каждом запуске
- •Формы и отчеты в ms Access
- •64.Основы языка sql и построение sql-запросов. Сортировка, поиск, фильтрация данных.
- •65 Основы web-дизайна
- •66. Проектирование и разработка web-сайтов и сопутствующее по
- •Создание шаблона html-документа и заполнение его информацией
- •68. Основы Web-дизайна. Работа с редакторами визуального проектирования.
- •69. Основы Интернет-программирования. Основы JavaScript.
- •70 Компьютерные сети: локальные, корпоративные, региональные, глобальные.
- •71 Службы сети Интернет: электронная почта, всемирная информационная паутина, служба передачи файлов, служба телеконференций и др.
- •72. Работа с почтовым клиентом. Планирование совместной деятельности в корпоративной сети с помощью почтовых программ
- •73. Методы и средства поиска информации в интернет
- •74 Проблемы защиты информации: несанкционированный доступ к данным, влияние деструктивных программ, преступления в деловых Интернет-технологиях.
- •75 Организационные методы защиты информации.
- •Физическое ограничение доступа
- •Контроль доступа к аппаратуре
- •Контроль доступа к данным и носителям информации
- •76 Технические и программные методы защиты информации.
- •Защита данных на отдельном компьютере
- •Защита данных в локальных сетях
- •1) Служба www
- •2) Электронная цифровая подпись (эцп)
- •77. Криптографические методы защиты. Электронная цифровая подпись. Методы компьютерной стеганографии.
- •78. Организационно-правовые аспекты защиты информации и авторское право. Нормативные документы.
- •Глава 7 защита информации
- •80 Пути решения проблемы информатизации общества.
- •81 Информационные технологии управления
- •Внедрение информационных технологий в образование
- •Электронное обучение: самообучение; обучение, управляемое инструктором; дистанционное обучение.
- •Управление качеством образования на основе информационных технологий
- •83. Ит сбора, хранения и быстрой обработки научн. Инф.
- •84 Проблемы и риски внедрения информационных технологий в общественной практике.
Основные возможности программы
Окно OCR-программы CuneiForm
Оптическое распознавание текстов (OCR) на английском, болгарском, венгерском, голландском, датском, испанском, итальянском, латышском, литовском, немецком, польском, португальском, румынском, русском, сербском, словенском, турецком, украинском, французском, хорватском, чешском, шведском, эстонском и на смеси русского и английского языков.
Сканирование из окна программы.
Выбор параметров сканирования.
Имеется мастер распознавания.
Возможность выбора ручной или автоматической разметки.
Настройка параметров разметки и распознавания.
Задание параметров форматирования.
Экспорт результатов распознавания в формат MS Word (.doc).
Достоинства CuneiForm
Практически единственная бесплатная OCR-программа профессионального уровня.
Большое количество языков распознавания.
Простой и понятный интерфейс.
Кроссплатформенность.
На русском языке.
Недостатки
Плохо распознаёт JPEG файлы, содержащие шум.
Не распознаёт документы, представленные в формате PDF.
Не сохраняет результаты распознавания в других форматах, кроме .doc.
Версия для Windows не обновлялась уже больше двух лет, проект по развитию OpenOCR скорее всего заморожен.
Отсутствие официальной поддержки.
52 "Технология Compreno для обработки текстов на естественном языке. Множество прикладных задач по обработке текстов на естественном языке с помощью универсальной лингвистической платформы Compreno."
Технология Compreno предназначена для создания систем анализа, перевода и поиска текстов на различных языках.
Compreno - это технология перевода любого человеческого языка на универсальный язык понятий. Соответственно, Compreno включает в себя и сам этот универсальный язык понятий, который ABBYY 15 лет тайком разрабатывала в своих исследовательских лабораториях.
На февраль 2012 года мировых аналогов у Compreno нет, хотя в некоторых университетах и ведутся разработки в аналогичных направления. На руку компании играет и то обстоятельство, что последние 10 лет подавляющая масса исследований в мире велась в русле статистической модели машинного перевода.
Традиционные модели перевода
Успех обеспечил и правильный изначальный выбор направления для разработки системы автоматического перевода. В 90-е в мире правила одна королева - Rule-Based Translation Model, классическая модель перевода, основанная на ограниченном наборе готовых правил для некоторой пары языков. Одна из проблем RBTM - в накоплении все новых и новых правил, которые в какой-то момент просто начинают конфликтовать между собой. Анализируя предложение, мы можем применить разные комплекты правил, при этом машине неведомы приоритеты. Перевод, основанный на RBTM, как правило, не озабочен полным синтаксическим анализом: вместо него предложение делится на фреймы, на которые затем интерполируют существующие в системе правила для получения перевода. RBMT системы не учитывают семантику.
В начале XXI века усилиями Google мир подсел на иглу нового алгоритма перевода - так называемой статистической модели. Основа СМ - наличие обширной базы разнонаправленных переводов. Мы задаем статистическому движку предложение для перевода, он ищет в базе данных как в словаре варианты уже существующих переводов аналогичного текста и после незначительных изменений выдает вполне приличный результат.
Поскольку в СМ используются уже готовые человеческие переводы заведомо высокого качества, то на выходе получается весьма недурственный результат, ибо для осуществления перевода не нужно погружаться в синтаксис, специфику фразеологии конкретного языка и проч.
Все замечательно, однако, лишь до тех пор, пока дело не касается переводов в направлениях с так называемым низким покрытием (скажем, каким-нибудь, румынско-русским или тайско-венгерским).
Выход в рамках СМ для подобных ситуаций найден лишь паллиативный: работая с языками / темами низкого покрытия в качестве посредника используется английский язык. То есть сперва делается перевод с русского на английский, а затем уже с английского на, скажем, румынский, или тайский. В результате получается очень заметное снижение качества перевода.
Помимо сложностей с низкой плотностью переводов по направлениям, выпадающим из узкого мейнстрима, у СМ еще множество мелких изъянов. Например, статистическая модель совершенно убого справляется с переводами имен собственных.
Как бы там ни было, ABBYY изначально отказалась от Rule Based Translation Model и замахнулась на систему компьютерного перевода нового поколения. Надо сказать, что придумывать особо ничего не требовалось.
Универсальная Семантическая Иерархия (УСИ)
Проект Compreno исходил из трех основополагающих посылок:
использование качественного и бескомпромиссного синтаксического анализа.
создание универсальной когнитивной модели языка, возможность которой определяется аксиомой о том, что люди, хоть и живут в разных условиях и говорят на разных языках, однако в массе своей мыслят одинаково. Формы выражения мысли разные, а вот понятийный аппарат совпадает.
автоматизированное корпусное дообучение - лингвистические описания верифицируются и дополняются на основании статистической обработки корпусных данных.
Алгоритм машинного перевода на УСИ
Алгоритм машинного перевода, основанного на УСИ, выглядит следующим образом:
Лексический анализ текста (выделение слов, знаков препинания, цифр и прочих текстовых единиц);
Морфологический анализ (определение грамматических характеристик лексем);
Синтаксический анализ (установление структуры предложения);
Семантический анализ (выявление выражаемого значения в системе языка);
Синтез из универсальной семантической структуры предложения на выходном языке.
В результате подбор слов для перевода осуществляется не напрямую из первого языка, а из понятийного набора, который, условно говоря, «висит» на той же ветке универсального семантического дерева, но только уже со стороны второго языка.
Поскольку модель УСИ сквозная, нижестоящие элементы системы по иерархии наследуют признаки вышестоящих элементов. Это простое, казалось бы, обстоятельство позволяет добиваться беспрецедентной точности машинного перевода, поскольку каждое слово из переводимого предложения описывается максимальным набором понятийных эквивалентов, причем не только видового, но и родовых качеств на всех уровнях смысловой иерархии.
В УСИ предусмотрены взаимосвязи между элементами структуры, относящимися к разным классам, и эти связи также структурированы и формализированы, что позволяет выполнять многоуровневый понятийный анализ текста, также повышающий качество перевод.
Варианты применения
Перспективы, которые открывает Compreno, безбрежны и разнообразны:
компьютеризированный перевод текста с любого языка на любой на качественном уровне, несопоставимым со всеми распространенными сегодня системами перевода;
полноценный интеллектуальный поиск без специализированного синтаксиса запросов (Поиск по смыслу, извлечение фактов и связей между объектами поиска/мониторинга; мониторинг компаний и персоналий и построение аналитических отчетов на основе параметров разного типа и др.);
системы искусственного интеллекта самых разнообразных профилей и применений;
автоматическое распознавание речи;
классификация документов и поиск похожих документов по смыслу;
анализ тональности в мониторинге;
реферирование и аннотирование (написание краткого содержания длинных документов)
и это только начало.
Сложности применения технологии
Самым узким местом для глобального применения семантико-синтаксического анализа в массовых поисковых системах выступают очень высокие требования к компьютерным мощностям, необходимым для индексации информационных массивов на понятийном уровне. Требования эти несоизмеримо выше, чем при существующих формах традиционной индексации. Впрочем, уже сегодня методика семантико-синтаксического анализа может эффективно применяться (и применяется ABBYY - видел полностью функциональный прототип поискового движка собственными глазами) для более целенаправленного и узкого поиска в закрытых корпоративных системах.
Оценки технологии
Compreno - это полноценная, не имеющая аналогов в истории технологическая революция. Масштаб этой революции, значение ее для людей сопоставимы разве что с изобретением World Wide Web или электронной почты. Для наглядности можно перевести эту революцию в понятные материально-купюрные реалии: если ABBYY спокойно, без суеты коммерциализирует Compreno хотя бы в десятой части возможных ее практических применений, а затем выйдет на фондовый рынок, капитализация компании затмит всех кумиров сегодняшнего дня - от Apple, грамотно и стильно эксплуатирующего весьма и весьма посредственные в технологическом отношении решения, до Google, умудряющегося заводить в тупик охапками большую часть собственных перспективных начинаний.