
Парсинг
Синтакси́чний ана́ліз (па́рсинг) (англ. parsing) — в інформатиці це процес аналізу вхідної послідовності символів, з метою розбору граматичної структури згідно із заданою формальною граматикою. Синтаксичний аналізатор (англ.parser) — це програма або частина програми, яка виконує синтаксичний аналіз.
Під час синтаксичного аналізу текст оформлюється у структуру даних, зазвичай — в дерево, яке відповідає синтаксичній структурі вхідної послідовності, і добре підходить для подальшої обробки. Зазвичай синтаксичні аналізатори працюють в два етапи: на першому ідентифікуються осмисленітокени (виконується лексичний аналіз), на другому створюється дерево розбору. (1)
Три фази парсинга є логічними стадіями процесу: спочатку це пунктуальний збір інформації, наприклад, це може бути код інтернет-сторінки. Потім аналіз даних, обробка і перетворення в потрібний формат. Нарешті - надання результату, висновок даних. Найбільш часто парсинг спирається на систему регулярних виразів.(2)
Як правило, результатом синтаксичного аналізу є синтаксичну будову пропозиції, представлене або у вигляді дерева залежностей, або у вигляді дерева складових, або у вигляді деякого поєднання першого і другого способів подання.
Відновлення після помилок
Найпростіший спосіб реагування на некоректний вхідний ланцюжок лексем - завершити синтаксичний аналіз і вивести повідомлення про помилку. Однак часто виявляється корисним знайти за одну спробу синтаксичного аналізу якомога більше помилок. Саме так поводяться транслятори більшості поширених мов програмування.
Таким чином перед обробником помилок синтаксичного аналізатора стоять наступні завдання:
він повинен ясно і точно повідомляти про наявність помилок;
він повинен забезпечувати швидке відновлення після помилки, щоб продовжувати пошук інших помилок;
він не повинен істотно уповільнювати обробку коректної вхідного ланцюжка. (1)
Інформаційна діяльність Росії щодо України
Від часу проголошення незалежності України Російська Федерація веде постійну інформаційну війну проти України. Особливо вона була інтенсифікована в роки правління проросійського режиму Януковича. Від початку агресії Російської Федерації (лютий 2014) російська пропаганда набула форм Геббельсівської пропаганди часів Другої світової війни . З метою дискредитації українських діячів використовуються провокаційні заяви нібито від їх імені на підставі яких у той же день державні органи Російської Федерації порушують кримінальну справу. Громадяни Російської Федерації та аудиторія російських телеканалів в інших країнах — Перший канал (Росія), Росія-24та інших — свідомо вводиться в оману керівництвом Російської Федерації.
Інформаційна політика Російської Федерації набула характеру цілеспрямованої інформаційної війни проти України: необ'єктивність, перекручування фактів, відверта неприхована брехня, путінсько-кремлівська пропаганда як частина політики Кремля в цілому. Робота ЗМІ ведеться за типомжовтої преси. Залучена величезна кількість акторів — громадян Росії, України та інших країн — а також інших спеціалістів на території України для отримання потрібної телевізійної картинки.
Протягом кількох місяців здійснюються DDOS-атаки на українські інформаційні сайти: Цензор. НЕТ, Тиждень.ua,Українська правда та інші,— а також на сайт МВС України, з появою на ньому оголошення у розшук В. Януковича.
Представники керівництва та дипломати Російської Федерації у своїх виступах, включаючи й виступи в ООН, розповсюджують неправдиву інформацію. Під час прес-конференції в Москві на пряме запитання журналіста, чи для блокування українських військових частин використовуються військові Російської Федерації, президент РосіїВолодимир Путін заявив, що це сили «кримської самооборони» і що РФ ніякої участі у підготовці цих сил не брала[55]. Однак, аналіз світлин бойової техніки, що блокує українські військові частини у Криму (за матеріалами російського видання The New Times), свідчить, що за номерними знаками це військові автомобілі Північно-HYPERLINK "http://uk.wikipedia.org/wiki/Північно-Кавказький_військовий_округ" Кавказького військового округу, на борту однієї з машин видно значок гвардійської дивізії, який забули закамуфлювати, а також модифікації стрілецької зброї (наприклад, самозарядна снайперської гвинтівки Драгунова), що офіційно надходить на озброєння тільки до російських військових[56],— все це вказує на використаннязбройних сил Російської Федерації для ескалації конфлікту в Криму.
Звинувачення України в антисемітизмі
Представники єврейської громади України, звернулися із відкритим листом до В. Путіна, щоби прояснити реальну ситуацію із правами росіян в Україні, де вказали, що вони «впевнені», що його «неможливо ввести в оману.» А це означає, що він «сам свідомо вибирає із маси інформації про Україну неправду й наклепи.» І йому добре відомо, що слова Януковича під час прес-конференції у Ростові-на-Дону, про те, що «… Київ був заповнений озброєними людьми, котрі почали громити будівлі, культові установи, храми.<…> Людей просто грабували й убивали на вулицях» — це брехня від першого й до останнього слова. Вони також вказали, що В. Путін «переплутав Росію й Україну», коли говорив про ріст антисемітизму в Україні. Навпаки, у Росії єврейські організації зафіксували минулого року зростання антисемітизму. В Україні ж, навіть націоналістичні групи не дозволяють собі демонструвати антисемітизм та інші форми ксенофобії. В Росії ж неонацистські організації заохочуються спецслужбами. У листі також вказано, що "стабільність в нашій країні під загрозою. І ця загроза виходить від російської влади, тобто — від Вас. Це Ваша політика підбурювання до сепаратизму і грубого тиску на Україну являє загрозу для нас — євреїв, як і для всього народу України, включно із жителями Криму та південного сходу України, і вони в цьому дуже швидко переконаються
Оцінку інформаційної війни проти України 7 березня дав Євген Марчук — екс-голова СБУ, раніше — прем'єр-міністр, міністр оборони та секретар РНБО України. Він вказав також на потрібні на сьогодні заходи державних органів, щоб протидіяти інформаційній та військовій агресії Російської Федерації[58].
Інформаційну війну, що є інформаційним забезпеченням агресії Російської Федерації проти України, відомий російський політик Борис Нємцов охарактеризував як війну нацистського режиму проти демократичної держави: «Виграти війну можуть нацисти із Геббельсом на чолі. Те, що Україна програла інформаційну війну - це факт. Але те, що ви не повинні з цього приводу дуже переживати - це теж факт. Ви ж не нацистська держава», - сказав російський опозиціонер
Інформаційні атаки агресора
6 березня на території АРК відключили телеканали «1+1» і 5-ий. Ще раніше російський телеканал «Россия 24» захопив ефірні частоти кримської приватної «Чорноморської телерадіокомпанії». Було також заблоковано державну телерадіокомпанію «Крим» у Сімферополі особами у камуфляжній формі без зброї. Генеральний директор ТРК Степан Гулеватий викликав міліцію, але вона не реагувала на виклик
6 березня 2014 р. на сайті телеканалу АТR був проведений інтернет-референдум, під час якого можна було висловити свою думку щодо приєднання Криму до РФ. Більшість людей, які прийняли участь у голосування, висловилась проти. [61] Тому вже 7 березня російські військові у Криму відключили від інтернету перший кримськотатарський телеканал АТR. Того ж дня вони зупинили ефірне аналогове мовлення українського телеканалу «Інтер», на частотах якого транслюється НТВ.[61]
ЩОДО ІНФОРМАЦІЙНО-ПСИХОЛОГІЧНОЇ СКЛАДОВОЇ АГРЕСІЇ РОСІЙСЬКОЇ ФЕДЕРАЦІЇ ПРОТИ УКРАЇНИ (за результатами подій 1-2 березня 2014 року)
Намагання Російської Федерації провести кампанію із введенням збройних сил до АР Крим супроводжувалось діями, які мали всі ознаки підготовленої та продуманої за цілями, заходами та наслідками інформаційно-психологічної спецоперації, скерованої в першу чергу на російську аудиторію, а з іншого боку на українську та західну аудиторію.
Ключовими завданнями цієї спецоперації було:
1. Деморалізація населення України.
2. Деморалізація особового складу збройних сил та силових відомств, а також спонукування їх до державної зради й переходу на бік супротивної сторони.
3. Формування у громадян Росії та України викривленого «медіа бачення» подій, що відбуваються, а не їх дійсних причин та наслідків.
4. Створення вигляду масової підтримки дій РФ з боку населення Південно-Східних регіонів.
5. Психологічна підтримка українських прихильників радикального зближення регіонів Сходу й Півдня України з РФ.
Зазначені завдання реалізувались через майже повний спектр каналів комунікацій, до яких передусім слід віднести:
Традиційні ЗМІ.
Електронні ЗМІ (телебачення).
Інтернет ЗМІ.
Соціальні мережі.
При цьому використовувалися усі методи інформаційно-психологічної боротьби – від розміщення тенденційною інформації та напівправди до неприхованої неправди («фейку»).
Фрейм
Фрейм (англ. frame — «каркас, остов», «будова, структура, система», «рамка», «окремий кадр фільму» та ін.) — структура, що репрезентує стереотипні ситуації у свідомості (пам'яті) людини або інтелектуальної системи і призначена для ідентифікації нової ситуації, що базується на такому ситуативному шаблоні.
Фрейм, за визначенням М. Мінського, є ієрархічно впорядкованою репрезентацією певної стандартної ситуації дійсності. У формальній нотації він може бути представлений у вигляді графової структури, де головна позначає об'єкт (наприклад, «кімната»), а підпорядковані вершини-елементи цього об'єкта, які можна спостерігати з певних позицій . Вважається, що у довгостроковій пам'яті людини зберігається великий набір різноманітних фреймів, що актуалізуються під час пред'явлення нових сцен. Для розпізнавання сцен в пам'яті людини має актуалізуватися саме той фрейм, що якнайбільше відповідає гіпотезі про об'єкт, який сприймається. У такий спосіб здійснюється ідентифікація об'єкта у свідомості людини. Наприклад, інтелектуальна система, що використовує фрейм «кімнати», має змоделювати здатність людини, що входить до кімнати, охопити все єдиним поглядом, скласти уявлення про те, що є у кімнаті, як розставлені меблі, скільки у кімнаті вікон тощо.
Фрейм репрезентує у свідомості людини (або у її комп'ютерній моделі) не лише стереотипну ситуацію, але водночас і зв'язки цієї структури з деякими іншими видами інформації, зокрема, з інформацією про те, як користуватися фреймом та що слід робити, коли сподівання не виправдовується. Один із провідних дослідників у галузі штучного інтелекту Р. Шенк наголошував, що «винахід фрейму» став справжньою сенсацією для штучного інтелекту; ця структура виявилася надзвичайно важливою не тільки для вирішення проблеми розпізнавання візуальних образів, але майже одразу для створення моделей розуміння природної мови.
Структура фрейму включає три основні типи даних; поняття(назва фрейму), характеристика (назва термінала—вершини нижнього рівня), значення характеристики (заповнювач термінала). У зв'язку з цим можна вважати, що у фреймі реалізовано деякі загальні принципи, що властиві організації без даних, де як одиниці виділяються об'єкти, характеристики та їхні значення, а також семантичним сіткам, у яких розрізняють абстрактний та конкретний рівень. Фрейм надає засоби організації знань у слотах , що містять характеристики та структури. В моделі фрейму—це щось на зразок схеми з категоріями і під категоріями. Фрейм—це абстрактний образ для представлення деякого стереотипу сприйняття. Наприклад, згадування слова «кімната» породжує у слухачів образ кімнати: житлове приміщення з чотирма стінами, стелею, підлогою, вікнами та дверима, площею приблизно 6—20 м².
В теорії фреймів такий образ кімнати називають фреймом кімнати, фреймом також називають і формалізовану модель для представлення образу. З такої моделі не можна нічого забрати, але є можливість заповнення певних дірок в атрибутах, таких, як кількість вікон, колір стін, висота стелі, покриття підлоги та інше. Розрізняють фрейми—взірці або прототипи, які зберігаються в базі даних, та фрейми—екземпляри, котрі створюють для відображення фактичних ситуацій на основі даних, що надійшли. Модель фрейму є достатньо універсальною, оскільки дозволяє відобразити все різноманіття знань через фрейми структури, які використовуються для позначень об'єктів та понять (позика, заклад, вексель); ролей (менеджер, касир, клієнт); сценаріїв (банкрутство, зібрання акціонерів, святкування уродин); ситуацій (тривога, аварія, робочий режим пристрою) і т. д.
Останнім часом спектр застосування концепції фреймів суттєво розширений: до нього увійшли лінгвістична семантика, когнітивна теорія метафори, прикладна семіотика, теорія репрезентації ментальних станів та дій тощо.
Особлива чутливість до концепції фреймів та успішна асиміляція цієї концепції в лінгвістиці пояснюється тим, що по суті фрейм не є для неї абсолютно новим поняттям. Прямими аналогами або лінгвістичними прообразами такої концепції можна вважати ті лінгвістичні напрями, що займаються відмінковими «рамками» дієслів. Це насамперед відома «глибинно-відмінкова граматика» (Ч. Філлмор), а також концепція ситуаційно-рольового тлумачення лексичних значень та тематичних груп (Ю. Д. Ампресян, О. К. Жолковський, Ю.С. Мартем'янов, В. Ю. Розенцвейг, Ю. К. Щеглов та інші); теорія семантичних полів Й. Трира, концепція репрезентації певних типів лексичних значень мовою думок Lingua mentalis А. Вежбицької тощо. Найзначніші теоретичні та прикладні результати дає використання фреймів для розроблення систем розуміння природної мови.
Серед теоретичних результатів варто насамперед згадати запропоновану Ч. Філлмором концепцію двох семантик, що спирається на використання фреймів.
Фреймові концепції
Аналізуючи роль фреймів у моделюванні розуміння природної мови, Ч. Філлмор розрізнює дві семантики: семантику, орієнтовану на розуміння (Р-семантику), та семантику, орієнтовану на визначення істинності висловлювань (І-семантику). При цьому Р-семантика оперує поняттям інтерпретуючого опису семантики лексем, граматичних категорій та тексту. Найбільш «концентроване» застосування фрейм знаходить у теорії розуміння Ч. Філлмора, яку він називає Р-семантикою другого рангу. Така семантика включає три компоненти: композиційну семантику (фреймову структуру тексту), практичне міркування, що ґрунтується на використанні фреймових знань (знань про реальність) та забезпечує виявлення імпліцитних семантичних зв'язків між висловлюваннями в тексті; міркування, що спирається на знання про комунікативні наміри, репрезентовані у фреймовій формі. У ситуації міркування природно-мовне виведення розглядається як сукупність операцій над елементами фреймів.
Використанню фреймів у моделях розуміння смислу зв'язаного тексту присвячені дослідження Р. Шенка та його колег. У їх концепції проголошується центральна роль каузального зв'язку в організації смислової структури тексту. Смисл, за Шенком, це концептуальна структура, а експлікатом такої концептуальної структури є каузально зв'язаний ланцюг подій. Події, в яких зливається найбільша кількість каузальних ланцюжків, утворюють понятійний стрижень—фабулу розповіді. Зв'язність тексту має визначатися через каузальну інтерпретацію концептуальних структур, з яких складається текст. Причинні зв'язки, що поєднують певну подію з іншою, мають виявляти смисл цієї події з точки зору ширшого контексту. Це останнє завдання і виконує фрейм-структура.
Р. Шенк розрізняє два типи фреймових структур: сценарії та плани, що складаються з послідовності елементарних дій. Елементарні дії об'єднані в певні класи, наприклад, клас PTRANS означає «переміщати» (про фізичні об'єкти), клас MTRANS—«переміщати» (про мисленнєві операції), клас MOVE—«рухатися» тощо. Під сценарієм Р. Шенк розуміє детермінований каузальний ланцюг концептуалізацій, що описує стандартний перебіг подій у будь-якій відомій ситуації. Окремі події зв'язані між собою за принципом причинно-наслідкового ланцюга: результатом кожної дії стає ситуація, де є можливою чергова подія. Основна функція сценарію полягає у керуванні процесом виведення наслідків. Сценарії описують стандартні, типові ситуації реальності; вони складаються з назви ситуації, ролей, тобто імен учасників ситуації, переліку причин виникнення певної ситуації та набору сцен, де кожна сцена описана як набір елементарних дій. Так, сцена «вхід до ресторану», що входить до сценарію «Відвідання ресторану», може бути описана як послідовність таких елементарних дій: PTRANS—увійти в ресторан; MTRANS—знайти вільний стілець; MOVE—сісти тощо.
Плани — це засіб, за допомогою якого встановлюється причинно-наслідкові зв'язки між сценаріями. План описує стандартну послідовність дій людини в тому чи іншому випадку; він складається із сцен та сценаріїв, що ведуть до певної мети.
Своєрідний фреймовий підхід розвивається у моделях Є. Чарняка, що оперують «системами знань», налаштованими на розуміння коротких дитячих розповідей та логічне виведення наслідків. Коментуючи історію формування фреймового підходу на матеріалі підходу Є. Чарняка, Х. Ийм та М. Салувеєр підкреслюють, що шлях до визнання фреймів у цьому випадку пролягав через відмову від так званої концепції «демонів», у певному відношенні близьку до концепції фреймів.
Під демонами у теорії розпізнавання образів розуміють певного типу факти та правила, зв'язані з деякими ключовими поняттями та темами. Коли у тексті експліцитно або імпліцитно згадується відповідна тема, зв'язані з нею демони актуалізуються. Їх функція полягає у додаванні інформації, зосередженої у знаннях, до інформації, безпосередньо представленої у тексті. Наприклад, один з демонів, що зв'язаний з поняттям «дощ», є такий: «якщо йде дощ, а Р знаходиться ззовні, то Р стає мокрим». Проте використання демонів породжує багато проблем. Зокрема, якщо у тексті згадується «ключова» тема, вона автоматично «збуджує» всіх зв'язаних з нею демонів. Крім того, виявляється, що демони не дають можливості з'ясовувати часові співвідношення подій. Для подолання таких проблем Є. Чарняк звертається до фрейм-структури. У його трактуванні фрейм складається з так званих «фреймових тверджень», що описують у досить загальних категоріях окремі дії та їх етапи. Кожне речення у розповіді, що аналізується, інтерпретується як реалізація одного або кількох фреймових тверджень. У процесі аналізу тексту конструюється його «фреймове зображення», та ведеться обмін того, які частини фрейму та до якої межі вже реалізовані у тій послідовності подій, що детермінована фреймом. Це дає змогу реконструювати «правильний» хід подій у процесі аналізу розповіді, де окремі події описуються не у жорсткому часовому порядку.
На відміну від наведених вище фреймових концепцій Ч. Філлмора, Р. Шенка, Є.Чарняка, де впевнено проголошується велика креативна спроможність фрейму як категорії репрезентації знань у моделях розуміння природної мови, у праці Й. Уілка «Сім тез про штучний інтелект та природну мову» висловлюється вкрай скептичне ставлення до основних положень та результатів теорії фреймів. Й. Уілкс вважає, що фрейми виявляються надто конкретними структурами, у той час як актуальним завданням досліджень у галузі моделювання розуміння природної мови залишається створення загальної теорії репрезентації знань. Якщо розвивати далі фреймовий підхід у такому ж напрямі, то, на думку Й. Уілкса, потрібно буде постійно розробляти все нові і нові фрейми: від ресторанів та універмагів до виготовлення їжі, садівництва тощо.
Ще однією вадою фреймового підходу Й. Уілкс вважає також відсутність критеріїв для вирішення питання про те, коли варто актуалізовувати знання, які містяться у фреймі ,що тільки вносить плутанину в аналіз тексту. Інакше кажучи, йдеться про заперечення механічного принципу застосування фреймів. На підтвердження своєї думки Й. Уілкс наводить такий приклад: «По дорозі до ресторану «Орфей» Джон зайшов до універмагу. І весь час думав про ритуали ініціації, які він побачив у телепрограмі». Якщо для розуміння цього тексту, розмірковує Й. Уілкс, механічно вжити метод фреймів, то для цих речень були б вибрані чотири великих фрейми: «ресторани», «універмаги», «ритуали ініціації», «телебачення», які навряд чи мають відношення до їх тлумачення.