Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
04.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
294.4 Кб
Скачать

Пакети рішень Text Miming

Аналітичні системи для роботи з текстами документів потрібні для комплексного аналізу предметної області у великих інформаційних сховищах (архівах) документів.

Результати аналітичної обробки документів моніторингу предметних областей використовуються в математичному прогнозуванні та аналізі ринків і соціальної обстановки.

В даний час пропонується досить багато інструментів текстомайнінга - від відносно простих програм, що спираються на статистичний аналіз окремих термінів у текстах, таких як WordStat, до найскладніших додатків типу Aerotext і Businessobjects Text Analysis.

З розвитком Інтернету аналіз, що базується на ТМ, може реалізовуватися не лише за допомогою впроваджуваних в організації додатків, але і у вигляді онлайнового сервісу. Останнім часом ТМ аналіз множинних відкритих джерел інформації стає доступним для комерційних, політичних та інших організацій за рахунок появи саме таких онлайнових служб.

Медіалогія http://www.Mlg.Ru

Автоматична система моніторингу і аналізу ЗМІ у режимі реального часу. Система складається з бази даних ЗМІ і автоматизованого аналітичного модуля, який дозволяє проводити самостійний пошук та аналіз за кількісними та якісними характеристиками за будь-який заданий період. Результати доступні миттєво.

У базу даних цілодобово надходить близько 10 000 ЗМІ: інформагентства, газети, журнали, радіо, Інтернет і блоги. Також доступні текстові версії телепрограм основних федеральних телевізійних каналів: 1-ий канал, Росія, НТВ, РЕН-ТВ, ТВЦ, РБК.

З Медіалогія працюють прес-служби публічних комерційних організацій і державних установ. Робота з системою дозволяє здійснювати оперативний цілодобовий контроль інформаційного поля, вивантажувати необхідні тексти в традиційний формат моніторингу, а також проводити щомісячний аналіз самостійно з результатами у вигляді графіків і таблиць.

Для ознайомлення з роботою системи можна переглянути вебінар (http://connect1.webinar.ru/play/medialogia/13228-2708)

Ерам-Рішення http://www.Clarabridge.Ru

Використання даних з неструктурованих джерел дозволяє приймати більш ефективні бізнес-рішення. При цьому, за даними Gartner, неструктуровані документи складають більше 80% корпоративних даних, а кількість зовнішніх джерел (інтернет-ресурсів, блогів, форумів, ЗМІ) обчислюється мільйонами. В них міститься величезна кількість даних, які можуть забезпечити компанії значну конкурентну перевагу. Основне питання - ефективність та швидкість витягання і аналізу цінної інформації.

ЕРАМ Systems пропонує власний підхід до аналізу неструктурованої інформації для вирішення бізнес-завдань, заснований на досвіді найбільших компаній світу і можливості сучасних технологій (Text Mining, Opinion Mining, Business Intelligence, OLAP, Data Mining). У партнерстві з компанією Clarabridge, лідером в області створення аналітичних інструментів управлінського рівня, ЕРАМ надає послуги з консалтингу та розробки систем підтримки прийняття рішень, які дозволяють підвищити ефективність:

  • маркетингових досліджень

  • програм лояльності клієнтів

  • процесу розробки продуктів і послуг

  • контролю якості

  • ризик-менеджменту

  • управління досвідом клієнтів (Customer Experience Management - CEM).

Нижче наведено кілька прикладів роботи технологічної зв'язки пошуку - видобутку - аналізу неструктурованої інформації, реалізованих на базі платформи Clarabridge. Вони ілюструють лише частину можливостей такого роду інструментів. Функціонал рішення може бути набагато ширше.

Система, побудована за принципом технологічної зв'язки, дозволяє складати різного роду рейтинги і прогнози на основі інформації, що міститься у відкритих і корпоративних джерелах. Так, при розрахунку рейтингу згадуваності автомобільних брендів в новинах, що публікуються на сайті Yandex, система знайшла посилання, витягла факти, виявила зв'язку між ними, структурувала отриману інформацію і провела її аналіз (див. рис. 1).

Рис. 1. Рейтинг популярності автомобільних брендів в онлайнових новинних джерелах

Оскільки процес автоматизований, користувач відразу отримує готовий інформаційний продукт, що дозволяє судити про те, які позитивні (негативні) якості асоціюються з кожним з представлених брендів і як з часом змінюються думки покупців. Якщо кнопкою миші клацнути на тій чи іншій частині графіка - наприклад демонструє падіння рейтингу BMW, - система підкаже причини цього падіння (в даному випадку причиною став відкликання автомобілів з ринку).

Крім того, технологічні комплекси, подібні Clarabridge, можуть використовуватися для виявлення "голосу клієнта" або "дихання ринку" - аналізу листування, заміток call-центрів, новинних статей в ЗМІ і Інтернеті, думок покупців на онлайнових форумах і в блогах. При цьому інформація з неструктурованих документів інтегрується з даними з CRM-систем та інших джерел.

Так, для порівняльного аналізу популярності тарифів стільникових операторів, обговорюваних на Інтернет-форумах, система проаналізувала більше 20 форумів і блогів, витягла факти відповідно до встановлених класифікаторами і обмежувачами, провела порівняльний аналіз і представила дані в зручному для прийняття рішень вигляді (див. рис . 2).

Рис. 2. Тенденції згадуваності тарифів

Аналіз тенденцій різних тарифів дозволяє побачити розвиток їх популярності і причини, що стоять за цим, а також змоделювати та спрогнозувати просування нових тарифів. При цьому ті чи інші показники можна деталізувати до рівня вихідного тексту, що дає можливість проводити аудит інформації з метою перевірки достовірності даних і коректності налаштувань системи.

TextAnalyst ™ http://www.analyst.ru/

TextAnalyst ™ інструмент для аналізу змісту текстів, змістовного пошуку інформації, формування електронних архівів, надає користувачеві наступні основні можливості:

  • Аналіз змісту тексту з автоматичним формуванням семантичної мережі з гіперпосиланнями - отримання змістовного портрету тексту в термінах основних понять і їх змістовних зв'язків.

  • Аналіз змісту тексту з автоматичним формуванням тематичного древа з гіперпосиланнями - виявлення семантичної структури тексту у вигляді ієрархії тем і підтем.

  • Змістовний пошук з врахуванням прихованих змістовних зв'язків слів запиту зі словами тексту.

  • Автоматичне реферування тексту - формування його змістовного портрету в термінах найбільш інформативних фраз.

  • Кластеризація інформації - аналізу розподілу матеріалу текстів по тематичних класах.

  • Автоматична індексація тексту з перетворенням в гіпертекст.

  • Ранжування всіх видів інформації про семантику тексту за «ступенем значимості» з можливістю варіювання детальності її дослідження.

  • Автоматичне / автоматизоване формування повнотекстової бази знань з гіпертекстової структурою і можливостями асоціативного доступу до інформації.

PolyAnalyst ™ http://megaputer.ru/

Аналіз даних. Аналіз тексту. Єдиний інструментарій.

Система PolyAnalyst ™ дозволяє отримати практично корисні знання з великої кількості текстових і структурованих даних, передає ці знання в доступній для розуміння формі та у вигляді оперативно застосовуваних моделей для прийняття відповідальних бізнес-рішень.

  • PolyAnalyst ™ дозволяє створювати багатоступеневі сценарії аналізу даних і форми звітів за допомогою простого drag-and-drop інтерфейсу.

  • PolyAnalyst ™ надає користувачам результати, отримані з прогнозів, в доступних для розуміння формах, які полегшують прийняття зважених рішень.

Охоплюючи повний цикл аналізу даних, починаючи з імпорту та перетворення даних і закінчуючи звітами, PolyAnalyst ™ пропонує повний набір алгоритмів для автоматичного аналізу текстових і структурованих даних. Система PolyAnalyst ™ вже вирішила багато проблем аналізу даних у різних сферах діяльності.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]