
- •Історична довідка
- •Text Mining в системі управління знаннями
- •Класична схема обробки текстів передбачає кілька послідовних етапів:
- •Технологія аналізу тексту
- •Структурування тексту
- •Очищення і розбір тексту
- •Опис проблеми
- •Варіант вирішення завдання
- •Результати
- •Text Mining для аналізу неструктурованих даних
- •Застосування пошукових систем
- •Автоматизація добування інформації
- •Автоматизація аналітичних процедур
- •Основні технології Text Mining
- •1. Information Extraction (витяг інформації):
- •Пакети рішень Text Miming
- •Медіалогія http://www.Mlg.Ru
- •Ерам-Рішення http://www.Clarabridge.Ru
- •Інструментарій PolyAnalyst ™ пропонує клієнтам наступний функціонал:
- •Особливості системи PolyAnalyst ™:
- •Висновки
Інструментарій PolyAnalyst ™ пропонує клієнтам наступний функціонал:
Категоризація
Кластеризація
Прогнозування
Аналіз зв'язків
Знаходження ключових слів і пошук сенсу
Виявлення закономірностей
Знаходження аномалій
Особливості системи PolyAnalyst ™:
Глибокий всебічний аналіз текстових і структурованих даних
Масштабованість
Гранична простота використання (Keep It Simple)
Потужна, багатоцільова аналітика
Створення гнучких звітів
Зручне планування завдань і генерація оповіщень
Просте взаємодія з вже існуючими рішеннями
Висновки
В силу інерції мислення масова аудиторія з недовірою ставиться до того, що машина може оперувати поняттями фактів, подій, персон, організацій і т. п. В основному саме це змушує нас відмовлятися від технологій Text Mining і завантажувати себе ручною обробкою результатів пошуку. Є, звичайно, і об'єктивні труднощі. Методи Text Mining повинні бути адаптовані до предметної області, що нерідко вимагає тимчасових і інших ресурсів. Деякі типи текстів (наприклад, художня література, професійний та іншої сленг) погано піддаються машинній обробці.
Технології видобутку інформації з неструктурованих текстів (Text Mining) використовуються на практиці вже сьогодні, оскільки обсяги доступною і корисною інформацією ростуть з кожним днем, а потреба в їх аналізі є досить актуальною.