
- •1. Методи індивідуального творчого пошуку альтернативних варіантів.
- •Методи колективного творчого пошуку альтернативних варіантів.
- •Визначення поняття "контент-аналіз".
- •4 Основні напрямки застосування контент-аналізу:
- •5. Основні процедури контент-аналізу.
- •1. Визначення категорій контент-аналізу.
- •2. Виявлення одиниць аналізу, якими можуть бути:
- •3. Виділення одиниць рахування.
- •Завершальною стадією дослідження є інтерпретація його результатів.
- •Дослідницькі інструменти контент-аналізу.
- •Визначення поняття "інтелектуальний аналіз даних".
- •Основні задачі інтелектуального аналізу даних.
- •9 Приклади практичного застосування інтелектуального аналізу даних.
- •10. Призначення та основні можливості TextAnalyst 2.01
- •11. Призначення та основні можливості rco Fact Extractor.
- •12. Види інформаційно-аналітичних документів
- •13 Важливі принципи підготовки інформаційно-аналітичних документів.
- •3. Важливі принципи підготовки інформаційно-аналітичних документів
- •3.1. Що ж таке стислість і чим вона досягається?
- •3.1.1. Уникайте плеоназмів
- •3.1.2. Використовуйте штампи й кліше
- •3.2. Переконливість
- •3.3. Загальнодоступність (ясність)
- •14. Основні вимоги до заголовку інформаційно-аналітичного документу.
- •4.1. Заголовок
- •15. Основні вимоги до вступу інформаційно-аналітичного документу.
- •16 Принцип "перевернутої піраміди" (побудова основного тексту документу).
- •Назвіть групи окремих показників ефективності іар.
- •Шляхи підвищення ефективності іар.
- •Наукова організація праці
- •3. Підвищення продуктивності праці при виконанні окремих операцій і автоматизація процесів діяльності
- •3.1. Конвертування графічних повідомлень у текст
- •3.2. Конвертування мовних повідомлень у текст
- •3.3. Усунення надмірності текстових повідомлень
- •3.4. Машинний переклад
9 Приклади практичного застосування інтелектуального аналізу даних.
Роздрібна торгівля
Підприємства роздрібної торгівлі сьогодні збирають докладну інформацію щодо кожної окремої покупки, використовуючи кредитні картки з маркою магазину та комп'ютеризовані системи контролю. Ось типові завдання, які можна вирішувати за допомогою Data Mining в сфері роздрібної торгівлі:
• аналіз купівельної корзини (аналіз подібності) призначений для виявлення товарів, які покупці прагнуть купувати разом. Знання купівельної корзини необхідно для поліпшення реклами, вироблення стратегії створення запасів товарів і способів їх розкладки в торгових залах.
• дослідження часових шаблонів допомагає торговельним підприємствам приймати рішення про створення товарних запасів. Воно дає відповіді на питання типу "Якщо сьогодні покупець придбав відеокамеру, то через який час він найімовірніше купить нові акумулятори і касету?"
• створення прогнозуючих моделей дає можливість торговельним підприємствам дізнаватися про характер потреб різних категорій клієнтів з певною поведінкою, наприклад, що купують товари відомих дизайнерів або відвідують розпродажі. Ці знання потрібні для розробки точно спрямованих економічних заходів з просування товарів.
Банківська справа
Досягнення технології Data Mining використовуються в банківській справі для вирішення наступних поширених завдань:
• виявлення шахрайства з кредитними картками. Шляхом аналізу минулих транзакцій, які згодом виявилися шахрайськими, банк здатний виявити деякі стереотипи такого шахрайства. Наприклад, можна встановити, що одним з попереджуючих сигналів служать численні транзакції в магазинах побутової електроніки протягом короткого періоду часу. Отримане знання банк може використовувати у своїх діючих системах, не дозволяючи підтвердження транзакції, що збігаються зі стереотипом шахрайства, без попередньої бесіди з покупцем.
• сегментація клієнтів. Розбиваючи клієнтів на різні категорії, банки можуть зробити свою маркетингову політику більш цілеспрямованої і результативної, пропонуючи різні види послуг різним групам клієнтів. Наприклад, банк може пропонувати одну спільну (affinity) картку клієнтам, які часто подорожують, а іншу - клієнтам, які завжди вчасно оплачують свої рахунки за покупки по кредитних картках. Сегментацію корисно також використовувати для визначення, які конкретно відділення з найбільшою ймовірністю отримають прибуток від окремих рекламних акцій.
• прогнозування змін клієнтури. Data Mining допомагає банкам будувати прогнозні моделі цінності своїх клієнтів, і відповідним чином обслуговувати кожну категорію. Для цього банк з'ясовує характер потреб своїх сьогоднішніх прибуткових клієнтів і за допомогою методів Data Mining визначає загальні риси, якими вони володіли кілька років тому. Потім він виявляє клієнтів, які мають ці риси сьогодні, вважаючи їх вірогідними прибутковими клієнтами в найближчому майбутньому. Банк може включити зазначених клієнтів у цільові програми утримання клієнтів, наприклад, пропонуючи спеціальні угоди або вводячи штрафні санкції за відмову від подальших послуг.
Телекомунікації
В області телекомунікацій є характерним зростаючий рівень конкуренції. Тут методи Data Mining допомагають компаніям більш активно просувати свої програми маркетингу і ціноутворення, щоб утримати існуючих клієнтів і залучити нових. У число типових заходів входять наступні:
• аналіз записів про детальні характеристики дзвінків. Призначення такого аналізу - виявлення категорій клієнтів зі схожими стереотипами користування їх послугами та розробка привабливих наборів цін і послуг;
• виявлення лояльності клієнтів. Деякі клієнти весь час змінюють провайдерів, користуючись програмами нових компаній, які стимулюють появу нових клієнтів. Data Mining можна використовувати для визначення характеристик клієнтів, які, один раз скориставшись послугами даної компанії, з великою часткою ймовірності залишаться їй вірними. У результаті кошти, які виділяються на маркетинг, можна витрачати там, де віддача найбільше.
Страхування
Страхові компанії протягом багатьох років накопичують великі обсяги даних. Тут велике поле діяльності для методів Data Mining:
• виявлення шахрайства. Страхові компанії можуть знизити рівень шахрайства, шукаючи певні стереотипи в заявах про виплату страхового відшкодування, що характеризують взаємовідносини між юристами, лікарями та заявниками у випадках, коли необхідна сума досить висока, наприклад при відшкодуванні шкоди;
• розробка продуктів. Data Mining надасть можливість виявити найбільш вигідні комбінації категорій клієнтів, варіантів полісів та їх покриття. Знання таких комбінацій необхідно для розробки нових продуктів і більш точного "налаштування" існуючих продуктів для продажу в майбутньому;
• аналіз ризику. Шляхом виявлення сполучень факторів, що пов'язані з оплаченими заявами, страховики можуть зменшити свої втрати за зобов'язаннями. Відомий випадок, коли в США велика страхова компанія перевірила заяви, за якими були виплачені значні суми за останні два роки. При цьому виявилося, що суми, сплачені за заявами людей, які перебувають у шлюбі, удвічі перевищують суми за заявами одиноких людей. Компанія відреагувала на це нове знання переглядом своєї загальної політики надання знижок сімейним клієнтам.
Інші програми в бізнесі
Data Mining може застосовуватися у безлічі інших областей:
• сегментація ринку. Всі галузі можуть скористатися методами Data Mining для виявлення окремих сегментів своєї клієнтури. Data Mining дає підприємствам можливість враховувати набагато більше параметрів, ніж це робилося на основі традиційних методів зберігання неструктурованої інформації;
• розвиток автомобільної промисловості. При зборці автомобілів виробники починають враховувати вимоги кожного окремого клієнта, тому їм потрібні можливість прогнозування популярності певних характеристик і знання того, які характеристики зазвичай замовляються разом;
• політика гарантій. Виробникам потрібно передбачати число клієнтів, які подадуть гарантійні заявки, і середню вартість заявок;
• заохочення часто літаючих клієнтів. Авіакомпанії можуть виявити групу клієнтів, яких даними заохочувальними заходами можна спонукати літати більше. Наприклад, одна авіакомпанія виявила категорію клієнтів, які здійснювали багато польотів на короткі відстані, не накопичуючи досить миль для вступу в їх клуби, тому вона таким чином змінила правила прийому в клуб, щоб заохочувати число польотів так само, як і милі.
Спеціальні програми
• Медицина
Відомо багато експертних систем для постановки медичних діагнозів. Вони побудовані головним чином на основі правил, що описують поєднання різних симптомів різних захворювань. За допомогою таких правил дізнаються не тільки, чим хворий пацієнт, але і як потрібно його лікувати. Правила допомагають вибирати засоби медикаментозного впливу, визначати показання - протипоказання, орієнтуватися в лікувальних процедурах, створювати умови найбільш ефективного лікування, передбачати наслідки призначеного курсу лікування і т. п. Технології Data Mining дозволяють виявляти в медичних даних вказані правила.
• Молекулярна генетика і генна інженерія
Мабуть, найбільш гостро і разом з тим чітко завдання виявлення закономірностей в експериментальних даних стоїть в молекулярної генетиці та генної інженерії. Тут вона формулюється як визначення так званих маркерів, під якими розуміють генетичні коди, які контролюють ті або інші фенотипічні ознаки живого організму. Такі коди можуть містити сотні, тисячі і більше пов'язаних елементів.
На розвиток генетичних досліджень виділяються великі кошти. Останнім часом в даній області виник особливий інтерес до застосування методів Data Mining. Відомо кілька великих фірм, що спеціалізуються на застосуванні цих методів для розшифровки генома людини і рослин.
• Прикладна хімія
Методи Data Mining знаходять широке застосування в прикладної хімії (органічної та неорганічної). Тут нерідко виникає питання про пошук особливостей хімічної будови тих чи інших сполук, що визначають їх властивості. Особливо актуальна така задача при аналізі складних хімічних сполук, опис яких містить сотні й тисячі структурних елементів та їх зв'язків.
• Захист інформації
Класифікація документів за категоріями (класами): несекретні, для службового користування, секретні і т.д.
Можна навести ще багато прикладів різних областей знання, де методи Data Mining грають провідну роль. Особливість цих областей полягає в їх складній системній організації. Вони відносяться головним чином до надкібернетичному рівню організації систем, закономірності якого не можуть бути досить точно описані на мові статистичних або інших аналітичних математичних моделей. Дані у вказаних областях неоднорідні, гетерогенні, нестаціонарні і часто відрізняються високою розмірністю.