Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторний практикум МCШІ - 2013 .doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
2.63 Mб
Скачать

1.4. Типи математичних постановок задач класифікації

та понижування розмірності.

Доцільність і ефективність конкретного методу класифікації та зменшення розмірності обумовлюється математичною моделлю, тобто математичною постановкою задач. Визначальним у виборі математичної постановки задачі є характер початкової інформації, що складається з двох частин:

а) апріорних відомостей знань про досліджувані класи;

б) вибіркової статистичної інформації навчальних вибірок.

Математична модель, яка лежить в основі побудови того чи іншого методу зниження розмірності включає переважно в себе три основних компоненти:

  • Форму задання початкової інформації. Тут треба відповісти на питання:

а) в якому виді задано основну інформацію про об’єкт;

б) чи є серед початкових статистичних даних навчальна інформація, тобто які-небудь відомості про аналізовану результуючу властивість;

в) якщо навчальна інформація присутня в початкових статистичних даних, то в якій саме формі вона представлена.

  • Тип оптимізаційного критерію інформативності шуканого набору ознак . Критерій інформативності може бути орієнтований на досягнення різних цілей. Можна виділити цілий клас критеріїв автоінформативності, оптимізація яких приводить до набору допоміжних змінних , що в свою чергу дозволяє майже точно відтворити інформацію, що міститься в описовому масиві статистичних даних . Якщо описова інформація представлена матрицею “об’єкт-властивість” то мова йде про максимально точне відтворення початкових значень змінних на основі значно меншого числа допоміжних змінних . Критерій орієнтований на пошук економних наборів допоміжних змінних , що забезпечують максимально точне відтворення інформації, що відноситься до результуючої ознаки.

  • Клас допустимих перетворень початкових ознак. Допоміжні ознаки при представленні початкової описової інформації матрицею “об’єкт-властивість” будується у вигляду функцій від , тобто . Для забезпечення змістовності і конструктивної реалізованості розв’язку оптимізаційної задачі необхідно визначити обмеження в класі допустимих розв’язків , в рамках якого ця оптимізаційна задача буде розв’язуватись. Від вибору суттєво залежить і отримуваний розв’язок даної оптимізаційної задачі.

Лабораторна робота № 1.1. Формування таблиць “об’єкт – властивість”

Мета роботи. Використовуючи апріорну інформацію про соціально-демографічні, соціально-економічні явища, процеси та ситуації вибрати об’єкти дослідження (не більше 20), які необхідно описати сукупністю їх характеристичних ознак, наприклад, сім’я: дохід, кількість осіб, кількість працездатних, і т.д.; академічна група: склад, успішність, зайнятість, тощо.

Суть роботи.

Постановка задачі. Визначальним етапом, від якого залежить весь хід подальшого аналізу і обробки даних є постановка задачі. Починається він з формулювання мети всього дослідження, заради досягнення якої саме і здійснюється збір і обробка даних. Метою дослідження може бути встановлення закономірностей досліджуваного соціального явища, виявлення і виділення причин захворюваності даною хворобою, і т.д. На підставі чітко сформульованої мети визначають склад даних, які необхідно зібрати. Проте, дуже часто спочатку збирають дані, а потім починають формулювати задачі їх обробки. В останньому випадку мета дослідження підміняється тою чи іншою вузькою ціллю обробки вже зібраних конкретних даних. Принципова відмінність полягає в тому, що наперед зібрані дані, без продуманої і чітко сформульованої мети, можуть відображати цілком інші характеристики явища, ніж ті, котрі важливі для поставленої пізніше мети.

Таблиці даних. Типовою формою при збиранні даних – є таблиця “об’єкт – ознака”, в яку заносяться кількісні та якісні значення ознак (властивостей), що характеризують кожен досліджений об’єкт. Ознаками можуть бути вага, довжина, колір, стать, професія, ціна, наявність або відсутність симптому, тощо. Об’єктами можуть виступати люди, вироби, соціальні групи, райони і т.д.

Склад даних – це перш за все склад ознак, які характеризують об’єкти. Кожен реальний об’єкт має нескінченне число різних властивостей, які відображають його різні сторони, проте в кожному конкретному дослідженні істотними є не всі властивості, а лише обмежена їх сукупність, яка визначає найбільш важливі ознаки.

Перед збиранням даних необхідно вирішити, як в таблиці представляти значення ознак – цифрами, числами, символами; з якою точністю вимірювати значення кількісних ознак, і як представляти значення якісних ознак. Ці задачі можуть спричинити певні труднощі, якщо вони не вирішуються “автоматично”, за рахунок обмеженого обсягу доступних даних і єдиного можливого способу їх представлення.

Після визначення складу ознак, визначають або відбирають ті об’єкти, значення ознак яких мають бути занесені в таблицю. Можливість вільного відбору об’єктів досить часто є виключеною через надто мале число доступних об’єктів, але інколи, наприклад при проведенні соціологічних досліджень об’єктів може бути дуже багато і тоді вже виникає проблема вибору.

Важливим кроком при побудові таблиць зібраних даних є їх формалізація – тобто такий їх вид, який узгоджений з методами і програмним забезпеченням їх обробки. Тут важливим є не лише структура їх положення в таблиці, але і заповнення пропусків, вибір числових обмежень, методи нормування.

Хід роботи.

1. Скласти таблицю “об’єкт – властивість”, яка описує вибрані для дослідження об’єкти та їх властивості.

2. З допомогою генератора випадкових чисел задати значення властивостей для кожного з об’єктів. При цьому слід дотримуватись реальних меж, але разом з тим намагатися найбільше вирізнити об’єкти між собою.

3. Здійснити постановку задачі подальшого дослідження і правдоподібно обґрунтувати її та отримані дані.

4. Оформити звіт, в якому описати дану гіпотетичну ситуацію, представлену вибраними об’єктами та їх ознаками (властивостями) в кількісній та якісній формі та привести постановку задачі для подальших досліджень змістовно обґрунтувавши її.