Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Olejnik (1).doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
1.31 Mб
Скачать

2.6.2 Фізична структура даних

При створенні інформаційних систем обробки даних великого значення набувають машинні структури даних. Це пов'язано з розміщенням масивів даних у пам'яті ЕОМ. Фізична структура даних налічує такі одиниці інформації: символ, поле, агрегат даних, запис, файл, база даних.

Поле - поєднання символів, яке приводить до створення мінімального елемента масиву.

Агрегат даних - це пойменована сукупність двох і більше елементів нижчого рівня. Загалом до агрегату даних можуть належати як елементи, так і інші агрегати даних.

Запис - пойменована сукупність полів, об'єднаних за змістом.

Файл - пойменована сукупність записів для об'єктів одного типу. Як правило, записи, що входять до файла, мають однакову структуру.

База даних (БД) – пойменована сукупність взаємозв’язаних файлів з мінімальною надмірністю, яка призначена для одночасного користування багатьма користувачами. Вона пов'язується з організацією даних на принципах автоматизованого банку даних (АБД) і застосування ЕОМ.

2.6.3 Лінійні та нелінійні структурні дані

За характером взаємозв'язку елементів усі структури даних можна поділити на лінійні та ієрархічні або нелінійні. Різняться вони тим, що в лінійних структурах усі елементи роз­міщені на одному рівні, у нелінійних - на кількох рівнях. На рисунку 2.1 наведено структуризацію даних залежно від взаємозв’язків її елементів.

До лінійних структур належать послідовні та рядкові структури. Елементи послідовної структури даних розміщуються в тому по­рядку, який необхідний під час їх обробки. Наприклад, файл нарядів зберігається в пам'яті ЕОМ у порядку зростання номерів цехів. Послідовні структури можуть бути упорядковані і неупорядковані.

Рядкові (стрічкові) структури даних є частинним випадком спискової структури, тому стрічковою структурою даних нази­вається список, елементами якого є записи.

Складні спискові структури даних - це списки, елементами яких можугь бути інші списки меншого розміру, так звані під­списки. Крім того, у мережах кожного підсписку можна визначи­ти впорядкованість його елементів, тобто вони бувають упоряд­ковані і неупорядковані.

У дерево- подібних структурах елементи розміщують­ся на різних рівнях і сполучаються за допомогою адреси зв'язку. Якщо з їх допомогою можна звернутися лише до двох елементів, то такі дерево -подібні структу­ри називають бінарними. Небінарні дерева називають загальними.

Сіткові структури даних являють собою роз­ширення дерева за рахунок нових адрес зв'язку.

Табличні структури даних призначені для збе­рігання інформації про ключові ознаки даної інформаційної сукупності.

Гібридні структури даних містять фрагменти двох різних структур.

2.6.4 Ієрархічний метод класифікації інформації

Система класифікації визначається і характеризується використаним методом класифікації, ознаками, їх послі­довністю і кількістю ступенів класифікації, а також кількістю угруповань (ємністю). Метод класифікації - це сукупність правил створення системи класифікаційних угруповань і їх зв'язки між собою. Ознака класифікації - це властивість об'єкта класифікованої множини, які можуть мати кількісне або якісне значення. Кількість значень ознаки класифікації визначає кількість класифікаційних угруповань, які можуть бути створені при розподілі множини об'єктів за цією ознакою.

Розрізняють два основні методи класифікації:

1) ієрархічний;

2) фасетний.

Ієрархічний метод класифікації характеризується тим, що початкова множина об'єктів техніко-економічної інформації послідовно поділяється на угруповання (класи) першого рівня поділу, далі - на угруповання наступного рівня і т.ін. Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображують у вигляді гіллястого графа, вузлами якого є угруповання (рисунок 2.2).

Кількість рівнів класифікації визначає глибину класифікації. Кожне угруповання може поділяти на угруповання нижчого рівня з використанням своєї ознаки, і глибина класифікації у кожній гілці ієрархічної структури може бути різною.

В ієрархічній класифікації в окремому випадку на кожному рівні поділу може бути використана одна ознака. Це означає, що об'єкти початкової множини характеризуються однаковим набором ознак.

При використанні ієрархічного методу класифікації для віднесення конкретного об'єкта класифікації на кожному ступені лише до одного класифікаційного угруповання необхідно додержуватися таких основних правил:

  • поділ кожного угруповання виконується лише за однією основою поділу;

  • одержані на кожному рівні класифікації угруповання не повинні повторюватися;

  • класифікації мають виконуватися так, аби сума частин становила первинну множину.

Найбільш суттєвими і складними питаннями, що постають при використанні ієрархічного методу класифікації, є вибір системи ознак, що стануть основою поділу, а також їх послідовність. Вибрані ознаки мають бути визначальними в розв'язуванні конкретних техніко-економічних задач, для яких створюється ця система класифікації. При цьому формовані в угрупованні об'єкти повинні мати найбільшу кількість однакових ознак. Вибір послідовності ознак залежить передусім від характеру техніко-економічної інформації

При застосуванні ієрархічного методу класифікації для об'єктів із незалежними ознаками (наприклад, кадрів, продукції тощо) вибір послідовності ознак залежить від статистичних характеристик - частоти та ймовірності звертання до тієї чи іншої ознаки (найчастішим звертанням мають відповідати вищі рівні класифікації).

Ієрархічний метод класифікації характеризується кількістю рівнів класифікації, глибиною, ємністю і гнучкістю. Кількість рівнів визначає глибину класифікації, яка встановлюється залежно від міри необхідної конкретизації угруповань і кількості ознак, які беруть участь у розв'язуванні відповідних задач. Від глибини класифікації та кількості створених на кожному рівні угруповань залежить ємність. Як правило, найбільшу кількість послідовних угруповань, на які може поділяти попереднє угруповання на кожному рівні класифікації, беруть сталою або для всієї класифікації, або для даного рівня. Розділи ідентифікуються однозначним цифровим кодом. Код підрозділу складається з коду розділу та однозначного коду підрозділу.

Переваги цього методу: логічність побудови, чіткість виділення ознак, великий інформаційний обсяг, традиційність і звичність використання, повна пристосованість до ручної обробки інформації, велика інформативність кодів, які мають змістове навантаження.

Недоліки: жорсткість структури, яка зумовлена фіксованістю ознак і заздалегідь встановленим порядком їх проходження, які не допускають включення за відсутності резервного обсягу нових об’єктів класифікаційних угруповань та ознак; неможливість групувати за будь-якою наперед незаданою ознакою; відсутність для стабільності класифікаторів потрібних великих резервних обсягів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]