Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЭИС ответы.doc
Скачиваний:
2
Добавлен:
20.04.2019
Размер:
238.08 Кб
Скачать

23. Тезаурусы экономической информации .Тематические классы экономической деятельности.

Термин "тезаурус" является общеупотребительным и общепринятым термином как элемент информационного языка, позволяющего фиксировать парадигматические отношения и отношения синонимии между понятиями предметной области. Тезаурус - это словарь-справочник, в котором перечислены все лексические единицы ИМЯ с синонимичными им словами, а также выражены все важнейшие смысловые отношения между лексическими единицами.

На тезаурус возлагаются следующие функции:

• средство формализации лексики;

• средство терминологического контроля

• средство избыточного индексирования инф-ных запросов;

• средство выражения парадигматических отношений языка.

Основные этапы разработки тезауруса:

1. Выбор источников лексики и отбор терминов.

2. Составление терминологического словаря.

3. Группировка терминов в тематические классы.

4. Формирование классов условной эквивалентности.

5. Установление парадигматических отношений.

6. Определение структуры тезауруса.

Все термины классифицируются в зависимости от функционального назначения в тематические классы. Тематический класс представляет собой группу терминов, несущих целевую направленность.

Перечень тематических классов экономической лексики.

1. Экономические категории, действия, события(Термины, характеризующие экономические сущности и процессы)

2. Субъекты действия(Термины, обозначающие название подразделений)

3. Объекты действия (Термины, описывающие предметы, являющиеся объектами первого тематического класса

4. Назначение действия(Термины, описывающие целевое назначение или виды целевого использования каких-либо ресурсов)

5. Место действия

6. Источник поступления (Термины, конкретизирующие источник денежных средств или материальных ресурсов

7. Время действия

8. Функция управления (Термины, характеризующие тип реализации)

9. Единица измерения

10. Атрибутивные характеристики действия (Термины, описывающие отличительные свойства элементов первого и третьего классов)

11. Обоснование действия(Термины, описывающие распоряжения и приказы на выполнение какого-либо действия

12. Причина отклонения (Термины, описывающие источники, вызывающие нарушения нормальной работы объекта)

24. Анализ алгоритмов и структур данных. Критерии эффективности алгоритмов.

Методы хранения данных в памяти ЭВМ обычно предполагают раздельное хранение значений каждой составной единицы информации. Запись -отдельное значение СЕИ, находящееся в памяти ЭВМ. Она состоит из значений атрибутов, входящих в структуру СЕИ. Под организацией значений данных понимают относительно устойчивый порядок расположения записей данных в памяти ЭВМ и способ обеспечения взаимосвязи между записями. Организация значений данных может быть линейной и нелинейной. Среди линейных методов выделяются последовательная и цепная организации данных.

Записи, составляющие массив, с точки зрения способа указания их длины делятся на записи фиксированной, переменной и неопределенной длины.

Адреса промежуточных записей фиксированной длины в массиве задаются формулой

A(i) = A(l)+(i-l)*L, где А(1) - начальный адрес первой записи; A(i) - начальный адрес i-й записи; L - длина одной записи.

Для массива записей переменной и неопределенной длины подобной простой формулы не существует. Наиболее важными и часто применяемыми алгоритмами обработки данных являются формирование данных, их поиск и корректировка, а также последовательная обработка. Эти алгоритмы могут быть реализованы с использованием достаточно большого количества методов организации данных.

Естественной характеристикой эффективности того или иного алгоритма служит время его выполнения в зависимости от ряда параметров хранимой информации. Поэтому для каждого метода организации данных требуется анализировать следующие величины:1)время формирования данных, 2)время поиска данных, 3)время корректировки данных, 4)объем дополнительной памяти.

На время выполнения алгоритмов влияет быстродействие конкретной ЭВМ, применяемый язык программирования, стиль программирования конкретного программиста

При анализе алгоритмов необходим еще ряд допущений, обеспечивающих использование равномерного распределения вероятностей для всех случайных величин, описывающих работу алгоритма, в том числе:

• распределение значений ключевых атрибутов в массиве из М записей - равномерное;

• значение q при поиске по совпадению выбрано случайно: это означает, что поиск с одинаковой вероятностью 1/М может закончиться на любой записи массива;

• положение включаемой (исключаемой) записи при корректировке определяется теми же вероятностями, что и при поиске.