Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вопросы и ответы к экзамену.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
1.25 Mб
Скачать

Понятие надежности по

Под ошибкой (отказом) программы понимают всякое невыполнение программой тех функций, которые были заданы в ТЗ на ее разработку, или вытекают непосредственно из инструкции пользователю. Программа при фиксированных исходных данных и абсолютно надежном КТС должна давать однозначный результат при многократных выполнениях, но из-за комбинаторного характера исходных данных, множества переходов, зависящих от промежуточных результатов, создается множество путей выполнения программы.

Если входные данные включают 10 переменных, каждая из которых может принимать 103 различных значения, то число возможных входных комбинаций составит 1030. Если предположить, что ответ программы на одну входную комбинацию занимает 1 мкс и проводится в год 31013 проверок, то на проверку всех 1030 входных комбинаций потребуется 31016 лет. Таким образом, даже после нескольких лет эксплуатации ПО будут встречаться непроверенные варианты входных данных, в которых могут быть обнаружены не выявленные ошибки.

Определение: надежность ПО – свойство составляющих его программ выполнять заданные функции в заданных условиях на конкретном КТС.

Две основные причины возникновения отказов ПО:

  1. Разработчики ПО нарушили технические требования к программам (нарушены спецификации).

  2. Сами спецификации неточные или неполные, т. е. само описание того, что должна делать каждая программа, без указания как она должна это делать – неточное или неполное.

Отличия надежности ПО от надежности КТС.

  • элементы ПО не стареют от износа;

  • число способов контроля ПО значительно больше, чем способов контроля аппаратуры;

  • в ПО гораздо больше объектов для контроля, чем в аппаратуре;

  • в ПО гораздо проще вносить изменения, чем в аппаратуру, но это трудно делать корректно и безошибочно.

Отказы, сбои, восстановление

Отказ при функционировании комплекса программ может проявляться как следствие нарушения кодов записи программ в памяти команд, стирания или искажения данных в оперативной или долговременной памяти ЭВМ, нарушения нормального хода вычислительного процесса. Отказ может проявляться в виде программного останова или зацикливания, систематического пропуска исполнения некоторой группы программ, однократного или систематического искажения накопленных данных и т.д. Первопричиной нарушения работоспособности программ при безотказности вычислительных средств, всегда является конфликт между реальными исходными данными, подлежащими обработке, и программой, осуществляющей эту обработку. При этом под исходными данными понимается вновь поступившие сообщения или вся информация, накопленная за время предыдущего функционирования программ.

Сбой - это самоустраняющийся отказ, не требующий внешнего вмешательства. Основным принципом классификации сбоев и отказов в программе является разделение по временному показателю длительности восстановления после любого искажения программ, данных или вычислительного процесса, регистрируемого как нарушение работоспособности. При длительности восстановления меньшего порога, аномалии при функционировании программ следует относить к сбоям, а при восстановлении, превышающем по длительности пороговое значение, происходящие искажения соответствуют отказу.

Между понятиями правильная и надежная программа отсутствует тождественность. Понятие правильной или корректной программы может рассматриваться статически вне временного функционирования. Корректная программа должна обеспечивать выходные данные соответствующие эталонным в области изменения исходных данных, заданных требованиями технического задания или спецификации. Надежная программа, прежде всего, должна обеспечивать низкую вероятность отказа в процессе функционирования. Быстрое реагирование на искажение программ, данных или вычислительного процесса и восстановление работоспособности за время меньшее, чем порог, позволяют обеспечить высокую надежность программ. При этом некорректная программа может функционировать в принципе абсолютно надежно.

Для решения задачи восстановления в комплексе программ должны быть средства, позволяющие:

  • проводить систематический контроль и оперативно обнаруживать аномалии процесса функционирования или состояния программ и данных;

  • диагностировать обнаруженные искажения;

  • вырабатывать решения и выбирать методы и средства восстановления;

  • реализовывать оперативное восстановление нормальной работоспособности;

  • регистрировать каждый сбой или отказ и обобщать с данными предыдущих искажений для выявления систематических случаев, требующих доработки программ или аппаратуры.