
ИАИРО_ПР2_Z9411_Чурилов
.doc
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«САНКТ-ПЕТЕРБУРГСКИЙ УНИВЕРСИТЕТ АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ»
(ГУАП)
КАФЕДРА № 41
ОТЧЕТ ЗАЩИЩЕН С ОЦЕНКОЙ
ПРЕПОДАВАТЕЛЬ
к.т.н., доцент |
|
|
|
А.В. Яковлев |
должность, уч. степень, звание |
|
подпись, дата |
|
инициалы, фамилия |
ОТЧЕТ О ПРАКТИЧЕСКОЙ РАБОТЕ № 2 |
Анализ информационных ресурсов общества (англоязычный сегмент) на заданную тему с использованием менеджера библиографий |
по курсу: ИНФОРМАТИЗАЦИЯ И АНАЛИЗ ИНФОРМАЦИОННЫХ РЕСУРСОВ ОБЩЕСТВА |
РАБОТУ ВЫПОЛНИЛ
СТУДЕНТ ГР.№ |
Z9411 |
|
|
|
А. С. Чурилов |
|
|
|
подпись, дата |
|
инициалы, фамилия |
Санкт-Петербург 2023
A. S. Churilov*
student,
*St. Petersburg state University of aerospace instrumentation
IMPLEMENTATION OF THE VOICE ASSISTANT IN THE FIELD OF MEDICINE AND HEALTHCARE
Abstract
The report discusses
Keywords:
УДК 658.511
А. С. Чурилов*
студент
*Санкт-Петербургский государственный университет аэрокосмического приборостроения
внедрение голосового помощника в область медицины и здравоохранения
Аннотация
В сообщении рассматривается возможность внедрения программ типа «голосовой помощник» в сферу медицины, приводятся примеры уже реализованных и применяемых приложений, анализируются перспективные направления дальнейшего использования технологий обработки естественного языка в области здравоохранения.
Ключевые слова: голосовой помощник, обработка естественного языка, технологии распознавания речи, голосовой ассистент.
В последние годы технология понимания естественного языка стала одним из самых перспективных направлений развития искусственного интеллекта [17]. Голосовые ассистенты являются ярким примером подобных систем. Они могут быть интегрированы во множество других устройств, их применение значительно упростит взаимодействие человека и компьютера [8].
Технологии распознавания естественного языка активно используются для различных областей человеческой деятельности. Голосовыми помощниками можно назвать ботов, которые работают на основе искусственного интеллекта (ИИ), технологиях машинного обучения, распознавания голоса и обработки естественного языка, чтобы отвечать на вопросы пользователя, вести с ним диалог, осуществлять выполнение простых задач и запуск приложений [5].
Попытки распознать голос при помощи интеллектуальных технологий начались ещё в 1930 г. Тогда учёные старались запрограммировать машину на понимание одночленных звуков, а уже сейчас наши смартфоны и компьютеры обрабатывают целые предложения и фрагменты текста. Данный скачок возник в результате развития машинного обучения, которое заставляет нейронные сети самостоятельно анализировать контекст и эффективно определять основной источник звука [6].
Технология обработки естественного языка уже нашла широкое применение в абсолютно разных сферах жизнедеятельности человека. И далеко не на последнем месте среди этих областей стоит отрасль медицины и здравоохранения [14].
Действительно, курс, направленный на развитие электронного здравоохранения, был взят уже довольно давно и получил широкое распространение. Следует отметить, что внедрение каждой новой технологии вызывает существенные изменения в структуре медицины как социального института, что приводит к постоянному формированию совершенно отличных форм взаимодействия между сотрудниками сферы и их потребителями [4].
Всё ещё актуальной потребностью в медицине является технология распознавания речи, применение которой поможет системе здравоохранения повысить удовлетворенность персонала и улучшить качество оказываемой населению помощи. Так, несколько лет назад World Intellectual Property Organization (Всемирная организация интеллектуальной собственности - ВОИС) комплексно исследовала тенденции развития технологий искусственного интеллекта. В результате проведенного анализа было определено количество патентов на приложения, базирующиеся на данном механизме, которые были выдвинуты с 1950-х годов по 2017 год. В исследовании также рассматривалась медицинская сфера. Было выявлено, что указанная область по числу разработок вовсе не отстаёт: общее количество патентов, связанных с интерпретацией естественного языка, составляет 3818, а с анализом речи – 2504 [9]. Очевидно, что с момента формирования рейтинга числа сильно выросли, показав тем самым заинтересованность и необходимость внедрения и использования механизмов распознавания речи в здравоохранении.
Применение голосовых помощников представляет собой активно развивающийся тренд в области медицины. В здравоохранении такие ассистенты могут выполнять множество функций: от осуществления записи клиентов до проведения диагностических и даже терапевтических процедур. Прогнозируется, что мировой рынок подобных систем для здравоохранения достигнет 314,3 миллиона долларов в текущем году [4].
Рассмотрим реальные возможности применения технологий интерпретации естественного языка, которые уже реализованы в действующих учреждениях или активно разрабатываются и тестируются.
Исследуемый механизм способен анализировать большие объемы медицинской документации и осуществлять автоматическую категоризацию и резюмирование изученных записей, что позволяет улучшать качество и увеличивать оперативность постановки диагноза, принятия решений о методе и порядке лечения, госпитализации больных, что в дальнейшем повысит вероятность благоприятного исхода заболевания. Специализированные языковые системы также могут оказывать поддержку в рамках программ предотвращения суицида при помощи автоматизации анализа содержания и характера поступающих от пациентов звонков. В фармацевтике технология позволит автоматически обрабатывать большой объем специализированной документации, формируемой при составлении новых препаратов и проведении клинических испытаний, что ускорит и сделает более качественным процесс принятия релевантных решений как самими фармацевтическими компаниями, так и отраслевой регулирующей инстанцией [2].
В ряде больниц и поликлиник уже используется программа, предназначенная для закрытия обращений по записи на прием к врачу. С помощью голосового робота была значительно снижена нагрузка на операторов контакт-центра. Программа обеспечивает выполнение следующих функций: приём и обработка голосовых обращений на выделенный номер; анализ заявок в голосовом канале в формате вопросно-ответной системы; осуществление записи на приём к врачу пациентов, обратившихся в контакт-центр; частичный опрос клиента с последующей передачей его результатов медицинскому персоналу [11].
В период пандемии COVID-19 остро встал вопрос нехватки сотрудников для первичной консультации людей, выявлявших у себя симптомы, характерные для заболевания. Решением стало использование искусственного интеллекта, интерпретирующего речь пациентов. Голосовые ассистенты отвечали на рутинные вопросы, подсказывали тактику поведения в типовых ситуациях, служили платформой для телеконсультации со специалистом и т. д [12].
В настоящее время ИИ активно применяется в виде синтеза речи при прочтении записей из медицинских информационных систем или, наоборот, расшифровки речи и превращении ее в текст в качестве более продвинутого интерфейса общения [4].
Благодаря единой цифровой платформе здравоохранения, развиваемой Комплексом социального развития города Москвы и Департаментом информационных технологий (ДИТ), удалось реализовать первое масштабное применение технологии голосового ввода в стране. В основу технологии легло решение Voice2Med – продукт на основе искусственного интеллекта для заполнения медицинских протоколов. Данная система использует технологию распознавания естественной слитной русской речи. Технология голосового ввода текста позволяет в режиме реального времени заполнять медицинские документы: во время осмотра врач с помощью гарнитуры надиктовывает информацию, которая моментально расшифровывается и автоматически переносится в открытый протокол [10].
При адекватном обучении ПО, в зависимости от требований врача-специалиста, Voice2Med корректно распознает все медицинские термины и выражения, а надежность распознавания достигает 97–98%. Качество интерпретации речи и возможность подключения тематических языковых моделей обеспечивает по окончании процедуры осмотра наличие полностью заполненного медицинского протокола, требующего минимум исправлений, что позволяет экономить более 20% времени врача [10].
Современный голосовой интерфейс является естественным и интуитивным, помогает «нецифровым» медицинским работникам после непродолжительного обучения преодолеть сложности в освоении компьютерной техники. Кроме того, Voice2Med решает проблемы со специфическим врачебным подчерком, что существенно повышает качество заполнения протоколов за счет его восприятия [10].
Немаловажный вклад в работу учреждений здравоохранения вносят медицинские сестры, которые выполняют множество различных задач и рутинных обязанностей, осуществление коих можно оптимизировать с помощью голосовых ассистентов [16].
В зарубежных странах всё больше развиваются технологии обработки естественного языка, имеющие практическую направленность, связанную с непосредственным уходом за пациентами. Часть из них (например, GreatCall, Angel) ориентирована в основном на выполнение функций справочника по симптомам и менеджера ежедневных активностей/действий, относящихся к состоянию здоровья. При этом, если предусмотрена возможность измерения объективных данных пациента, приложения также могут собирать сведения о клиенте и передавать их медицинской сестре или родственникам [3].
Важное и интересное исследование проводится иностранными специалистами по применению технологии обработки естественной речи для выявления болезни Альцгеймера на ранней стадии.
Как известно, данное расстройство и связанные с ним отклонения характеризуются прогрессирующей дегенерацией когнитивной функции, включая способность производить связную речь [13]. Исследователи предложили использовать системы голосового помощника для мониторинга и сбора сведений о взрослых из групп риска и показали, что полученную информацию можно применять для достижения функциональной точности при классификации стадии их болезни. Подобное нововведение позволит определять текущее состояние пациента и схватывать отклонения в его речи, в результате чего появится реальный шанс замедлять ход расстройства и продлевать сознательную жизнь человека [15].
Таким образом, система распознавания естественного языка в медицине – это инструмент, значительно повышающий качество работы врача-специалиста. С учетом возможностей современных технологий в области интерпретации речи появляется перспектива формировать отчеты и документы с минимальным процентом ошибок системы [7]. Подобная цифровизация здравоохранения позволяет достичь следующих целей: повышение доступности и уровня медицинских услуг, изменение парадигмы здравоохранения в сторону профилактики, вовлеченность граждан в заботу о своем здоровье, экономичное расходование бюджетных ресурсов и многих других [1].
Библиографический список
1. Аксенова Е. И., Камынина Н. Н., Верзилина Н. Н. Мировые технологические тренды в медицине и здравоохранении / Е. И. Аксенова, Н. Н. Камынина, Н. Н. Верзилина // Московская медицина. - 2021. - № 5(45). - C. 6–19.
2. Бирюков А. А., Терещенко И. А. Перспективы применения технологии обработки естественного языка в рамках цифровой трансформации экономики РФ и построения цифрового общества / А. А. Бирюков, И. А. Терещенко // Информационное общество. - 2023. - № 2. - C. 105–120.
3. Ивлева А. И., Смирнов С. В. Первичный концептуальный анализ сестринского дела для экспертной советующей системы / А. И. Ивлева, С. В. Смирнов // Информационные технологии и математическое моделирование (ИТММ-2020): Материалы XIX Международной конференции имени А.Ф. Терпугова. - Томск: Издательство научно-технической литературы, 2021. - C. 473–477.
4. Лядова А. В. Трансформация социального института медицины в условиях современного общества / А. В. Лядова // Современная социология: Учебное пособие для Вузов. - Москва: Автономная некоммерческая организация социально-экономического и политического консалтинга «Центр этнических и международных исследований», 2023. - C. 102–125.
5. Поначугин А. В., Пичужкина Д. Ю., Смекалова Е. С. Голосовой помощник как технология обработки данных / А. В. Поначугин, Д. Ю. Пичужкина, Е. С. Смекалова // Наука без границ. - 2022. - № 6(46). - C. 96–100.
6. Спирина Е. А., Жумабеков А. Е., Горбунова Н. А. Технологии распознавания естественного языка для разработки голосового ассистента / Е. А. Спирина, А. Е. Жумабеков, Н. А. Горбунова // Труды университета. - 2022. - № 4(89). - C. 443–448.
7. Темников Д. А. Разработка голосового медицинского ассистента, распознающего ограниченный естественный язык / Д. А. Темников // Инновационные процессы в науке и образовании: сборник статей II Международной научно-практической конференции. - Пенза: «Наука и Просвещение» (ИП Гуляев Г.Ю.), 2019. - C. 30–32.
8. Чернов В. А., Разин И. Б. Разработка интеллектуального голосового ассистента / В. А. Чернов, И. Б. Разин // Инновационное развитие техники и технологий в промышленности (ИНТЕКС-2022): сборник материалов Всероссийской научной конференции молодых исследователей с международным участием. - Москва: Федеральное государственное бюджетное образовательное учреждение высшего образования «Российский государственный университет имени А.Н. Косыгина (Технологии. Дизайн. Искусство)», 2022. - C. 242–245.
9. Чуланова О. Л., Хайбуллова К. Н. Разработка программы внедрения искусственного интеллекта в работу с персоналом на основе исследования лучших мировых практик / О. Л. Чуланова, К. Н. Хайбуллова // Материалы Афанасьевских чтений. - 2022. - № 3(23). - C. 5–14.
10. Шабунин А. В., Бедин В. В., Коржева И. Ю. Пилотное внедрение технологий распознавания речи в эндоскопических центрах ДЗМ / А. В. Шабунин, В. В. Бедин, И. Ю. Коржева // Здоровье мегаполиса. - 2023. - № 1(4). - C. 68–74.
11. Ярмухаметов Р. Р. Обзор применений искусственного интеллекта в медицине / Р. Р. Ярмухаметов // Наукосфера. - 2020. - № 12–2. - C. 172–178.
12. Altuwaiyan T. Exploiting Privacy-preserving Voice Query in Healthcare-based Voice Assistant System / T. Altuwaiyan, M. Hadian, S. Rubel, X. Liang // ICC 2020 - 2020 IEEE International Conference on Communications (ICC). - Dublin, Ireland: IEEE, 2020. - C. 1–6.
13. DeTure M. A., Dickson D. W. The neuropathological diagnosis of Alzheimer’s disease / M. A. DeTure, D. W. Dickson // Molecular Neurodegeneration. - 2019. - № 1(14). - C. 32.
14. Klein A. M., Hinderks A., Schrepp M., Thomaschewski J. Measuring User Experience Quality of Voice Assistants / A. M. Klein, A. Hinderks, M. Schrepp, J. Thomaschewski // 2020 15th Iberian Conference on Information Systems and Technologies (CISTI). - Sevilla, Spain: IEEE, 2020. - C. 1–4.
15. Kurtz E., Zhu Y., Driesse T., Liang X. Early Detection of Cognitive Decline Using Voice Assistant Commands / E. Kurtz, Y. Zhu, T. Driesse, X. Liang // ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). - Rhodes Island, Greece: IEEE, 2023. - C. 1–5.
16. Lakdawala B., Khan F., Khan A., Tomar Y., Gupta R., Shaikh A. Voice to Text transcription using CMU Sphinx A mobile application for healthcare organization / B. Lakdawala, F. Khan, A. Khan, Y. Tomar, R. Gupta, A. Shaikh // 2018 Second International Conference on Inventive Communication and Computational Technologies (ICICCT). - Coimbatore, India: IEEE, 2018. - C. 749–753.
17. Subhash S., Srivatsa P. N., Siddesh S., Ullas A., Santhosh B. Artificial Intelligence-based Voice Assistant / S. Subhash, P. N. Srivatsa, S. Siddesh, A. Ullas, B. Santhosh // 2020 Fourth World Conference on Smart Trends in Systems, Security and Sustainability (WorldS4). - London, United Kingdom: IEEE, 2020. - C. 593–596.