Системы для распознавания речи (перевода речи в текст) для медицины

Обновлено: 21.03.2023
Системы для распознавания речи помогают врачам экономить время на создание документации, заполнения медицинских карт пациентов. Примеры медицинских программ для распознавания речи - даны ниже.

См. также: Топ 10: Программы для клиник

2023. Nuance представила систему протоколирования осмотров на ChatGPT



Компания Nuance (принадлежащая Microsoft) - тоже получала бонус от 10 миллиардного партнерства материнской компании с OpenAI. С помощью нейросети GPT-4 они добавили в свою систему создания клинической документации Dragon Ambient eXperience (DAX) Express возможность автоматического протоколирования разговоров с пациентами, которые ведутся с помощью телемедицины или лично. Nuance позиционирует новый инструмент документирования как способ уменьшить нагрузку на врачей. Выгорание врачей резко возросло во время пандемии COVID-19, и именно бюрократическая работа с обязательными записями называлась как главный фактор усталости.


2022. Точность сервиса голосового ввода в отделениях лучевой диагностики Москвы достигла 98%



Точность сервиса голосового ввода в отделениях лучевой диагностики Москвы достигла 98%. Для заполнения документов голосом в цифровой платформе здравоохранения используется созданный группой компаний ЦРТ на основе искусственного интеллекта голосовой помощник Voice2Med. К июлю 2022 года Voice2Med работает в медучреждениях уже 65 регионов страны и доступен для врачей восьми специальностей. В Москве используют систему голосового ввода для создания заключений. За время работы с помощью этого сервиса было заполнено более 160 тысяч медицинских документов. В среднем ежемесячно заполняется около 10 тысяч таких документов.


2021. Microsoft покупает Nuance за $19,7 млрд



Microsoft обновила Топ-5 крупнейших сделок в истории ИТ-рынка, купив (за $19,7 млрд) компанию Nuance - одного из лидеров рынка систем распознавания речи. Собственно, Nuance и создала этот рынок, выпустив программу Dragon NaturallySpeaking в начале 2000-х годов. Алгоритмы распознавания речи Nuance легли в основу голосового ассистента Apple Siri. Но наибольшего успеха компания достигла в медицине. Ее системы помогают стенографировать опросы пациентов и отчеты врачей, освобождая последних от тяжелой бумажной работы. Вероятно, именно ради медицинского бизнеса Microsoft и заплатила такую огромную сумму. В прошлом году компания представила платформу Microsoft Cloud for Healthcare, в которой используются технологии Nuance.


2021. Microsoft выпустила приложение для текстовой записи онлайн-встреч



Microsoft выпустила приложение Group Transcribe, которое позволяет прямо во время разговора нескольких человек в онлайне получить расшифровку их речи в текст, а при необходимости — и перевод расшифровки. Т.е. в реальном времени вы можете читать кто что говорит, или сохранить эту расшифровку чтобы почитать потом. Group Transcribe можно использовать как дополнение к видеовстречам через Zoom, Teams или другой сервис. Организатор должен создать в приложении комнату и пригласить туда всех участников. Т.е. звук будет идти через приложение, а видео - через ваш сервис видеосвязи. Приложение поддерживает 37 языков, среди них есть и русский. Пока оно работает только на iOS, но скоро появится и для Android. Также, Microsoft скоро выпустит специальные колонки для оффлайн встреч, которые также будут записывать текст встречи.


2020. NVIDIA создала систему распознавание речи для телемедицины



Компания NVIDIA, которая производит графические и ИИ-процессоры, представила систему распознавания речи, предназначенную, в первую очередь, для телемедицины. Система позволит сохранить запись удаленной консультации как для врача, так и для пациента. Она натренирована распознавать медицинские термины (однако, пока только на английском языке). Система работает на фреймворке NVIDIA JARVIS, предназначенном для создания nlp-приложений и оптимизирован под видеокарты NVIDIA V100 и T4.


2019. Amazon представила систему распознавания речи для врачей Amazon Transcribe Medical


Amazon расширяет свою платформу распознавания речи Amazon Transcribe специализированным решением для медицины - Amazon Transcribe Medical. Сервис позволит врачам быстро надиктовывать свои клинические заметки. В отличие от альтернативных сервисов, врачам не придется говорить такие вспомогательные слова, как «запятая» или «конец предложения» - система сама расставляет знаки препинания с помощью машинного обучения. Распознанный текст может быть передан в EHR системы для подшития к карточке пациента.


2019. Тинькофф запустил сервисы распознавания и синтеза речи



Недавно Тинькофф банк запустил голосового ассистента Олега, а теперь решил открыть свои API распознавания и синтеза речи для сторонних бизнес-приложений. Например, их можно использовать для создания ботов, смарт-автоответчиков колл-центра, записи IVR, озвучки видеороликов, перевода звуковых записей телефонных разговоров или совещаний в текстовый формат. Стоимость Tinkoff VoiceKit составляет 40-45 копеек за распознавание минуты двухканального аудио, в планах также ввести посекундную тарификацию. Стоимость синтеза речи банк пока не определил. Для сравнения, тариф на распознавание речи с помощью технологии SpeechKit от Яндекса составляет 60 копеек за минуту.


2018. В ЛОР Клиника №1 внедрена система голосового заполнения медицинских протоколов Voice2Med



АМТ-Груп внедрила систему голосового заполнения медицинских протоколов Voice2Med в сети «ЛОР Клиника № 1». Благодаря использованию «Voice2Med» врачи клиники смогут повысить эффективность работы с пациентами за счет автоматизации процесса заполнения медицинской документации. Также использование системы поможет обеспечить соблюдение требований регулирующих организаций к осуществлению медицинской деятельности. Внедрение стало одним из первых в России. Решение Voice2Med от Группы компаний ЦРТ предоставляет возможность заменить клавиатурный ввод информации на голосовой. Особенностью данного продукта, вместе с достаточной точностью и скоростью преобразования голоса в текст, является наличие специализированных лексических русскоязычных словарей: врача-терапевта общей практики, лор-врача, врача-диагноста МРТ, КТ, УЗИ и т.д.


2016. Voice2Med - система распознавания речи для медицины


Компания ЦРТ (Центр Речевых Технологий) разработала систему  распознавания речи в медицине - Voice2Med. Сегодня эта система тестируется в одной из поликлиник Санкт-Петербурга. Благодаря ей медикам не нужно будет тратить много времени на заполнение документов вручную. Технология голосового ввода текста позволяет в режиме реального времени заполнять медицинские документы: во время осмотра врач с помощью гарнитуры надиктовывает информацию, которая моментально расшифровывается и автоматически переносится в открытый протокол. Качество распознавания речи и возможность подключения тематических языковых моделей обеспечивает наличие по окончании процедуры осмотра полностью заполненного медицинского протокола, требующего минимум исправлений.


2015. Система распознавания речи Voice2Med экономит время ярославских эндоскопистов



В эндоскопическом отделении Ярославской онкологической больнице внедрена система распознавания речи в медицине Voice2Med. Она работает следующим образом: во время осмотра врач надиктовывает текст. Произнесённые данные распознаются в режиме реального времени и автоматически переносятся в соответствующие поля открытого у врача протокола. По окончании процедуры у врача уже имеется полностью заполненный протокол, то есть отсутствует необходимость заполнения его вручную. Хранить информацию (размеры и другие важные параметры исследования) в памяти или фиксировать на бумаге не нужно. Достаточно ее проговорить, и Voice2Med сам внесет в документ все необходимые данные, пояснили в ЦРТ. Систему характеризует гибкость: Voice2Med можно дообучить специфическим терминам и названиям препаратов, которые используются в конкретной клинике.


2014. Зачем врачу программа для распознавания речи?



На сегодняшний день врачи тратят больше времени на создание и ведение медицинской документации, чем на оказание медицинской помощи. Системы распознавания речи существенно упрощают и ускоряют ведение электронных медицинских карт. Они позволяют создавать и редактировать электронные карточки пациентов используя лишь голосовой ввод данных. Регистрацию и поиск необходимой информации о пациенте можно выполнять намного быстрее с помощью голоса, чем посредством клавиатурного ввода. Такие действия как создание историй болезни, выписывание рецептов, подготовка рекомендаций по реабилитации пациентов, назначение лечения и поиск информации в базе данных легко поддаются выполнению голосом. ***