Лента новостей → Исследование показало, что чат-боты дают пациентам более точные объяснения результатов МРТ, чем эксперты.
Чат-боты смогут точно объяснить пациентам результаты МРТ, чего рентгенологи обычно сделать не могут.
Новое исследование, опубликованное в журнале Scientific Reports, подробно описывает эффективность двух чат-ботов — GPT o1-preview и Deepseek-R1 — при интерпретации результатов МРТ пациентов. Результаты исследования предполагают, что такая технология может сыграть важную роль в рабочих процессах рентгенологов в будущем.
«Несмотря на доступность электронных отчётов об обследованиях, их сложное содержание остаётся серьёзным препятствием для пациентов, пытающихся понять состояние своего здоровья. В результате большинству пациентов требуются дополнительные консультации с врачами для интерпретации отчётов МРТ, что может привести к увеличению времени ожидания консультации и потенциально задержать диагностику и лечение», — пояснили Мин Фэн из отделения нейрохирургии больницы Пекинского объединённого медицинского колледжа в Китае и его коллеги. «Эта ситуация не только увеличивает нагрузку на врачей амбулаторного отделения, но и увеличивает общую нагрузку на систему здравоохранения».
Чтобы оценить эффективность чат-ботов, исследователи поручили им предоставить пояснения к результатам обследований более 6000 пациентов с диагностированными опухолями. Отчёты, различающиеся по формату и сложности, использовались чат-ботами для выполнения четырёх задач:
-
Интерпретируйте отчеты таким образом, чтобы их могли понять люди, не имеющие медицинского образования.
-
Классифицируйте поражения как доброкачественные, атипичные или злокачественные.
-
Определить, требуется ли хирургическое вмешательство.
-
Рекомендовать план лечения на основе содержания отчета.
Медицинские эксперты оценили ответы чат-ботов на читабельность и точность. Они установили, что оба инструмента улучшили читаемость отчётов, хотя модель DeepSeek эффективнее снижала сложность текста. Обе модели также получили высокие оценки за точность классификации поражений и определения необходимости хирургического вмешательства, хотя модель DeepSeek снова превзошла инструмент GPT. DeepSeek также значительно превзошёл GPT в предоставлении точных клинических рекомендаций.
Следует отметить, что обе модели допускали ошибки, связанные с неверным толкованием медицинской терминологии и галлюцинациями ИИ. Это, по мнению авторов, подчёркивает важность контроля со стороны ИИ после внедрения.
«В клинических условиях неточности в ответах генеративных чат-ботов могут иметь серьёзные последствия для диагностики и лечения пациентов», — предупредила группа. «Основные проблемы при использовании этих чат-ботов в медицине связаны с точностью, надёжностью и возникновением галлюцинаций».
С этой целью группа представила данные об эффективности методов тонкой настройки, которые, как известно, повышают успеваемость студентов магистратуры права. Они предложили в будущих исследованиях по этой теме оценить влияние целенаправленной тонкой настройки.
Более подробную информацию о результатах можно найти здесь .
Внимание, автоперевод! За ошибки перевода ответственности не несём. Первоисточник по ссылке.