Лента новостейИсследование показало, что чат-боты дают пациентам более точные объяснения результатов МРТ, чем эксперты.

Чат-боты смогут точно объяснить пациентам результаты МРТ, чего рентгенологи обычно сделать не могут.

Новое исследование, опубликованное в журнале Scientific Reports, подробно описывает эффективность двух чат-ботов — GPT o1-preview и Deepseek-R1 — при интерпретации результатов МРТ пациентов. Результаты исследования предполагают, что такая технология может сыграть важную роль в рабочих процессах рентгенологов в будущем.

«Несмотря на доступность электронных отчётов об обследованиях, их сложное содержание остаётся серьёзным препятствием для пациентов, пытающихся понять состояние своего здоровья. В результате большинству пациентов требуются дополнительные консультации с врачами для интерпретации отчётов МРТ, что может привести к увеличению времени ожидания консультации и потенциально задержать диагностику и лечение», — пояснили Мин Фэн из отделения нейрохирургии больницы Пекинского объединённого медицинского колледжа в Китае и его коллеги. «Эта ситуация не только увеличивает нагрузку на врачей амбулаторного отделения, но и увеличивает общую нагрузку на систему здравоохранения».

Чтобы оценить эффективность чат-ботов, исследователи поручили им предоставить пояснения к результатам обследований более 6000 пациентов с диагностированными опухолями. Отчёты, различающиеся по формату и сложности, использовались чат-ботами для выполнения четырёх задач:

  1. Интерпретируйте отчеты таким образом, чтобы их могли понять люди, не имеющие медицинского образования.

  2. Классифицируйте поражения как доброкачественные, атипичные или злокачественные.

  3. Определить, требуется ли хирургическое вмешательство.

  4. Рекомендовать план лечения на основе содержания отчета.

Медицинские эксперты оценили ответы чат-ботов на читабельность и точность. Они установили, что оба инструмента улучшили читаемость отчётов, хотя модель DeepSeek эффективнее снижала сложность текста. Обе модели также получили высокие оценки за точность классификации поражений и определения необходимости хирургического вмешательства, хотя модель DeepSeek снова превзошла инструмент GPT. DeepSeek также значительно превзошёл GPT в предоставлении точных клинических рекомендаций.

Следует отметить, что обе модели допускали ошибки, связанные с неверным толкованием медицинской терминологии и галлюцинациями ИИ. Это, по мнению авторов, подчёркивает важность контроля со стороны ИИ после внедрения.

«В клинических условиях неточности в ответах генеративных чат-ботов могут иметь серьёзные последствия для диагностики и лечения пациентов», — предупредила группа. «Основные проблемы при использовании этих чат-ботов в медицине связаны с точностью, надёжностью и возникновением галлюцинаций».

С этой целью группа представила данные об эффективности методов тонкой настройки, которые, как известно, повышают успеваемость студентов магистратуры права. Они предложили в будущих исследованиях по этой теме оценить влияние целенаправленной тонкой настройки.

Более подробную информацию о результатах можно найти здесь .

Внимание, автоперевод! За ошибки перевода ответственности не несём. Первоисточник по ссылке.