Лента новостейИнструменты ИИ для обнаружения переломов протестированы в прямом эфире

Исследователи сообщили, что прямое сравнение трех коммерчески доступных инструментов искусственного интеллекта для обнаружения переломов на рентгеновских снимках выявило положительные и отрицательные стороны каждой модели. 

«Хотя все три модели продемонстрировали среднюю или высокую эффективность при прямом обнаружении переломов, они продемонстрировали ограниченную точность в сложных сценариях, таких как множественные переломы и вывихи», — отметила ведущий автор Ина Луйкен, доктор медицинских наук из Мюнхенского технического университета в Мюнхене (Германия), и ее коллеги. 

«Это говорит о том, что существующие алгоритмы пока недостаточно надёжны для самостоятельной диагностики и должны в первую очередь помогать рентгенологам и рентгенологам, проводящим исследования, а не заменять их», — написала группа. Исследование было опубликовано 7 октября в журнале Radiography . 

Исследователи отметили, что, несмотря на продемонстрированный потенциал моделей ИИ в контролируемых исследовательских средах, остаются существенные вопросы относительно внедрения ИИ в повседневную клиническую практику. 

Чтобы восполнить пробел в знаниях, группа проспективно оценила три коммерчески доступные модели — BoneView ( Gleamer , Париж, Франция), Rayvolve ( AZmed , Париж, Франция) и RBfracture ( Radiobotics , Копенгаген, Дания) — на рентгеновских снимках 1037 взрослых пациентов, охватывающих 22 анатомические области. Переломы были выявлены у 29,6% пациентов: у 13,7% — острые переломы, а у 6,7% — множественные переломы.   

Результаты моделей ИИ для обнаружения переломов («нет», «подозрение» или «да») вручную сравнивались с проверенными отчетами рентгенологов или диагностически уточняющим отчетом КТ, а исследователи рассчитывали площадь под рабочей кривой (AUC), чувствительность и специфичность для каждой модели. 

Согласно результатам, Rayvolve в целом продемонстрировал более высокую чувствительность, BoneView продемонстрировал сбалансированную производительность, а RBFracture отдал приоритет специфичности, сообщили исследователи. 

Эффективность трех моделей ИИ при обнаружении всех переломов
Мера Рэйвольв BoneView Перелом РБ
АУК 84,9% 84% 77,2%
Чувствительность 79,5% 75,6% 60,9%
Специфичность 90,3% 92,3% 93,6%

При острых переломах значения AUC были сопоставимы (диапазон: от 84,8% до 87,8%). Однако при множественных переломах эффективность была ограничена, с диапазоном AUC от 64,2% до 73,4%. Кроме того, у Rayvolve была более высокая AUC при вывихе (61,9% против 54,5% у Gleamer), а Gleamer и Radiobotics превзошли AZmed при выпоте (AUC 69,6% и 73,6% против 58%). Наконец, исследователи сообщили, что ни один алгоритм не превысил 91% точности при острых переломах. 

«Коммерческие алгоритмы ИИ продемонстрировали среднюю или высокую производительность при прямом обнаружении переломов, но ограниченную точность для сложных сценариев, таких как множественные переломы и вывихи», — отмечают авторы. 

По словам Луйкена и его коллег, в конечном итоге полученные результаты имеют важное значение для интеграции моделей в клиническую практику. 

В частности, высокая чувствительность Rayvolve ко всем переломам и переломам с использованием современных материалов для остеосинтеза делает его перспективным инструментом для первичного скрининга, сбалансированная производительность Boneview позволяет использовать его в качестве инструмента повторного считывания для подтверждения отрицательных результатов, а высокая специфичность RBFracture ценна для исключения переломов, считают они. 

«Современные инструменты следует использовать как дополнение, а не как замену рентгенологам и рентгенологам, проводящим исследования», — заключила команда. «Для повышения обобщаемости и надежности необходимы многоцентровая валидация и более разнообразные данные для обучения». 

Полное исследование доступно здесь .

Внимание, автоперевод! За ошибки перевода ответственности не несём. Первоисточник по ссылке.