Document details

Machine Versus Man: Artificial Intelligence Diagnostic Accuracy in Fracture Diagnosis

Author(s): Silva, Fábia ; Tomaz, Diogo ; Gonçalves, Micaela ; Lopes, Jorge ; Relvas Silva, Miguel ; Vidinha, Vítor ; Sousa, António ; Silva, Fábia

Date: 2025

Origin: Orthopaedic SPOT - Sociedade Portuguesa de Ortopedia e Traumatologia

Subject(s): Artificial intelligence; Emergency Service, Hospital; Fractures, Bone/diagnostic imaging; Inteligência artificial; Fracturas Ósseas/diagnóstico por imagem; Serviço de Urgência Hospitalar


Description

Introduction: Yearly around 21 thousand adult patients visit our tertiary hospital’s emergency department after suffering from high or low energy trauma. Skeletal radiographs, being inexpensive and widely available, are the first‐line imaging mo‐ dality. Recent studies are showing encouraging results of the use of artificial intelligence in the detection of bone fractures. The main objective of this study is to compare the diagnostic accuracy between a medical‐grade artificial intelligence (AI) software (BoneView®, Gleamer) and orthopaedic surgeons of various levels of expertise for the detection of bone fractures in a tertiary hospital’s emergency department. Methods: Retrospective analysis of a series of posttraumatic radiographic examinations, including only adult patients with plain radiographs of limbs or pelvis obtained after a recent trauma. Exclusion criteria were patients with cast control radiographs, images with inadequate radiographic quality, and examinations showing only obvious fractures. The diagnostic performance of the AI software and six orthopaedic surgeons was measured by sensitivity, specificity, and area under the receiver operating characteristic curve (AUC). Results: The AI software had 91.3% sensitivity (95% CI: 82.03‐96.74) and 97.3% specificity (95% CI: 93.22‐99.26), with 0.95 AUC (95% CI: 91.3‐98.8; p <0.001). All six readers had inferior results in every measure obtained, with slight differences between them. Conclusion: Our study demonstrated that the BoneView® software has a high diagnostic capacity for fractures and, in this regard, can be considered a useful tool in the emergency department.

Introdução: Anualmente cerca de 21 mil adultos recorrem à urgência do nosso hospital terciário por traumatismos de pequena ou elevada energia. A radiografia, de acessibilidade imediata, é geralmente o primeiro exame diagnóstico realizado. Recentemente a inteligência artificial (IA) na saúde expandiu‐se para o diagnóstico de fraturas, com resultados encorajadores. O objetivo deste trabalho é comparar a acuidade diagnóstica de fraturas de um software de IA (BoneView®, Gleamer) com ortopedistas de diferentes graus de diferenciação no serviço de urgência de um hospital terciário. Métodos: Análise retrospetiva de uma amostra de radiografias realizadas no contexto de trauma, incluindo adultos que realizaram pelo menos 1 incidência radiográfica do esqueleto apendicular. Excluídas imagens radiográficas de seguimento, baixa qualidade ou com apenas fraturas óbvias. O desempenho diagnóstico do sistema IA e ortopedistas incluídos foi avaliado através da sensibilidade, especificidade e área sob a curva ROC (AUC). Resultados: O sistema IA demonstrou uma sensibilidade de 91,3% (95% CI: 82,03‐96,74) e especificidade de 97,3% (95% CI: 93,22‐99,26), com uma AUC de 0,95 (95% CI: 91,3‐98,8; p <0,001). Em média estes valores foram ligeiramente inferiores para todos os ortopedistas, com pequenas diferenças entre eles. Conclusão: O nosso estudo mostrou que o software BoneView® tem uma elevada capacidade diagnóstica para fraturas e, nesse sentido, poderá assumir‐se como uma ferramenta útil no serviço de urgência.

Document Type Journal article
Language English
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents