Computer Law
  • Attualità
  • Elettronica
  • Scienza
  • IA
  • Mobilità
  • Economia
No Result
View All Result
AI News
  • Attualità
  • Elettronica
  • Scienza
  • IA
  • Mobilità
  • Economia
No Result
View All Result
Computer Law
No Result
View All Result

Uno studio Harvard mostra che il modello o1 di OpenAI ha individuato la diagnosi corretta nel 67% dei casi al triage, contro 50-55% per i medici.

Questa IA supera i medici umani su 2 diagnosi su 3 secondo Harvard

Bruno ARANZULLA di Bruno ARANZULLA
13 Maggio 2026
in Attualità, IA
0

Un team di Harvard Medical School e del Beth Israel Deaconess Medical Center ha testato modelli di IA su veri dossier di pronto soccorso, e il risultato scuote le abitudini: su casi reali, un modello ha proposto diagnosi iniziali più accurate di medici esperti.

Lo studio, pubblicato su Science, insiste su un punto: queste prestazioni non significano che l’IA possa prendere da sola decisioni vitali. Il test è stato fatto su informazioni testuali ricavate dalla cartella clinica, senza esame fisico, senza imaging, senza segnali non verbali. È proprio qui che inizia il dibattito, tra promessa di aiuto al triage e rischio di sovrafiducia.

Harvard Medical School testa 76 pazienti del Beth Israel

L’esperimento più commentato riguarda 76 pazienti arrivati al pronto soccorso del Beth Israel a Boston. Due medici attending hanno redatto le proprie ipotesi diagnostiche, mentre modelli di OpenAI facevano lo stesso a partire dalla medesima cartella, tipicamente parametri vitali, età, contesto e qualche riga di un’infermiera sul motivo della visita.

Le diagnosi sono state poi valutate in cieco da altri due medici, senza sapere cosa venisse da un umano o dall’IA. Al primo “touchpoint”, quello del triage in cui l’informazione è più povera e il tempo più contato, il modello o1 ha identificato la diagnosi esatta o molto vicina nel 67% dei casi, contro il 50-55% dei medici testati.

Leggi anche  Questa IA americana potrebbe trovare in poche ore le leghe capaci di sopravvivere alla fusione nucleare

Quando si aggiungevano più elementi nel corso della presa in carico, il divario si riduceva. Le cifre riportate mostrano un’IA all’82% quando la cartella è più completa, contro umani attorno al 70-79%, una differenza descritta come non statisticamente significativa. Lettura possibile: l’IA aiuta soprattutto quando si hanno pochi indizi, non quando tutto è già sul tavolo.

OpenAI o1 progredisce man mano che la cartella si arricchisce

Il lavoro non si ferma al triage. Il team ha annotato la prestazione in più momenti, fino alle decisioni di ricovero. In un’analisi numerica, o1 raggiunge il 72,4% quando si include la valutazione diretta del medico d’urgenza, poi sale all’81,6% nello stadio in cui sono disponibili abbastanza informazioni per decidere ricovero o trasferimento in terapia intensiva.

Un dettaglio metodologico conta, perché aderisce al reale: i ricercatori spiegano di non aver “ripulito” le cartelle. Hanno usato informazioni così come appaiono nel dossier medico, con il loro disordine abituale. Thomas Buckley, co-primo autore, giustifica questa scelta con la volontà di misurare la prestazione all’inizio del percorso, quando i dati sono scarsi e talvolta ambigui.

C’è anche un capitolo “piano di presa in carico” che colpisce forte. Su cinque vignette cliniche, l’IA ha ottenuto l’89% contro il 34% di un gruppo di 46 medici che usavano risorse classiche. Non significa che un reparto possa delegare le prescrizioni a una macchina, ma suggerisce un uso concreto: proporre una check-list di opzioni, individuare un’antibioticoterapia plausibile o segnalare che un protocollo di fine vita va discusso.

Leggi anche  Dopo le critiche su Liquid Glass, Apple corregge il tiro con macOS 27 e una novità Safari molto pratica

Raj Manrai e Adam Rodman avvertono sull’autonomia

Gli autori battono su un limite: tutto poggia sul testo. Eppure in pronto soccorso si diagnostica anche con una radiografia, un ECG, un’auscultazione, una marcia, un odore dell’alito, uno sguardo preoccupato, dei silenzi. I ricercatori notano che i modelli attuali restano più limitati sugli input non testuali, e che questi segnali pesano molto nelle decisioni rapide.

Raj Manrai, professore assistente di informatica biomedica, ammette che il modello ha superato un’ampia base di medici su più compiti, ma rifiuta l’interpretazione “sostituzione”. Adam Rodman, professore assistente di medicina, dice di essere stato sorpreso dal livello raggiunto, ricordando però che il pronto soccorso è solo un frammento del percorso, e che un mese di ricovero con dati abbondanti avrebbe probabilmente cambiato le carte.

La sfumatura è qui, e disturba: buoni punteggi non garantiscono una pratica sicura. Un’IA può essere brillante su una diagnosi rara e fragile su un caso banale mal descritto. In un ospedale, la domanda diventa operativa: chi porta la responsabilità se lo strumento suggerisce una pista e il team la segue? Gli autori invocano trial prospettici in condizioni reali, con paletti, prima di farne un copilota installato al cuore del pronto soccorso.

Fonte: Harvard

Tags: TECNOLOGIA
Tweet146Condividi234Invia
Bruno ARANZULLA

Bruno ARANZULLA

Bruno Aranzulla é um jornalista tech português especializado em atualidade digital, inteligência artificial, smartphones, ciência aplicada e automóvel conectado. Através da NetParceiro.pt, acompanha as inovações que estão a transformar o quotidiano dos leitores, com uma abordagem clara, acessível e focada nos usos reais. O seu trabalho editorial procura tornar a tecnologia mais compreensível, sem jargão desnecessário nem promessas exageradas. Interessa-se tanto pelos grandes lançamentos das marcas como pelas mudanças mais discretas que alteram a forma como trabalhamos, comunicamos, nos deslocamos e consumimos informação.

Artigos relacionados

Attualità

CD Projekt Red conferma finalmente quello che tutti sospettavano su The Witcher 3 Songs of the Past: l’espansione doveva davvero uscire quest’anno

29 Maggio 2026
Attualità

Nintendo pensava di evitare lo scontro ma Call of Duty sbarca su Switch 2 il 23 ottobre 2026 scatenando il panico

29 Maggio 2026
Attualità

Apple credeva di proteggere Siri ma una nuova app sfrutta impostazioni nascoste per creare un chatbot rivale di ChatGPT aggirando tutti i controlli

29 Maggio 2026
Next Post

AMD rompe l'immagine dei Ryzen PRO sobri con chip Zen 5 più potenti e progettati per i professionisti

Lascia un commento Annulla risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Computer Law segue le novità di tecnologia, IA, smartphone, scienza e automotive con una lettura semplice e diretta.
Ogni giorno mettiamo in evidenza le tendenze digitali che stanno cambiando l'Italia e il mondo.

Seguici

Ultimi articoli

CD Projekt Red conferma finalmente quello che tutti sospettavano su The Witcher 3 Songs of the Past: l’espansione doveva davvero uscire quest’anno

29 Maggio 2026

Nintendo pensava di evitare lo scontro ma Call of Duty sbarca su Switch 2 il 23 ottobre 2026 scatenando il panico

29 Maggio 2026

Apple credeva di proteggere Siri ma una nuova app sfrutta impostazioni nascoste per creare un chatbot rivale di ChatGPT aggirando tutti i controlli

29 Maggio 2026

Artigos populares

  • SpaceX credeva di aver risolto tutto ma Starship V3 si ferma a T-40 secondi per il difetto che terrorizzava da mesi l’intero team di Starbase

    1035 shares
    Share 414 Tweet 259
  • La NASA deve aspettare 22 ore per ogni comando inviato a Voyager 1 e quasi 2 giorni per ricevere una risposta dalla sonda più lontana

    941 shares
    Share 376 Tweet 235
  • Italia abbandona Boeing e sceglie Airbus con un contratto da 1,6 miliardi, una decisione che cambia gli equilibri nella difesa europea

    772 shares
    Share 309 Tweet 193
  • Microsoft promette slide perfette con ChatGPT in PowerPoint ma questo bijou tecnologico si vendica contro chi scrive prompt confusi

    769 shares
    Share 308 Tweet 192
  • Chi siamo
  • Redazione
  • Scheda tecnica
  • Termini e Condizioni
  • Politica sui Cookie (UE)
  • Contatti

© 2026 Computer Law — Tutti i diritti riservati.

No Result
View All Result
  • Attualità
  • Elettronica
  • Scienza
  • IA
  • Mobilità
  • Economia

© 2026 Computer Law — Tutti i diritti riservati.

Rimani aggiornato con

Computer Law

Aggiungi come fonte preferita su Google