Computer Law
  • Attualità
  • Elettronica
  • Scienza
  • IA
  • Mobilità
  • Economia
No Result
View All Result
AI News
  • Attualità
  • Elettronica
  • Scienza
  • IA
  • Mobilità
  • Economia
No Result
View All Result
Computer Law
No Result
View All Result

Uno studio Harvard mostra che il modello o1 di OpenAI ha individuato la diagnosi corretta nel 67% dei casi al triage, contro 50-55% per i medici.

Questa IA supera i medici umani su 2 diagnosi su 3 secondo Harvard

Bruno ARANZULLA di Bruno ARANZULLA
13 Maggio 2026
in Attualità, IA
0

Un team di Harvard Medical School e del Beth Israel Deaconess Medical Center ha testato modelli di IA su veri dossier di pronto soccorso, e il risultato scuote le abitudini: su casi reali, un modello ha proposto diagnosi iniziali più accurate di medici esperti.

Lo studio, pubblicato su Science, insiste su un punto: queste prestazioni non significano che l’IA possa prendere da sola decisioni vitali. Il test è stato fatto su informazioni testuali ricavate dalla cartella clinica, senza esame fisico, senza imaging, senza segnali non verbali. È proprio qui che inizia il dibattito, tra promessa di aiuto al triage e rischio di sovrafiducia.

Harvard Medical School testa 76 pazienti del Beth Israel

L’esperimento più commentato riguarda 76 pazienti arrivati al pronto soccorso del Beth Israel a Boston. Due medici attending hanno redatto le proprie ipotesi diagnostiche, mentre modelli di OpenAI facevano lo stesso a partire dalla medesima cartella, tipicamente parametri vitali, età, contesto e qualche riga di un’infermiera sul motivo della visita.

Le diagnosi sono state poi valutate in cieco da altri due medici, senza sapere cosa venisse da un umano o dall’IA. Al primo “touchpoint”, quello del triage in cui l’informazione è più povera e il tempo più contato, il modello o1 ha identificato la diagnosi esatta o molto vicina nel 67% dei casi, contro il 50-55% dei medici testati.

Leia também  Questa IA americana potrebbe trovare in poche ore le leghe capaci di sopravvivere alla fusione nucleare

Quando si aggiungevano più elementi nel corso della presa in carico, il divario si riduceva. Le cifre riportate mostrano un’IA all’82% quando la cartella è più completa, contro umani attorno al 70-79%, una differenza descritta come non statisticamente significativa. Lettura possibile: l’IA aiuta soprattutto quando si hanno pochi indizi, non quando tutto è già sul tavolo.

OpenAI o1 progredisce man mano che la cartella si arricchisce

Il lavoro non si ferma al triage. Il team ha annotato la prestazione in più momenti, fino alle decisioni di ricovero. In un’analisi numerica, o1 raggiunge il 72,4% quando si include la valutazione diretta del medico d’urgenza, poi sale all’81,6% nello stadio in cui sono disponibili abbastanza informazioni per decidere ricovero o trasferimento in terapia intensiva.

Un dettaglio metodologico conta, perché aderisce al reale: i ricercatori spiegano di non aver “ripulito” le cartelle. Hanno usato informazioni così come appaiono nel dossier medico, con il loro disordine abituale. Thomas Buckley, co-primo autore, giustifica questa scelta con la volontà di misurare la prestazione all’inizio del percorso, quando i dati sono scarsi e talvolta ambigui.

C’è anche un capitolo “piano di presa in carico” che colpisce forte. Su cinque vignette cliniche, l’IA ha ottenuto l’89% contro il 34% di un gruppo di 46 medici che usavano risorse classiche. Non significa che un reparto possa delegare le prescrizioni a una macchina, ma suggerisce un uso concreto: proporre una check-list di opzioni, individuare un’antibioticoterapia plausibile o segnalare che un protocollo di fine vita va discusso.

Leia também  Dopo le critiche su Liquid Glass, Apple corregge il tiro con macOS 27 e una novità Safari molto pratica

Raj Manrai e Adam Rodman avvertono sull’autonomia

Gli autori battono su un limite: tutto poggia sul testo. Eppure in pronto soccorso si diagnostica anche con una radiografia, un ECG, un’auscultazione, una marcia, un odore dell’alito, uno sguardo preoccupato, dei silenzi. I ricercatori notano che i modelli attuali restano più limitati sugli input non testuali, e che questi segnali pesano molto nelle decisioni rapide.

Raj Manrai, professore assistente di informatica biomedica, ammette che il modello ha superato un’ampia base di medici su più compiti, ma rifiuta l’interpretazione “sostituzione”. Adam Rodman, professore assistente di medicina, dice di essere stato sorpreso dal livello raggiunto, ricordando però che il pronto soccorso è solo un frammento del percorso, e che un mese di ricovero con dati abbondanti avrebbe probabilmente cambiato le carte.

La sfumatura è qui, e disturba: buoni punteggi non garantiscono una pratica sicura. Un’IA può essere brillante su una diagnosi rara e fragile su un caso banale mal descritto. In un ospedale, la domanda diventa operativa: chi porta la responsabilità se lo strumento suggerisce una pista e il team la segue? Gli autori invocano trial prospettici in condizioni reali, con paletti, prima di farne un copilota installato al cuore del pronto soccorso.

Fonte: Harvard

Tags: TECNOLOGIA
Tweet146Condividi234Invia
Bruno ARANZULLA

Bruno ARANZULLA

Bruno Aranzulla é um jornalista tech português especializado em atualidade digital, inteligência artificial, smartphones, ciência aplicada e automóvel conectado. Através da NetParceiro.pt, acompanha as inovações que estão a transformar o quotidiano dos leitores, com uma abordagem clara, acessível e focada nos usos reais. O seu trabalho editorial procura tornar a tecnologia mais compreensível, sem jargão desnecessário nem promessas exageradas. Interessa-se tanto pelos grandes lançamentos das marcas como pelas mudanças mais discretas que alteram a forma como trabalhamos, comunicamos, nos deslocamos e consumimos informação.

Artigos relacionados

Attualità

Google starebbe preparando i Googlebook per sostituire i Chromebook, con Android, Gemini e un’ambizione molto più premium

13 Maggio 2026
Attualità

I proprietari di Model Y 4680 constatano che la loro batteria ricarica dal 15 al 20% più lentamente delle LFP in 15 minuti in autostrada: la promessa Tesla della cella 4680 non si conferma nell’uso reale

13 Maggio 2026
Attualità

La Cina lancia LineShine, un supercomputer da 2 exaflops con 47.000 CPU senza alcun chip straniero: una risposta diretta ai controlli americani sui semiconduttori e a El Capitan

13 Maggio 2026
Next Post

AMD rompe l'immagine dei Ryzen PRO sobri con chip Zen 5 più potenti e progettati per i professionisti

Lascia un commento Annulla risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Computer Law segue le novità di tecnologia, IA, smartphone, scienza e automotive con una lettura semplice e diretta.
Ogni giorno mettiamo in evidenza le tendenze digitali che stanno cambiando l'Italia e il mondo.

Seguici

Ultimi articoli

Google starebbe preparando i Googlebook per sostituire i Chromebook, con Android, Gemini e un’ambizione molto più premium

13 Maggio 2026

I proprietari di Model Y 4680 constatano che la loro batteria ricarica dal 15 al 20% più lentamente delle LFP in 15 minuti in autostrada: la promessa Tesla della cella 4680 non si conferma nell’uso reale

13 Maggio 2026

La Cina lancia LineShine, un supercomputer da 2 exaflops con 47.000 CPU senza alcun chip straniero: una risposta diretta ai controlli americani sui semiconduttori e a El Capitan

13 Maggio 2026

Artigos populares

  • Google starebbe preparando i Googlebook per sostituire i Chromebook, con Android, Gemini e un’ambizione molto più premium

    585 shares
    Share 234 Tweet 146
  • AMD rompe l’immagine dei Ryzen PRO sobri con chip Zen 5 più potenti e progettati per i professionisti

    585 shares
    Share 234 Tweet 146
  • Gli astronomi hanno appena misurato in diretta la potenza di un getto di buco nero, e la cifra equivale a 10.000 Soli

    585 shares
    Share 234 Tweet 146
  • La Germania vuole usare le auto elettriche parcheggiate per ricaricare interi traghetti grazie al V2G

    585 shares
    Share 234 Tweet 146
  • Chi siamo
  • Redazione
  • Scheda tecnica
  • Termini e Condizioni
  • Politica sui Cookie (UE)
  • Contatti

© 2026 Computer Law — Tutti i diritti riservati.

No Result
View All Result
  • Attualità
  • Elettronica
  • Scienza
  • IA
  • Mobilità
  • Economia

© 2026 Computer Law — Tutti i diritti riservati.