A legeredményesebb GPT-4 magasabb pontszámot ért el, mint a fiatal orvosok – 60 helyes választ adott a 87-ből.
Több tucat kérdést tettek fel az MI-nek és különböző tudásszinten lévő szemésznek, hogy kiderüljön, ki vagy mi a jobb. Az eredmények alapján a technológia ígéretes, de azért ennél némileg bonyolultabb a képlet, jelen állás szerint van, hogy kicsit jobban teljesít az orvosi feladatsorok felett, és van, hogy igen rosszul. - írta a hvg.hu.
A PLOS Digital Health folyóiratban publikált tanulmányban a kutatók összesen 87 feleletválasztós kérdést szegeztek olyan nyelvi modelleknek, mint a Meta LLaMA, a Google PaLM 2, vagy a már említett GPT-4 régebbi, a ChatGPT ingyenes változatát kiszolgáló GPT-3.5.
A kérdéseket öt képzett szemész, három gyakorló szemész szakorvos, és két, még nem szakosodott fiatal orvos elé is letették. Olyan tankönyvből származtak a kérdések, melyek nem nyilvánosak, így a kutatók szerint a nyelvi modelleket nem is képezhették belőle – így nem rendelkeztek ismeretekkel ebből a tankönyvből.
Ami az eredményeket illeti, a GPT-4 magasabb pontszámot ért el, mint a gyakorló és a fiatal orvosok – 60 helyes választ adott a 87-ből. A szakképzett orvosok átlagosan 66,4 helyes választ adtak, amivel le tudták gyűrni a mesterséges intelligenciát.