Tehisintellekt sama hästi haiguste diagnoosimisel kui inimesed

Esimeses omalaadses süstemaatilises ülevaates ja metaanalüüsis leitakse, et tehisintellekt (AI) on haiguse kuvamisel meditsiinipildi põhjal sama hea kui tervishoiutöötajad. Siiski on vaja rohkem kvaliteetseid uuringuid.

Tehisintellekt ja tervishoiutöötajad on meditsiiniliste piltide põhjal haiguse diagnoosimisel võrdselt tõhusad, näitavad uued uuringud.

Uus artikkel uurib olemasolevaid tõendeid, et teha kindlaks, kas tehisintellekt suudab haigusi diagnoosida sama tõhusalt kui tervishoiutöötajad.

Autorite teada - see tähendab suur teadlaste meeskond professor Alastair Dennistoni juhtimisel Birminghami ülikooli haiglate NHS Foundation Trustilt Ühendkuningriigis - on see esimene süstemaatiline ülevaade, milles võrreldakse tehisintellekti tulemusi kõigi haiguste meditsiiniprofessionaalidega.

Prof. Denniston ja meeskond otsisid kõigi 1. jaanuarist 2012 kuni 6. juunini 2019 avaldatud uuringute jaoks mitmeid meditsiinilisi andmebaase. Meeskond avaldas oma analüüsi tulemused ajakirjas Lanceti digitaalne tervis.

Tehisintellekt tervishoiutöötajatega

Teadlased otsisid uuringuid, milles võrreldi süvaõppe algoritmide diagnostilist tõhusust tervishoiutöötajate omaga, kui nad olid meditsiinilise pildistamise põhjal diagnoosi seadnud.

Nad uurisid aruannete kvaliteeti nimetatud uuringutes, nende kliinilist väärtust ja uuringute ülesehitust.

Lisaks sellele uurisid teadlased tehisintellekti diagnostilise jõudluse hindamisel tervishoiutöötajate omaga võrreldes kahte tulemust: spetsiifilisust ja tundlikkust.

„Tundlikkus” määratleb tõenäosuse, et diagnostikavahend saab selle haiguse korral positiivse tulemuse. Spetsiifilisus viitab diagnostilise testi täpsusele, mis täiendab tundlikkuse näitajat.

Valikuprotsess andis ainult 14 uuringut, mille kvaliteet oli analüüsi kaasamiseks piisavalt kõrge. Prof. Denniston selgitab: "Vaatasime üle 20 500 artiklit, kuid vähem kui 1% neist olid oma kujunduses ja aruandluses piisavalt tugevad, et sõltumatud ülevaatajad usaldasid oma väiteid väga."

"Veelgi enam, ainult 25 uuringus kinnitati tehisintellekti mudeleid väliselt (kasutades teise populatsiooni meditsiinilisi pilte) ja ainult 14 uuringus võrreldi tehisintellekti ja tervishoiutöötajate tulemusi sama testproovi abil."

"Selle käputäie kvaliteetsete uuringute käigus leidsime, et sügav õppimine võib tõepoolest tuvastada haigusi alates vähkidest kuni silmahaigusteni sama täpselt kui tervishoiutöötajad. Kuid on oluline märkida, et tehisintellekt ei ületanud oluliselt inimese diagnoosi. "

Prof Alastair Denniston

Täpsemalt leiti analüüsist, et tehisintellekt suudab haigust õigesti diagnoosida 87% -l juhtudest, samas kui tervishoiutöötajate poolt tuvastamine andis 86% täpsuse. Sügava õppimise algoritmide spetsiifilisus oli 93%, võrreldes inimestega 91%.

Kallutused võivad tehisintellektiga liialdada

Prof Denniston ja tema kolleegid juhivad tähelepanu ka mitmetele piirangutele, mille nad leidsid uuringutes, mis uurivad tehisintellekti diagnostilist jõudlust.

Esiteks uuritakse enamikus uuringutes tehisintellekti ja tervishoiutöötajate diagnostilist täpsust isoleeritud keskkonnas, mis ei jäljenda regulaarset kliinilist praktikat - näiteks jätaks arstid ilma täiendavast kliinilisest teabest, mida neil tavaliselt diagnoosi saamiseks vaja oleks.

Teiseks, teadlaste sõnul võrreldi enamikes uuringutes ainult andmekogumeid, samas kui diagnostika tulemuslikkuse kvaliteetsed uuringud nõuaksid inimestel selliste võrdluste tegemist.

Lisaks sellele kannatas kõigi uuringute autorite sõnul halb aruandlus, kusjuures analüüs ei arvestanud nimetatud andmekogudest puuduvat teavet. "Enamik [uuringuid] ei teatanud, kas mingeid andmeid oli puudu, kui suurt osa need esindasid ja kuidas puuduolevate andmetega analüüsis tegeleti," kirjutavad autorid.

Täiendavad piirangud hõlmavad ebajärjekindlat terminoloogiat, tundlikkuse ja spetsiifilisuse analüüsi künnise selgelt määramata jätmist ja valimivälise valideerimise puudumist.

"Uue potentsiaalselt elupäästva diagnostika kasutamise soovi ja hädavajaliku kvaliteetsete tõendite väljatöötamise vahel on loomupärane pinge nii, et see oleks kasulik patsientidele ja tervishoiusüsteemidele kliinilises praktikas," kommenteerib esimene autor dr Xiaoxuan Liu Birminghami ülikool.

„Meie töö peamine õppetund on see, et tehisintellektis - nagu ka tervishoiu mis tahes muu osas - on oluline hea õppekujundus. Ilma selleta saate hõlpsasti tutvustada eelarvamusi, mis moonutavad teie tulemusi. Need eelarvamused võivad põhjustada liialdatud väiteid tehisintellekti tööriistade hea toimivuse kohta, mis ei kajastu reaalses maailmas. "

Dr Xiaoxuan Liu

"Tõendid selle kohta, kuidas tehisintellekti algoritmid patsiendi tulemusi muudavad, peavad tulema võrdlustest randomiseeritud kontrollitud uuringute alternatiivsete diagnostiliste testidega," lisab kaasautor dr Livia Faes Moorfieldsi silmahaigast, London, Suurbritannia.

"Siiani pole vaevalt selliseid katseid, kus tehaks tehisintellekti algoritmi tehtud diagnostilisi otsuseid, et näha, mis juhtub siis patsientidele tegelikult oluliste tulemustega, nagu õigeaegne ravi, aeg haiglast väljakirjutamiseks või isegi elulemus."

none:  põetamine - ämmaemand vanurid - vananevad happe-refluks - gerd