PG taip pat gerai diagnozuoja ligą kaip ir žmonės

Pirmoji sisteminė tokio pobūdžio apžvalga ir metaanalizė rodo, kad dirbtinis intelektas (PG) lygiai taip pat gerai diagnozuoja ligą pagal medicininį įvaizdį, kaip ir sveikatos priežiūros specialistai. Tačiau būtina atlikti daugiau aukštos kokybės tyrimų.

Nauji tyrimai rodo, kad dirbtinis intelektas ir sveikatos priežiūros specialistai vienodai veiksmingai diagnozuoja ligą, remdamiesi medicininiu vaizdavimu.

Naujame straipsnyje nagrinėjami esami įrodymai, bandant nustatyti, ar dirbtinis intelektas gali diagnozuoti ligas taip pat efektyviai, kaip ir sveikatos priežiūros specialistai.

Autorių žiniomis, tai yra didžiulė tyrėjų komanda, vadovaujama profesoriaus Alastairo Dennistono iš Jungtinės Karalystės Birmingemo universitetinių ligoninių NHS fondo universiteto ligoninės, tai yra pirmoji sisteminė apžvalga, kurioje dirbtinio intelekto efektyvumas lyginamas su visų ligų medicinos specialistais.

Prof. Denniston ir komanda ieškojo kelių medicinos duomenų bazių visuose tyrimuose, paskelbtuose nuo 2012 m. Sausio 1 d. Iki 2019 m. Birželio 6 d. Komanda paskelbė savo analizės rezultatus žurnale „Lancet Digital Health“.

Dirbtinis intelektas prilygsta sveikatos priežiūros specialistams

Mokslininkai ieškojo tyrimų, kuriuose buvo lyginamas giluminio mokymosi algoritmų ir sveikatos priežiūros specialistų diagnostinis efektyvumas, kai jie nustatė diagnozę, pagrįstą medicininiu vaizdavimu.

Jie ištyrė minėtų tyrimų ataskaitų kokybę, jų klinikinę vertę ir tyrimų planą.

Be to, vertindami PG diagnostikos rezultatus, palyginti su sveikatos priežiūros specialistais, mokslininkai atkreipė dėmesį į du rezultatus: specifiškumą ir jautrumą.

„Jautrumas“ apibrėžia tikimybę, kad diagnozavimo priemonė gauna teigiamą rezultatą žmonėms, sergantiems šia liga. Specifiškumas reiškia diagnostinio tyrimo tikslumą, kuris papildo jautrumo matą.

Atrankos metu buvo atlikti tik 14 tyrimų, kurių kokybė buvo pakankamai aukšta, kad būtų galima juos įtraukti į analizę. Prof. Dennistonas paaiškina: „Peržiūrėjome daugiau nei 20 500 straipsnių, tačiau mažiau nei 1% jų buvo pakankamai tvirtai suplanuoti ir pranešti, kad nepriklausomi recenzentai labai pasitikėjo savo pretenzijomis“.

"Be to, tik 25 tyrimai patvirtino PG modelius išoriškai (naudojant skirtingų gyventojų medicininius vaizdus), o tik 14 tyrimų palygino PG ir sveikatos priežiūros specialistų, naudojančių tą patį bandinį, rezultatus."

„Vykdydami keletą aukštos kokybės tyrimų, mes nustatėme, kad gilus mokymasis iš tiesų gali tiksliai nustatyti ligas, pradedant vėžiu, baigiant akių ligomis, kaip ir sveikatos priežiūros specialistai. Tačiau svarbu pažymėti, kad dirbtinis intelektas iš esmės nepralenkė žmogaus diagnozės “.

Alastairas Dennistonas

Konkrečiau, analizė parodė, kad dirbtinis intelektas gali teisingai diagnozuoti ligą 87% atvejų, tuo tarpu sveikatos priežiūros specialistai nustatė tikslumą 86%. Gilaus mokymosi algoritmų specifiškumas buvo 93%, palyginti su žmonių 91%.

Šališkumai gali perdėti dirbtinio intelekto našumą

Prof. Denniston ir jo kolegos taip pat atkreipia dėmesį į keletą apribojimų, kuriuos jie nustatė tyrimuose, kuriuose nagrinėjama AI diagnostinė veikla.

Pirma, daugumoje tyrimų AI ir sveikatos priežiūros specialistų diagnostinis tikslumas nagrinėjamas izoliuotoje aplinkoje, kuri nemėgdžioja reguliarios klinikinės praktikos - pavyzdžiui, atimama iš gydytojų papildoma klinikinė informacija, kurios jiems paprastai prireiks diagnozei nustatyti.

Antra, sako mokslininkai, daugumoje tyrimų buvo lyginami tik duomenų rinkiniai, o norint atlikti aukštos kokybės diagnostinės veiklos tyrimus, reikėtų atlikti tokius palyginimus su žmonėmis.

Be to, visi tyrimai patyrė blogą ataskaitų teikimą, sako autoriai, o analizė neatsižvelgė į informaciją, kurios nebuvo minėtuose duomenų rinkiniuose. "Dauguma [tyrimų] nepranešė, ar trūksta kokių nors duomenų, kokia jų dalis ir kaip trūkstami duomenys buvo nagrinėjami analizuojant", - rašo autoriai.

Tarp papildomų apribojimų yra nenuosekli terminologija, aiškiai nenustatoma jautrumo ir specifiškumo analizės riba ir nėra atrinktų pavyzdžių.

„Tarp noro naudoti naują, potencialiai gyvybę gelbėjančią diagnostiką ir būtinybę parengti aukštos kokybės įrodymus tokiu būdu, kuris būtų naudingas pacientams ir sveikatos sistemoms klinikinėje praktikoje, yra savaiminė įtampa“, - komentuoja pirmasis autorius dr. Xiaoxuanas Liu iš Birmingemo universitetas.

„Pagrindinė mūsų darbo pamoka yra ta, kad dirbtinio intelekto srityje, kaip ir bet kurioje kitoje sveikatos priežiūros srityje, svarbu geras studijų planas. Be jo galite lengvai nustatyti šališkumą, kuris iškreipia jūsų rezultatus. Šie šališkumai gali sukelti perdėtus teiginius apie gerą dirbtinio intelekto įrankių našumą, kurie neišverčiami į realų pasaulį “.

Daktaras Xiaoxuanas Liu

„Įrodymai, kaip AI algoritmai pakeis paciento rezultatus, turi būti gaunami iš palyginimų su alternatyviais diagnostiniais tyrimais atsitiktinių imčių kontroliuojamuose tyrimuose“, - priduria bendraautorė dr. Livia Faes iš Moorfields akių ligoninės, Londone, JK.

"Iki šiol vargu ar yra tokių tyrimų, kuriuose būtų atliekami AI algoritmo priimti diagnostiniai sprendimai, siekiant sužinoti, kas tada nutinka pacientams iš tikrųjų svarbiems rezultatams, pvz., Savalaikis gydymas, laikas išrašyti iš ligoninės ar net išgyvenamumas."

none:  gomurio plyšys dirgliosios žarnos sindromas pernelyg aktyvi šlapimo pūslė (OAB)