• vi

Kanadisk perspektiv på å undervise i kunstig intelligens til medisinstudenter

Takk for at du besøker Nature.com. Versjonen av nettleseren du bruker har begrenset CSS -støtte. For best resultat anbefaler vi å bruke en nyere versjon av nettleseren din (eller slå av kompatibilitetsmodus i Internet Explorer). I mellomtiden, for å sikre kontinuerlig støtte, viser vi nettstedet uten styling eller JavaScript.
Anvendelser av klinisk kunstig intelligens (AI) vokser raskt, men eksisterende læreplaner for medisinsk skole tilbyr begrenset undervisning som dekker dette området. Her beskriver vi et kunstig intelligensopplæringskurs vi utviklet og leverte til kanadiske medisinstudenter og gir anbefalinger for fremtidig opplæring.
Kunstig intelligens (AI) i medisin kan forbedre effektiviteten på arbeidsplassen og hjelpe klinisk beslutningstaking. For å trygt lede bruken av kunstig intelligens, må leger ha en viss forståelse av kunstig intelligens. Mange kommentarer tar til orde for å undervise i AI -konsepter1, for eksempel å forklare AI -modeller og verifiseringsprosesser2. Imidlertid er få strukturerte planer implementert, spesielt på nasjonalt nivå. Pinto dos Santos et al.3. 263 medisinstudenter ble kartlagt og 71% var enige om at de trengte opplæring i kunstig intelligens. Å undervise i kunstig intelligens til et medisinsk publikum krever nøye design som kombinerer tekniske og ikke-tekniske konsepter for studenter som ofte har omfattende forkunnskaper. Vi beskriver vår erfaring med å levere en serie AI -workshops til tre grupper medisinstudenter og komme med anbefalinger for fremtidig medisinsk utdanning i AI.
Vår fem ukers introduksjon til kunstig intelligens i medisinverksted for medisinstudenter ble holdt tre ganger mellom februar 2019 og april 2021. En plan for hvert verksted, med en kort beskrivelse av endringer i kurset, vises i figur 1.. Vårt kurs har Tre primære læringsmål: Studentene forstår hvordan data blir behandlet i kunstig intelligensapplikasjoner, analyserer kunstig intelligenslitteratur for kliniske applikasjoner og utnytter muligheter til å samarbeide med ingeniører som utvikler kunstig intelligens.
Blå er temaet for forelesningen og lyseblått er det interaktive spørsmålet og svarperioden. Den grå delen er i fokus for den korte litteraturgjennomgangen. De oransje seksjonene er utvalgte casestudier som beskriver kunstige intelligensmodeller eller teknikker. Green er et guidet programmeringskurs designet for å lære kunstig intelligens for å løse kliniske problemer og evaluere modeller. Innholdet og varigheten av verkstedene varierer basert på en vurdering av studentenes behov.
Det første verkstedet ble holdt ved University of British Columbia fra februar til april 2019, og alle 8 deltakere ga positive tilbakemeldinger4. På grunn av Covid-19 ble det andre verkstedet holdt praktisk talt i oktober-november 2020, med 222 medisinstudenter og 3 innbyggere fra 8 kanadiske medisinskoler som registrerte seg. Presentasjonsbilder og kode er lastet opp til et åpent nettsted (http://ubcaimed.github.io). Den viktigste tilbakemeldingen fra den første iterasjonen var at forelesningene var for intense og materialet for teoretisk. Å betjene Canadas seks forskjellige tidssoner gir ytterligere utfordringer. Dermed forkortet den andre verkstedet hver økt til 1 time, forenklet kursmaterialet, la til flere casestudier og opprettet kjeleplateprogrammer som gjorde det mulig for deltakerne å fullføre kodebiter med minimal feilsøking (boks 1). Viktige tilbakemeldinger fra den andre iterasjonen inkluderte positive tilbakemeldinger på programmeringsøvelsene og en forespørsel om å demonstrere planlegging for et maskinlæringsprosjekt. Derfor, i vårt tredje verksted, som ble holdt praktisk talt for 126 medisinstudenter i 2021 mars, inkluderte vi mer interaktive kodingsøvelser og tilbakemeldinger fra prosjektet for å demonstrere virkningen av å bruke verkstedkonsepter på prosjekter.
Dataanalyse: Et studiefelt i statistikk som identifiserer meningsfulle mønstre i data ved å analysere, behandle og kommunisere datamønstre.
Data mining: Prosessen med å identifisere og trekke ut data. I sammenheng med kunstig intelligens er dette ofte stort, med flere variabler for hver prøve.
Dimensjonalitetsreduksjon: Prosessen med å transformere data med mange individuelle funksjoner til færre funksjoner, samtidig som de bevarer de viktige egenskapene til det originale datasettet.
Kjennetegn (i sammenheng med kunstig intelligens): målbare egenskaper til en prøve. Ofte brukt om hverandre med "eiendom" eller "variabel".
Gradientaktiveringskart: En teknikk som brukes til å tolke kunstige intelligensmodeller (spesielt konvolusjonelle nevrale nettverk), som analyserer prosessen med å optimalisere den siste delen av nettverket for å identifisere regioner med data eller bilder som er svært prediktive.
Standardmodell: En eksisterende AI-modell som er forhåndsutdannet for å utføre lignende oppgaver.
Testing (i sammenheng med kunstig intelligens): Å observere hvordan en modell utfører en oppgave som bruker data den ikke har møtt før.
Opplæring (i sammenheng med kunstig intelligens): Å gi en modell med data og resultater slik at modellen justerer sine interne parametere for å optimalisere evnen til å utføre oppgaver ved hjelp av nye data.
Vektor: rekke data. I maskinlæring er hvert matriseelement vanligvis et unikt trekk ved prøven.
Tabell 1 viser de siste kursene for april 2021, inkludert målrettede læringsmål for hvert emne. Denne workshopen er beregnet på de som er nye på det tekniske nivået og krever ikke matematisk kunnskap utover det første året av en medisinsk grad. Kurset ble utviklet av 6 medisinstudenter og 3 lærere med avanserte grader i ingeniørfag. Ingeniører utvikler kunstig intelligensteori for å undervise, og medisinstudenter lærer klinisk relevant materiale.
Workshops inkluderer forelesninger, casestudier og guidet programmering. I det første foredraget gjennomgår vi utvalgte konsepter om dataanalyse i biostatistikk, inkludert datavisualisering, logistisk regresjon og sammenligning av beskrivende og induktiv statistikk. Selv om dataanalyse er grunnlaget for kunstig intelligens, utelukker vi temaer som data mining, signifikansetesting eller interaktiv visualisering. Dette skyldtes tidsbegrensninger og også fordi noen studenter hadde tidligere opplæring i biostatistikk og ønsket å dekke mer unike maskinlæringsemner. Det påfølgende foredraget introduserer moderne metoder og diskuterer AI -problemformulering, fordeler og begrensninger ved AI -modeller og modelltesting. Forelesningene kompletteres med litteratur og praktisk forskning på eksisterende kunstige intelligensenheter. Vi legger vekt på ferdighetene som kreves for å evaluere effektiviteten og gjennomførbarheten av en modell for å adressere kliniske spørsmål, inkludert å forstå begrensningene i eksisterende kunstige intelligensenheter. For eksempel ba vi elevene om å tolke retningslinjene for pediatrisk hodeskade foreslått av Kupperman et al., 5 som implementerte en kunstig intelligensbeslutningsalgoritme for å avgjøre om en CT -skanning ville være nyttig basert på en leges undersøkelse. Vi understreker at dette er et vanlig eksempel på at AI gir prediktiv analyse for leger å tolke, i stedet for å erstatte leger.
I de tilgjengelige open source bootstrap -programmeringseksempler (https://github.com/ubcaimed/ubcaimed.github.io/tree/master/programming_examples), viser vi hvordan vi skal utføre undersøkende dataanalyse, dimensjonalitetsreduksjon, standardmodellbelastning og trening . og testing. Vi bruker Google Colaboratory Notebooks (Google LLC, Mountain View, CA), som lar Python -kode utføres fra en nettleser. I fig. Figur 2 gir et eksempel på en programmeringsøvelse. Denne øvelsen innebærer å forutsi maligniteter ved bruk av Wisconsin Open Breast Imaging Dataset6 og en beslutnings -trealgoritme.
Presentere programmer gjennom uken om relaterte emner og velg eksempler fra publiserte AI -applikasjoner. Programmeringselementer er bare inkludert hvis de anses som relevante for å gi innsikt i fremtidig klinisk praksis, for eksempel hvordan de skal evaluere modeller for å avgjøre om de er klare til bruk i kliniske studier. Disse eksemplene kulminerer i en fullverdig ende-til-ende-applikasjon som klassifiserer svulster som godartede eller ondartet basert på medisinske bildeparametere.
Heterogenitet av forkunnskaper. Våre deltakere varierte i sitt nivå av matematisk kunnskap. For eksempel leter studenter med avansert ingeniørbakgrunn etter mer dyptgående materiale, for eksempel hvordan de skal utføre sine egne Fourier-transformasjoner. Å diskutere Fourier-algoritmen i klassen er imidlertid ikke mulig fordi den krever dyptgående kunnskap om signalbehandling.
Oppmøteutstrømning. Oppmøte på oppfølgingsmøter avviste, spesielt i online formater. En løsning kan være å spore oppmøte og gi et fullføringsbevis. Medisinske skoler er kjent for å gjenkjenne transkripsjoner av studentenes fritidslige akademiske aktiviteter, noe som kan oppmuntre studentene til å forfølge en grad.
Kursdesign: Fordi AI spenner over så mange underfelt, kan det være utfordrende å velge kjernekonsepter av passende dybde og bredde. For eksempel er kontinuiteten i bruk av AI -verktøy fra laboratoriet til klinikken et viktig tema. Mens vi dekker data forbehandling, modellbygging og validering, inkluderer vi ikke emner som Big Data Analytics, interaktiv visualisering eller gjennomføring av AI -kliniske studier, i stedet fokuserer vi på de mest unike AI -konseptene. Vårt ledende prinsipp er å forbedre leseferdighet, ikke ferdigheter. For eksempel å forstå hvordan en modell behandler inputfunksjoner er viktig for tolkbarhet. En måte å gjøre dette på er å bruke gradientaktiveringskart, som kan visualisere hvilke regioner av dataene som er forutsigbare. Dette krever imidlertid multivariat beregning og kan ikke introduseres8. Å utvikle en felles terminologi var utfordrende fordi vi prøvde å forklare hvordan vi skulle jobbe med data som vektorer uten matematisk formalisme. Merk at forskjellige begrep har samme betydning, for eksempel i epidemiologi, er en "karakteristikk" beskrevet som en "variabel" eller "attributt."
Kunnskapsretensjon. Fordi anvendelsen av AI er begrenset, gjenstår i hvilken grad deltakerne beholder kunnskap å se. Læreplaner for medisinsk skole er ofte avhengige av å gjenta avstand for å forsterke kunnskap under praktiske rotasjoner, 9 som også kan brukes på AI -utdanning.
Profesjonalitet er viktigere enn leseferdighet. Dybden på materialet er designet uten matematisk strenghet, noe som var et problem når du lanserte kliniske kurs i kunstig intelligens. I programmeringseksemplene bruker vi et malprogram som lar deltakerne fylle ut felt og kjøre programvaren uten å måtte finne ut hvordan de kan sette opp et komplett programmeringsmiljø.
Bekymringer om kunstig intelligens adressert: Det er bred bekymring for at kunstig intelligens kan erstatte noen kliniske plikter3. For å løse dette problemet forklarer vi begrensningene til AI, inkludert det faktum at nesten alle AI -teknologier som er godkjent av regulatorer, krever legeoppsyn11. Vi understreker også viktigheten av skjevhet fordi algoritmer er utsatt for skjevhet, spesielt hvis datasettet ikke er mangfoldig12. Følgelig kan en viss undergruppe modelleres feil, noe som fører til urettferdige kliniske beslutninger.
Ressurser er offentlig tilgjengelige: vi har skapt offentlig tilgjengelige ressurser, inkludert forelesningsspiller og kode. Selv om tilgangen til synkront innhold er begrenset på grunn av tidssoner, er open source -innhold en praktisk metode for asynkron læring siden AI -kompetanse ikke er tilgjengelig på alle medisinske skoler.
Tverrfaglig samarbeid: Denne workshopen er et joint venture initiert av medisinstudenter for å planlegge kurs sammen med ingeniører. Dette demonstrerer samarbeidsmuligheter og kunnskapshull på begge områdene, slik at deltakerne kan forstå den potensielle rollen de kan bidra i fremtiden.
Definer AI -kjernekompetanse. Å definere en liste over kompetanser gir en standardisert struktur som kan integreres i eksisterende kompetansebaserte medisinske læreplaner. Denne workshopen bruker for tiden læringsmålnivåer 2 (forståelse), 3 (applikasjon) og 4 (analyse) av Blooms taksonomi. Å ha ressurser på høyere klassifiseringsnivå, for eksempel å lage prosjekter, kan styrke kunnskapen ytterligere. Dette krever å jobbe med kliniske eksperter for å avgjøre hvordan AI -emner kan brukes på kliniske arbeidsflyter og forhindrer undervisning av repeterende emner som allerede er inkludert i standard medisinsk læreplan.
Lag casestudier ved bruk av AI. I likhet med kliniske eksempler, kan saksbasert læring forsterke abstrakte begreper ved å fremheve deres relevans for kliniske spørsmål. For eksempel analyserte en workshop-studie Googles AI-baserte diabetisk retinopati deteksjonssystem 13 for å identifisere utfordringer langs banen fra lab til klinikk, for eksempel eksterne valideringskrav og regulatoriske godkjenningsveier.
Bruk erfaringslæring: Tekniske ferdigheter krever fokusert praksis og gjentatt anvendelse for å mestre, likt de roterende læringsopplevelsene til kliniske traineer. En potensiell løsning er den flippede klasseromsmodellen, som er rapportert å forbedre kunnskapsretensjonen i ingeniørutdanning14. I denne modellen gjennomgår studentene teoretisk materiale uavhengig og klassetiden er viet til å løse problemer gjennom casestudier.
Skalering for flerfaglige deltakere: Vi ser for oss AI -adopsjon som involverer samarbeid på tvers av flere fagområder, inkludert leger og allierte helsepersonell med varierende treningsnivå. Derfor kan det hende at læreplaner må utvikles i samråd med fakultetet fra forskjellige avdelinger for å skreddersy innholdet til forskjellige helseomsorgsområder.
Kunstig intelligens er høyteknologisk og kjernekonseptene er relatert til matematikk og informatikk. Opplæring av helsepersonell for å forstå kunstig intelligens gir unike utfordringer innen innholdsvalg, klinisk relevans og leveringsmetoder. Vi håper at innsikten som er oppnådd fra AI i utdanningsverksteder vil hjelpe fremtidige lærere med å omfavne innovative måter å integrere AI i medisinsk utdanning.
Google Colaboratory Python -skriptet er åpen kildekode og tilgjengelig på: https://github.com/ubcaimed/ubcaimed.github.io/tree/master/.
Prober, KG og Khan, S. Rethinking Medical Education: A Call to Action. Akkad. medisin. 88, 1407–1410 (2013).
McCoy, LG osv. Hva trenger medisinstudenter egentlig å vite om kunstig intelligens? NPZH -tall. Medisin 3, 1–3 (2020).
Dos Santos, DP, et al. Medisinske studenters holdninger til kunstig intelligens: en multisenterundersøkelse. Euro. stråling. 29, 1640–1646 (2019).
Fan, KY, Hu, R. og Singla, R. Introduksjon til maskinlæring for medisinstudenter: et pilotprosjekt. J. Med. lære. 54, 1042–1043 (2020).
Cooperman N, et al. Identifisere barn med svært lav risiko for klinisk betydelig hjerneskade etter hodeskade: en prospektiv kohortstudie. Lancet 374, 1160–1170 (2009).
Street, WN, Wolberg, WH og Mangasarian, ol. Kjernefunksjonsekstraksjon for brystsvulstdiagnose. Biomedisinsk vitenskap. Bildebehandling. Biomedisinsk vitenskap. Weiss. 1905, 861–870 (1993).
Chen, PHC, Liu, Y. og Peng, L. Hvordan utvikle maskinlæringsmodeller for helsetjenester. Nat. Matt. 18, 410–414 (2019).
Selvaraju, RR et al. Grad-Cam: Visuell tolkning av dype nettverk via gradientbasert lokalisering. Proceedings of the IEEE International Conference on Computer Vision, 618–626 (2017).
Kumaravel B, Stewart K og Ilic D. Utvikling og evaluering av en spiralmodell for å vurdere evidensbasert medisinkompetanse ved bruk av OSSE i medisinsk utdanning. BMK Medicine. lære. 21, 1–9 (2021).
Kolachalama VB og Garg PS Machine Learning and Medical Education. NPZH -tall. medisin. 1, 1–3 (2018).
Van Leeuwen, KG, Schalekamp, ​​S., Rutten, MJ, Van Ginneken, B. og De Rooy, M. Kunstig intelligens i radiologi: 100 kommersielle produkter og deres vitenskapelige bevis. Euro. stråling. 31, 3797–3804 (2021).
Topol, EJ High-Performance Medicine: Konvergensen av menneskelig og kunstig intelligens. Nat. medisin. 25, 44–56 (2019).
Bede, E. et al. Menneskesentrert evaluering av et dypt læringssystem distribuert i klinikken for påvisning av diabetisk retinopati. Proceedings of 2020 CHI Conference on Human Factors in Computing Systems (2020).
Kerr, B. The Flipped Classroom in Engineering Education: A Research Review. Proceedings of the International Conference on Interactive Collaborative Learning 2015 (2015).
Forfatterne takker Danielle Walker, Tim Salcudin og Peter Zandstra fra Biomedical Imaging and Artificial Intelligence Research Cluster ved University of British Columbia for støtte og finansiering.
RH, PP, ZH, RS og MA var ansvarlige for å utvikle workshop -undervisningsinnholdet. RH og PP var ansvarlige for å utvikle programmeringseksemplene. KYF, OY, MT og PW var ansvarlige for den logistiske organisasjonen av prosjektet og analysen av verkstedene. RH, OY, MT, RS var ansvarlige for å lage figurer og tabeller. RH, KYF, PP, ZH, OY, MY, PW, TL, MA, RS var ansvarlig for å utarbeide og redigere dokumentet.
Kommunikasjonsmedisin Takk Carolyn McGregor, Fabio Moraes og Aditya Borakati for deres bidrag til gjennomgangen av dette arbeidet.


Post Time: Feb-19-2024