Canadian perspective on teaching artificial intelligence to medical students

Takk for at du besøker Nature.com.Nettleserversjonen du bruker har begrenset CSS-støtte.For best resultat anbefaler vi at du bruker en nyere versjon av nettleseren din (eller slår av kompatibilitetsmodus i Internet Explorer).I mellomtiden, for å sikre kontinuerlig støtte, viser vi nettstedet uten styling eller JavaScript.
Anvendelser av klinisk kunstig intelligens (AI) vokser raskt, men eksisterende medisinske læreplaner tilbyr begrenset undervisning som dekker dette området.Her beskriver vi et opplæringskurs i kunstig intelligens vi utviklet og leverte til kanadiske medisinstudenter og gir anbefalinger for fremtidig opplæring.
Kunstig intelligens (AI) i medisin kan forbedre effektiviteten på arbeidsplassen og hjelpe kliniske beslutninger.For trygt å veilede bruken av kunstig intelligens, må leger ha en viss forståelse av kunstig intelligens.Mange kommentarer tar til orde for undervisning i AI-konsepter1, for eksempel å forklare AI-modeller og verifiseringsprosesser2.Det er imidlertid iverksatt få strukturerte planer, spesielt på nasjonalt nivå.Pinto dos Santos et al.3.263 medisinstudenter ble spurt og 71 % var enige i at de trengte opplæring i kunstig intelligens.Å undervise i kunstig intelligens til et medisinsk publikum krever nøye design som kombinerer tekniske og ikke-tekniske konsepter for studenter som ofte har omfattende forkunnskaper.Vi beskriver vår erfaring med å levere en serie AI-workshops til tre grupper medisinstudenter og gir anbefalinger for fremtidig medisinsk utdanning innen AI.
Vår fem ukers workshop for introduksjon til kunstig intelligens i medisin for medisinstudenter ble holdt tre ganger mellom februar 2019 og april 2021. En timeplan for hver workshop, med en kort beskrivelse av endringer i kurset, er vist i figur 1. Kurset vårt har tre primære læringsmål: studentene forstår hvordan data behandles i kunstig intelligens-applikasjoner, analyserer kunstig intelligens-litteraturen for kliniske anvendelser, og drar nytte av mulighetene til å samarbeide med ingeniører som utvikler kunstig intelligens.
Blått er tema for foredraget og lyseblått er den interaktive spørsmåls- og svarperioden.Den grå delen er fokus for den korte litteraturgjennomgangen.De oransje delene er utvalgte case-studier som beskriver kunstig intelligens-modeller eller teknikker.Green er et guidet programmeringskurs designet for å lære kunstig intelligens for å løse kliniske problemer og evaluere modeller.Innholdet og varigheten av workshopene varierer ut fra en vurdering av elevbehov.
Den første workshopen ble holdt ved University of British Columbia fra februar til april 2019, og alle 8 deltakerne ga positive tilbakemeldinger4.På grunn av COVID-19 ble den andre workshopen holdt praktisk talt i oktober-november 2020, med 222 medisinstudenter og 3 innbyggere fra 8 kanadiske medisinskoler som registrerte seg.Presentasjonslysbilder og kode har blitt lastet opp til et nettsted med åpen tilgang (http://ubcaimed.github.io).Den sentrale tilbakemeldingen fra den første iterasjonen var at forelesningene var for intense og materialet for teoretisk.Å betjene Canadas seks forskjellige tidssoner byr på ytterligere utfordringer.Dermed forkortet den andre workshopen hver økt til 1 time, forenklet kursmaterialet, la til flere kasusstudier og skapte standardprogrammer som tillot deltakerne å fullføre kodebiter med minimal feilsøking (boks 1).Sentrale tilbakemeldinger fra den andre iterasjonen inkluderte positive tilbakemeldinger på programmeringsøvelsene og en forespørsel om å demonstrere planlegging for et maskinlæringsprosjekt.Derfor, i vår tredje workshop, holdt virtuelt for 126 medisinstudenter i mars-april 2021, inkluderte vi mer interaktive kodeøvelser og tilbakemeldingsøkter for prosjekter for å demonstrere effekten av å bruke verkstedkonsepter på prosjekter.
Dataanalyse: Et studiefelt innen statistikk som identifiserer meningsfulle mønstre i data ved å analysere, behandle og kommunisere datamønstre.
Data mining: prosessen med å identifisere og trekke ut data.I sammenheng med kunstig intelligens er dette ofte stort, med flere variabler for hvert utvalg.
Dimensjonsreduksjon: Prosessen med å transformere data med mange individuelle funksjoner til færre funksjoner samtidig som de viktige egenskapene til det originale datasettet bevares.
Kjennetegn (i sammenheng med kunstig intelligens): målbare egenskaper til en prøve.Brukes ofte om hverandre med "eiendom" eller "variabel".
Gradient Activation Map: En teknikk som brukes til å tolke kunstig intelligens-modeller (spesielt konvolusjonelle nevrale nettverk), som analyserer prosessen med å optimalisere den siste delen av nettverket for å identifisere regioner med data eller bilder som er svært prediktive.
Standardmodell: En eksisterende AI-modell som er forhåndsopplært til å utføre lignende oppgaver.
Testing (i sammenheng med kunstig intelligens): observere hvordan en modell utfører en oppgave ved å bruke data den ikke har møtt før.
Opplæring (i sammenheng med kunstig intelligens): Gi en modell data og resultater slik at modellen justerer sine interne parametere for å optimalisere sin evne til å utføre oppgaver ved hjelp av nye data.
Vektor: rekke data.I maskinlæring er hvert array-element vanligvis et unikt trekk ved prøven.
Tabell 1 viser de siste kursene for april 2021, inkludert målrettede læringsmål for hvert emne.Denne workshopen er ment for de som er nye på det tekniske nivået og krever ingen matematisk kunnskap utover det første året av en medisinsk grad.Kurset er utviklet av 6 medisinstudenter og 3 lærere med videregående grader i ingeniørfag.Ingeniører utvikler kunstig intelligensteori for å undervise, og medisinstudenter lærer klinisk relevant materiale.
Workshops inkluderer forelesninger, casestudier og guidet programmering.I den første forelesningen gjennomgår vi utvalgte konsepter for dataanalyse i biostatistikk, inkludert datavisualisering, logistisk regresjon og sammenligning av beskrivende og induktiv statistikk.Selv om dataanalyse er grunnlaget for kunstig intelligens, ekskluderer vi emner som datautvinning, signifikanstesting eller interaktiv visualisering.Dette var på grunn av tidsbegrensninger og også fordi noen studenter hadde tidligere opplæring i biostatistikk og ønsket å dekke mer unike maskinlæringsemner.Den påfølgende forelesningen introduserer moderne metoder og diskuterer AI-problemformulering, fordeler og begrensninger ved AI-modeller og modelltesting.Forelesningene er supplert med litteratur og praktisk forskning på eksisterende kunstig intelligens-enheter.Vi legger vekt på ferdighetene som kreves for å evaluere effektiviteten og gjennomførbarheten til en modell for å løse kliniske spørsmål, inkludert å forstå begrensningene til eksisterende kunstig intelligens-enheter.For eksempel ba vi studentene om å tolke retningslinjene for pediatriske hodeskade foreslått av Kupperman et al., 5 som implementerte en kunstig intelligens-beslutningstrealgoritme for å avgjøre om en CT-skanning ville være nyttig basert på en leges undersøkelse.Vi understreker at dette er et vanlig eksempel på AI som gir prediktiv analyse for leger å tolke, i stedet for å erstatte leger.
I de tilgjengelige open source bootstrap-programmeringseksemplene (https://github.com/ubcaimed/ubcaimed.github.io/tree/master/programming_examples), viser vi hvordan du utfører utforskende dataanalyse, dimensjonalitetsreduksjon, standardmodelllasting og opplæring .og testing.Vi bruker Google Colaboratory-notatbøker (Google LLC, Mountain View, CA), som lar Python-kode kjøres fra en nettleser.I fig. gir figur 2 et eksempel på en programmeringsøvelse.Denne øvelsen innebærer å forutsi maligniteter ved å bruke Wisconsin Open Breast Imaging Dataset6 og en beslutningstrealgoritme.
Presenter programmer gjennom uken om relaterte emner og velg eksempler fra publiserte AI-applikasjoner.Programmeringselementer inkluderes kun dersom de anses som relevante for å gi innsikt i fremtidig klinisk praksis, for eksempel hvordan man vurderer modeller for å avgjøre om de er klare for bruk i kliniske studier.Disse eksemplene kulminerer i en fullverdig ende-til-ende-applikasjon som klassifiserer svulster som godartede eller ondartede basert på medisinske bildeparametere.
Heterogenitet av forkunnskaper.Deltakerne våre varierte i matematisk kunnskapsnivå.For eksempel leter studenter med avansert ingeniørbakgrunn etter mer dyptgående materiale, for eksempel hvordan de utfører sine egne Fourier-transformasjoner.Det er imidlertid ikke mulig å diskutere Fourier-algoritmen i klassen fordi det krever inngående kunnskap om signalbehandling.
Oppmøtestrøm.Oppmøtet på oppfølgingsmøter gikk ned, spesielt i nettformater.En løsning kan være å spore oppmøte og gi et ferdigbevis.Medisinske skoler er kjent for å gjenkjenne utskrifter av studentenes utenomfaglige akademiske aktiviteter, noe som kan oppmuntre studenter til å ta en grad.
Kursdesign: Fordi AI spenner over så mange underfelt, kan det være utfordrende å velge kjernekonsepter med passende dybde og bredde.For eksempel er kontinuiteten i bruk av AI-verktøy fra laboratoriet til klinikken et viktig tema.Selv om vi dekker dataforbehandling, modellbygging og validering, inkluderer vi ikke emner som big data-analyse, interaktiv visualisering eller gjennomføring av AI-kliniske studier, i stedet fokuserer vi på de mest unike AI-konseptene.Vårt ledende prinsipp er å forbedre leseferdigheter, ikke ferdigheter.For eksempel er det viktig for å forstå hvordan en modell behandler inputfunksjoner.En måte å gjøre dette på er å bruke gradientaktiveringskart, som kan visualisere hvilke områder av dataene som er forutsigbare.Dette krever imidlertid multivariat beregning og kan ikke introduseres8.Å utvikle en felles terminologi var utfordrende fordi vi prøvde å forklare hvordan man kan jobbe med data som vektorer uten matematisk formalisme.Merk at forskjellige begreper har samme betydning, for eksempel i epidemiologi beskrives en "karakteristikk" som en "variabel" eller "attributt".
Oppbevaring av kunnskap.Fordi bruken av AI er begrenset, gjenstår det å se i hvilken grad deltakerne beholder kunnskap.Læreplaner for medisinske skoler er ofte avhengige av repetisjon med mellomrom for å forsterke kunnskap under praktiske rotasjoner,9 som også kan brukes på AI-undervisning.
Profesjonalitet er viktigere enn leseferdighet.Dybden av materialet er designet uten matematisk strenghet, noe som var et problem ved lansering av kliniske kurs i kunstig intelligens.I programmeringseksemplene bruker vi et malprogram som lar deltakerne fylle ut felt og kjøre programvaren uten å måtte finne ut hvordan de skal sette opp et komplett programmeringsmiljø.
Bekymringer om kunstig intelligens adressert: Det er utbredt bekymring for at kunstig intelligens kan erstatte noen kliniske oppgaver3.For å løse dette problemet forklarer vi begrensningene til AI, inkludert det faktum at nesten alle AI-teknologier godkjent av regulatorer krever legetilsyn11.Vi understreker også viktigheten av skjevhet fordi algoritmer er utsatt for skjevhet, spesielt hvis datasettet ikke er mangfoldig12.Følgelig kan en viss undergruppe modelleres feil, noe som fører til urettferdige kliniske avgjørelser.
Ressurser er offentlig tilgjengelige: Vi har laget offentlig tilgjengelige ressurser, inkludert forelesningslysbilder og kode.Selv om tilgang til synkront innhold er begrenset på grunn av tidssoner, er åpen kildekode-innhold en praktisk metode for asynkron læring siden AI-ekspertise ikke er tilgjengelig på alle medisinskoler.
Tverrfaglig samarbeid: Denne workshopen er et joint venture initiert av medisinstudenter for å planlegge kurs sammen med ingeniører.Dette viser samarbeidsmuligheter og kunnskapshull på begge områder, slik at deltakerne kan forstå den potensielle rollen de kan bidra med i fremtiden.
Definer AI kjernekompetanse.Å definere en liste over kompetanse gir en standardisert struktur som kan integreres i eksisterende kompetansebaserte medisinske læreplaner.Denne workshopen bruker for tiden læringsmål nivå 2 (forståelse), 3 (applikasjon) og 4 (analyse) av Blooms taksonomi.Å ha ressurser på høyere klassifiseringsnivåer, som å lage prosjekter, kan styrke kunnskapen ytterligere.Dette krever samarbeid med kliniske eksperter for å finne ut hvordan AI-emner kan brukes på kliniske arbeidsflyter og forhindre undervisning i repeterende emner som allerede er inkludert i standard medisinske læreplaner.
Lag casestudier ved hjelp av AI.I likhet med kliniske eksempler kan case-basert læring forsterke abstrakte konsepter ved å fremheve deres relevans for kliniske spørsmål.For eksempel analyserte en verkstedstudie Googles AI-baserte deteksjonssystem for diabetisk retinopati 13 for å identifisere utfordringer langs veien fra laboratorium til klinikk, for eksempel eksterne valideringskrav og regulatoriske godkjenningsveier.
Bruk erfaringsbasert læring: Tekniske ferdigheter krever fokusert praksis og gjentatt bruk for å mestre, likt de roterende læringserfaringene til kliniske traineer.En potensiell løsning er flipped classroom-modellen, som er rapportert å forbedre kunnskapsbevaring i ingeniørutdanningen14.I denne modellen gjennomgår studentene teoretisk materiale uavhengig, og timen er viet til å løse problemer gjennom case-studier.
Skalering for tverrfaglige deltakere: Vi ser for oss AI-adopsjon som involverer samarbeid på tvers av flere disipliner, inkludert leger og alliert helsepersonell med varierende opplæringsnivå.Derfor kan det være nødvendig å utvikle læreplaner i samråd med fakulteter fra ulike institutter for å skreddersy innholdet til ulike områder av helsevesenet.
Kunstig intelligens er høyteknologisk og kjernebegrepene er relatert til matematikk og informatikk.Å lære opp helsepersonell til å forstå kunstig intelligens byr på unike utfordringer i innholdsvalg, klinisk relevans og leveringsmetoder.Vi håper at innsikten fra AI-in Education-verkstedene vil hjelpe fremtidige lærere til å omfavne innovative måter å integrere AI i medisinsk utdanning.
Google Colaboratory Python-skriptet er åpen kildekode og tilgjengelig på: https://github.com/ubcaimed/ubcaimed.github.io/tree/master/.
Prober, KG og Khan, S. Rethinking medisinsk utdanning: en oppfordring til handling.Akkad.medisin.88, 1407–1410 (2013).
McCoy, LG etc. Hva trenger medisinstudenter egentlig å vite om kunstig intelligens?NPZh tall.Medisin 3, 1–3 (2020).
Dos Santos, DP, et al.Medisinstudenters holdninger til kunstig intelligens: en multisenterundersøkelse.EURO.stråling.29, 1640–1646 (2019).
Fan, KY, Hu, R. og Singla, R. Introduksjon til maskinlæring for medisinstudenter: et pilotprosjekt.J. Med.lære bort.54, 1042–1043 (2020).
Cooperman N, et al.Identifisering av barn med svært lav risiko for klinisk signifikant hjerneskade etter hodeskade: en prospektiv kohortstudie.Lancet 374, 1160–1170 (2009).
Street, WN, Wolberg, WH og Mangasarian, OL.Kjernefysisk funksjonsekstraksjon for brystsvulstdiagnose.Biomedisinsk vitenskap.Bildebehandling.Biomedisinsk vitenskap.Weiss.1905, 861–870 (1993).
Chen, PHC, Liu, Y. og Peng, L. Hvordan utvikle maskinlæringsmodeller for helsevesenet.Nat.Matt.18, 410–414 (2019).
Selvaraju, RR et al.Grad-cam: Visuell tolkning av dype nettverk via gradientbasert lokalisering.Proceedings of the IEEE International Conference on Computer Vision, 618–626 (2017).
Kumaravel B, Stewart K og Ilic D. Utvikling og evaluering av en spiralmodell for vurdering av evidensbasert medisinkompetanse ved bruk av OSSE i medisinsk grunnutdanning.BMK Medisin.lære bort.21, 1–9 (2021).
Kolachalama VB og Garg PS Maskinlæring og medisinsk utdanning.NPZh tall.medisin.1, 1–3 (2018).
van Leeuwen, KG, Schalekamp, S., Rutten, MJ, van Ginneken, B. og de Rooy, M. Kunstig intelligens i radiologi: 100 kommersielle produkter og deres vitenskapelige bevis.EURO.stråling.31, 3797–3804 (2021).
Topol, EJ Høyytelsesmedisin: konvergensen av menneskelig og kunstig intelligens.Nat.medisin.25, 44–56 (2019).
Bede, E. et al.Menneskesentrert evaluering av et dyplæringssystem utplassert i klinikken for påvisning av diabetisk retinopati.Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems (2020).
Kerr, B. The flipped classroom in engineering education: A research review.Proceedings of the 2015 International Conference on Interactive Collaborative Learning (2015).
Forfatterne takker Danielle Walker, Tim Salcudin og Peter Zandstra fra Biomedical Imaging and Artificial Intelligence Research Cluster ved University of British Columbia for støtte og finansiering.
RH, PP, ZH, RS og MA var ansvarlige for å utvikle workshopens undervisningsinnhold.RH og PP var ansvarlige for å utvikle programmeringseksemplene.KYF, OY, MT og PW var ansvarlige for den logistiske organiseringen av prosjektet og analysen av verkstedene.RH, OY, MT, RS var ansvarlige for å lage figurer og tabeller.RH, KYF, PP, ZH, OY, MY, PW, TL, MA, RS var ansvarlige for utforming og redigering av dokumentet.
Kommunikasjonsmedisin takker Carolyn McGregor, Fabio Moraes og Aditya Borakati for deres bidrag til gjennomgangen av dette arbeidet.

Innleggstid: 19. februar 2024

Kanadisk perspektiv på undervisning i kunstig intelligens til medisinstudenter