• vi

Validering av en datautvinningsmodell mot tradisjonelle metoder for aldersberegning av dental blant koreanske ungdommer og unge voksne

Takk for at du besøker Nature.com.Nettleserversjonen du bruker har begrenset CSS-støtte.For best resultat anbefaler vi at du bruker en nyere versjon av nettleseren din (eller slår av kompatibilitetsmodus i Internet Explorer).I mellomtiden, for å sikre kontinuerlig støtte, viser vi nettstedet uten styling eller JavaScript.
Tenner regnes som den mest nøyaktige indikatoren på menneskekroppens alder og brukes ofte i rettsmedisinsk aldersvurdering.Vi hadde som mål å validere datautvinning-baserte tannalderestimater ved å sammenligne estimeringsnøyaktigheten og klassifiseringsytelsen til 18-årsgrensen med tradisjonelle metoder og datautvinningsbaserte aldersestimater.Totalt ble det samlet inn 2657 panoramabilder fra koreanske og japanske borgere i alderen 15 til 23 år.De ble delt inn i et treningssett som hver inneholdt 900 koreanske røntgenbilder, og et internt testsett som inneholdt 857 japanske røntgenbilder.Vi sammenlignet klassifiseringsnøyaktigheten og effektiviteten til tradisjonelle metoder med testsett av data mining-modeller.Nøyaktigheten til den tradisjonelle metoden på det interne testsettet er litt høyere enn for data mining-modellen, og forskjellen er liten (gjennomsnittlig absolutt feil <0,21 år, rotmiddelkvadratfeil <0,24 år).Klassifiseringsytelsen for 18-års cutoff er også lik mellom tradisjonelle metoder og data mining-modeller.Dermed kan tradisjonelle metoder erstattes av data mining-modeller når man utfører rettsmedisinsk aldersvurdering ved å bruke modenheten til andre og tredje jeksler hos koreanske ungdommer og unge voksne.
Dental aldersvurdering er mye brukt i rettsmedisin og pediatrisk tannbehandling.Spesielt på grunn av den høye korrelasjonen mellom kronologisk alder og tannutvikling, er aldersvurdering etter tannutviklingsstadier et viktig kriterium for å vurdere alderen til barn og ungdom1,2,3.For unge mennesker har imidlertid estimering av tannalder basert på dental modenhet sine begrensninger fordi tannveksten er nesten fullført, med unntak av de tredje molarene.Det juridiske formålet med å fastsette alderen til unge mennesker og ungdom er å gi nøyaktige estimater og vitenskapelig bevis på om de har nådd myndig alder.I den medisinsk-juridiske praksisen til ungdom og unge voksne i Korea ble alder estimert ved hjelp av Lees metode, og en lovlig terskel på 18 år ble forutsagt basert på dataene rapportert av Oh et al 5 .
Maskinlæring er en type kunstig intelligens (AI) som gjentatte ganger lærer og klassifiserer store mengder data, løser problemer på egen hånd og driver dataprogrammering.Maskinlæring kan oppdage nyttige skjulte mønstre i store datamengder6.I motsetning til dette kan klassiske metoder, som er arbeidskrevende og tidkrevende, ha begrensninger når de håndterer store mengder komplekse data som er vanskelige å behandle manuelt7.Derfor har mange studier nylig blitt utført ved å bruke de nyeste datateknologiene for å minimere menneskelige feil og effektivt behandle flerdimensjonale data8,9,10,11,12.Spesielt har dyp læring blitt mye brukt i medisinsk bildeanalyse, og ulike metoder for aldersestimering ved automatisk å analysere røntgenbilder har blitt rapportert for å forbedre nøyaktigheten og effektiviteten av aldersestimering13,14,15,16,17,18,19,20 .For eksempel utviklet Halabi et al 13 en maskinlæringsalgoritme basert på konvolusjonelle nevrale nettverk (CNN) for å estimere skjelettalder ved hjelp av røntgenbilder av barnehender.Denne studien foreslår en modell som bruker maskinlæring på medisinske bilder og viser at disse metodene kan forbedre diagnostisk nøyaktighet.Li et al14 estimerte alder fra bekkenrøntgenbilder ved hjelp av en dyp lærings-CNN og sammenlignet dem med regresjonsresultater ved bruk av estimering av forbeningsstadium.De fant at CNN-modellen for dyp læring viste samme aldersestimatiske ytelse som den tradisjonelle regresjonsmodellen.Guo et al.s studie [15] evaluerte ytelsen til alderstoleranseklassifisering av CNN-teknologi basert på tannortofoto, og resultatene av CNN-modellen viste at mennesker overgikk ytelsen til aldersklassifiseringen.
De fleste studier om aldersestimering ved bruk av maskinlæring bruker dyplæringsmetoder13,14,15,16,17,18,19,20.Aldersestimering basert på dyp læring rapporteres å være mer nøyaktig enn tradisjonelle metoder.Denne tilnærmingen gir imidlertid liten mulighet til å presentere det vitenskapelige grunnlaget for aldersestimater, slik som aldersindikatorene som er brukt i estimatene.Det er også rettslig tvist om hvem som foretar inspeksjonene.Derfor er aldersestimat basert på dyp læring vanskelig å akseptere av administrative og rettslige myndigheter.Data mining (DM) er en teknikk som kan oppdage ikke bare forventet, men også uventet informasjon som en metode for å oppdage nyttige korrelasjoner mellom store datamengder6,21,22.Maskinlæring brukes ofte i datautvinning, og både datautvinning og maskinlæring bruker de samme nøkkelalgoritmene for å oppdage mønstre i data.Aldersestimering ved bruk av tannutvikling baserer seg på undersøkers vurdering av modenhet av måltennene, og denne vurderingen uttrykkes som et stadium for hver måltann.DM kan brukes til å analysere sammenhengen mellom tannvurderingsstadiet og faktisk alder og har potensial til å erstatte tradisjonell statistisk analyse.Derfor, hvis vi bruker DM-teknikker for aldersestimering, kan vi implementere maskinlæring i rettsmedisinsk aldersestimering uten å bekymre oss for juridisk ansvar.Det er publisert flere komparative studier på mulige alternativer til tradisjonelle manuelle metoder brukt i rettsmedisinsk praksis og EBM-baserte metoder for å bestemme tannalder.Shen et al23 viste at DM-modellen er mer nøyaktig enn den tradisjonelle Camerer-formelen.Galibourg et al24 brukte forskjellige DM-metoder for å forutsi alder i henhold til Demirdjian-kriteriet25, og resultatene viste at DM-metoden overgikk Demirdjian- og Willems-metodene ved å estimere alderen til den franske befolkningen.
For å anslå tannlegealderen til koreanske ungdommer og unge voksne, er Lees metode 4 mye brukt i koreansk rettsmedisinsk praksis.Denne metoden bruker tradisjonell statistisk analyse (som multippel regresjon) for å undersøke forholdet mellom koreanske emner og kronologisk alder.I denne studien er metoder for aldersestimat oppnådd ved bruk av tradisjonelle statistiske metoder definert som "tradisjonelle metoder."Lees metode er en tradisjonell metode, og dens nøyaktighet er bekreftet av Oh et al.5;Imidlertid er anvendeligheten av aldersestimat basert på DM-modellen i koreansk rettsmedisinsk praksis fortsatt tvilsom.Målet vårt var å vitenskapelig validere den potensielle nytten av aldersestimering basert på DM-modellen.Hensikten med denne studien var (1) å sammenligne nøyaktigheten til to DM-modeller i estimering av tannalder og (2) å sammenligne klassifiseringsytelsen til 7 DM-modeller i en alder av 18 år med de oppnådd ved bruk av tradisjonelle statistiske metoder. og tredje jeksler i begge kjever.
Gjennomsnitt og standardavvik for kronologisk alder etter stadium og tanntype er vist online i tilleggstabell S1 (treningssett), tilleggstabell S2 (internt testsett) og tilleggstabell S3 (eksternt testsett).Kappa-verdiene for intra- og interobservatør-pålitelighet hentet fra treningssettet var henholdsvis 0,951 og 0,947.P-verdier og 95 % konfidensintervaller for kappa-verdier er vist i tilleggstabell S4 på nett.Kappa-verdien ble tolket som "nesten perfekt", i samsvar med kriteriene til Landis og Koch26.
Når man sammenligner gjennomsnittlig absolutt feil (MAE), utkonkurrerer den tradisjonelle metoden DM-modellen litt for alle kjønn og i det eksterne mannlige testsettet, med unntak av multilayer perceptron (MLP).Forskjellen mellom den tradisjonelle modellen og DM-modellen på det interne MAE-testsettet var 0,12–0,19 år for menn og 0,17–0,21 år for kvinner.For det eksterne testbatteriet er forskjellene mindre (0,001–0,05 år for menn og 0,05–0,09 år for kvinner).I tillegg er root mean square error (RMSE) litt lavere enn den tradisjonelle metoden, med mindre forskjeller (0,17–0,24, 0,2–0,24 for det mannlige interne testsettet, og 0,03–0,07, 0,04–0,08 for eksternt testsett).).MLP viser litt bedre ytelse enn Single Layer Perceptron (SLP), bortsett fra når det gjelder det eksterne testsettet for kvinner.For MAE og RMSE skårer det eksterne testsettet høyere enn det interne testsettet for alle kjønn og modeller.Alle MAE og RMSE er vist i tabell 1 og figur 1.
MAE og RMSE av tradisjonelle og data mining regresjonsmodeller.Gjennomsnittlig absolutt feil MAE, root mean square error RMSE, enkeltlags perceptron SLP, flerlags perceptron MLP, tradisjonell CM-metode.
Klassifiseringsytelse (med en grense på 18 år) av de tradisjonelle modellene og DM-modellene ble demonstrert i form av sensitivitet, spesifisitet, positiv prediktiv verdi (PPV), negativ prediktiv verdi (NPV) og areal under mottakerens driftskarakteristiske kurve (AUROC) 27 (Tabell 2, Figur 2 og Supplerende Figur 1 online).Når det gjelder følsomheten til det interne testbatteriet, presterte tradisjonelle metoder best blant menn og dårligere blant kvinner.Forskjellen i klassifiseringsytelse mellom tradisjonelle metoder og SD er imidlertid 9,7 % for menn (MLP) og bare 2,4 % for kvinner (XGBoost).Blant DM-modeller viste logistisk regresjon (LR) bedre sensitivitet hos begge kjønn.Når det gjelder spesifisiteten til det interne testsettet, ble det observert at de fire SD-modellene presterte bra hos menn, mens den tradisjonelle modellen presterte bedre hos kvinner.Forskjellene i klassifiseringsytelse for menn og kvinner er henholdsvis 13,3 % (MLP) og 13,1 % (MLP), noe som indikerer at forskjellen i klassifiseringsytelse mellom modellene overstiger sensitiviteten.Blant DM-modellene presterte støttevektormaskinen (SVM), beslutningstreet (DT) og tilfeldig skog (RF) modellene best blant menn, mens LR-modellen gjorde det best blant kvinner.AUROC for den tradisjonelle modellen og alle SD-modeller var større enn 0,925 (k-nærmeste nabo (KNN) hos menn), noe som viser utmerket klassifiseringsytelse ved å diskriminere 18 år gamle prøver28.For det eksterne testsettet var det en nedgang i klassifiseringsytelse når det gjelder sensitivitet, spesifisitet og AUROC sammenlignet med det interne testsettet.Dessuten varierte forskjellen i sensitivitet og spesifisitet mellom klassifiseringsytelsen til de beste og dårligste modellene fra 10 % til 25 % og var større enn forskjellen i det interne testsettet.
Sensitivitet og spesifisitet av data mining klassifiseringsmodeller sammenlignet med tradisjonelle metoder med en grense på 18 år.KNN k nærmeste nabo, SVM støtte vektor maskin, LR logistisk regresjon, DT beslutningstre, RF random skog, XGB XGBoost, MLP flerlags perceptron, tradisjonell CM metode.
Det første trinnet i denne studien var å sammenligne nøyaktigheten av tannalderestimater oppnådd fra syv DM-modeller med de som ble oppnådd ved bruk av tradisjonell regresjon.MAE og RMSE ble evaluert i interne testsett for begge kjønn, og forskjellen mellom den tradisjonelle metoden og DM-modellen varierte fra 44 til 77 dager for MAE og fra 62 til 88 dager for RMSE.Selv om den tradisjonelle metoden var litt mer nøyaktig i denne studien, er det vanskelig å konkludere om en så liten forskjell har klinisk eller praktisk betydning.Disse resultatene indikerer at nøyaktigheten av dental aldersberegning ved bruk av DM-modellen er nesten den samme som den tradisjonelle metoden.Direkte sammenligning med resultater fra tidligere studier er vanskelig fordi ingen studie har sammenlignet nøyaktigheten av DM-modeller med tradisjonelle statistiske metoder ved bruk av samme teknikk for å registrere tenner i samme aldersgruppe som i denne studien.Galibourg et al24 sammenlignet MAE og RMSE mellom to tradisjonelle metoder (Demirjian-metode25 og Willems-metode29) og 10 DM-modeller i en fransk befolkning i alderen 2 til 24 år.De rapporterte at alle DM-modeller var mer nøyaktige enn tradisjonelle metoder, med forskjeller på henholdsvis 0,20 og 0,38 år i MAE og 0,25 og 0,47 år i RMSE sammenlignet med Willems- og Demirdjian-metodene.Avviket mellom SD-modellen og tradisjonelle metoder vist i Halibourg-studien tar hensyn til en rekke rapporter30,31,32,33 om at Demirdjian-metoden ikke nøyaktig estimerer tannalder i andre populasjoner enn de franske kanadierne som studien var basert på.I denne studien.Tai et al 34 brukte MLP-algoritmen for å forutsi tannalderen fra 1636 kinesiske kjeveortopedisk fotografier og sammenlignet nøyaktigheten med resultatene av Demirjian og Willems-metoden.De rapporterte at MLP har høyere nøyaktighet enn tradisjonelle metoder.Forskjellen mellom Demirdjian-metoden og den tradisjonelle metoden er <0,32 år, og Willems-metoden er 0,28 år, som er lik resultatene fra denne studien.Resultatene fra disse tidligere studiene24,34 stemmer også overens med resultatene fra denne studien, og aldersestimeringsnøyaktigheten til DM-modellen og den tradisjonelle metoden er like.Basert på de presenterte resultatene kan vi imidlertid bare forsiktig konkludere med at bruken av DM-modeller for å estimere alder kan erstatte eksisterende metoder på grunn av mangelen på sammenlignende og referanse til tidligere studier.Oppfølgingsstudier med større prøver er nødvendig for å bekrefte resultatene oppnådd i denne studien.
Blant studiene som tester nøyaktigheten til SD i estimering av tannalder, viste noen høyere nøyaktighet enn vår studie.Stepanovsky et al 35 brukte 22 SD-modeller på panorama-røntgenbilder av 976 tsjekkiske innbyggere i alderen 2,7 til 20,5 år og testet nøyaktigheten til hver modell.De vurderte utviklingen av totalt 16 øvre og nedre venstre permanente tenner ved å bruke klassifiseringskriteriene foreslått av Moorrees et al 36 .MAE varierer fra 0,64 til 0,94 år og RMSE varierer fra 0,85 til 1,27 år, som er mer nøyaktige enn de to DM-modellene som ble brukt i denne studien.Shen et al23 brukte Cameriere-metoden for å estimere tannalderen på syv permanente tenner i venstre underkjeve hos østkinesiske innbyggere i alderen 5 til 13 år og sammenlignet den med alder beregnet ved bruk av lineær regresjon, SVM og RF.De viste at alle tre DM-modellene har høyere nøyaktighet sammenlignet med den tradisjonelle Cameriere-formelen.MAE og RMSE i Shens studie var lavere enn de i DM-modellen i denne studien.Den økte presisjonen av studiene av Stepanovsky et al.35 og Shen et al.23 kan skyldes inkludering av yngre forsøkspersoner i deres studieutvalg.Fordi aldersestimater for deltakere med utviklende tenner blir mer nøyaktige ettersom antall tenner øker under tannutvikling, kan nøyaktigheten til den resulterende aldersestimatmetoden bli kompromittert når studiedeltakerne er yngre.I tillegg er MLPs feil i aldersestimat litt mindre enn SLP, noe som betyr at MLP er mer nøyaktig enn SLP.MLP anses som litt bedre for aldersestimat, muligens på grunn av de skjulte lagene i MLP38.Det er imidlertid et unntak for det ytre utvalget av kvinner (SLP 1,45, MLP 1,49).Funnet om at MLP er mer nøyaktig enn SLP når det gjelder aldersvurdering, krever ytterligere retrospektive studier.
Klassifiseringsytelsen til DM-modellen og den tradisjonelle metoden ved en 18-års terskel ble også sammenlignet.Alle testede SD-modeller og tradisjonelle metoder på det interne testsettet viste praktisk talt akseptable nivåer av diskriminering for 18-åringen.Sensitiviteten for menn og kvinner var henholdsvis høyere enn 87,7 % og 94,9 %, og spesifisiteten var større enn 89,3 % og 84,7 %.AUROC for alle testede modeller overstiger også 0,925.Så vidt vi vet har ingen studie testet ytelsen til DM-modellen for 18-års klassifisering basert på dental modenhet.Vi kan sammenligne resultatene av denne studien med klassifiseringsytelsen til dyplæringsmodeller på panorama røntgenbilder.Guo et al.15 beregnet klassifiseringsytelsen til en CNN-basert dyplæringsmodell og en manuell metode basert på Demirjians metode for en viss aldersterskel.Sensitiviteten og spesifisiteten til den manuelle metoden var henholdsvis 87,7 % og 95,5 %, og sensitiviteten og spesifisiteten til CNN-modellen oversteg henholdsvis 89,2 % og 86,6 %.De konkluderte med at dyplæringsmodeller kan erstatte eller overgå manuell vurdering ved klassifisering av aldersterskler.Resultatene av denne studien viste lignende klassifiseringsytelse;Det antas at klassifisering ved bruk av DM-modeller kan erstatte tradisjonelle statistiske metoder for aldersestimering.Blant modellene var DM LR den beste modellen når det gjelder sensitivitet for den mannlige prøven og sensitivitet og spesifisitet for den kvinnelige prøven.LR rangerer nummer to i spesifisitet for menn.Dessuten anses LR for å være en av de mer brukervennlige DM35-modellene og er mindre kompleks og vanskelig å behandle.Basert på disse resultatene ble LR ansett som den beste cutoff-klassifiseringsmodellen for 18-åringer i den koreanske befolkningen.
Samlet sett var nøyaktigheten av aldersestimering eller klassifiseringsytelse på det eksterne testsettet dårlig eller lavere sammenlignet med resultatene på det interne testsettet.Noen rapporter indikerer at klassifiseringsnøyaktighet eller effektivitet avtar når aldersestimater basert på den koreanske befolkningen brukes på den japanske befolkningen5,39, og et lignende mønster ble funnet i denne studien.Denne forverringstrenden ble også observert i DM-modellen.Derfor, for å estimere alder nøyaktig, selv når du bruker DM i analyseprosessen, bør metoder avledet fra innfødte befolkningsdata, for eksempel tradisjonelle metoder, foretrekkes5,39,40,41,42.Siden det er uklart om dyplæringsmodeller kan vise lignende trender, er studier som sammenligner klassifiseringsnøyaktighet og effektivitet ved bruk av tradisjonelle metoder, DM-modeller og dyplæringsmodeller på de samme prøvene nødvendig for å bekrefte om kunstig intelligens kan overvinne disse raseforskjellene i begrenset alder.vurderinger.
Vi demonstrerer at tradisjonelle metoder kan erstattes av aldersestimering basert på DM-modellen i rettsmedisinsk aldersestimeringspraksis i Korea.Vi oppdaget også muligheten for å implementere maskinlæring for rettsmedisinsk aldersvurdering.Det er imidlertid klare begrensninger, for eksempel det utilstrekkelige antallet deltakere i denne studien til å definitivt fastslå resultatene, og mangelen på tidligere studier for å sammenligne og bekrefte resultatene av denne studien.I fremtiden bør DM-studier utføres med større antall prøver og mer mangfoldige populasjoner for å forbedre dens praktiske anvendelighet sammenlignet med tradisjonelle metoder.For å validere muligheten for å bruke kunstig intelligens for å estimere alder i flere populasjoner, er fremtidige studier nødvendig for å sammenligne klassifiseringsnøyaktigheten og effektiviteten til DM- og dyplæringsmodeller med tradisjonelle metoder i de samme prøvene.
Studien brukte 2657 ortografiske fotografier samlet fra koreanske og japanske voksne i alderen 15 til 23 år.De koreanske røntgenbildene ble delt inn i 900 treningssett (19,42 ± 2,65 år) og 900 interne testsett (19,52 ± 2,59 år).Treningssettet ble samlet inn ved én institusjon (Seoul St. Mary's Hospital), og det eget testsettet ble samlet inn ved to institusjoner (Seoul National University Dental Hospital og Yonsei University Dental Hospital).Vi samlet også 857 røntgenbilder fra andre populasjonsbaserte data (Iwate Medical University, Japan) for ekstern testing.Røntgenbilder av japanske forsøkspersoner (19,31 ± 2,60 år) ble valgt som eksternt testsett.Data ble samlet inn retrospektivt for å analysere stadier av tannutvikling på panorama-røntgenbilder tatt under tannbehandling.Alle data som ble samlet inn var anonyme bortsett fra kjønn, fødselsdato og røntgenbilde.Inkluderings- og eksklusjonskriterier var de samme som tidligere publiserte studier 4, 5.Den faktiske alderen på prøven ble beregnet ved å trekke fødselsdatoen fra datoen røntgenbildet ble tatt.Utvalgsgruppen ble delt inn i ni aldersgrupper.Alders- og kjønnsfordelingen er vist i tabell 3. Denne studien ble utført i samsvar med Helsinki-erklæringen og godkjent av Institutional Review Board (IRB) ved Seoul St. Mary's Hospital ved det katolske universitetet i Korea (KC22WISI0328).På grunn av den retrospektive utformingen av denne studien, kunne ikke informert samtykke innhentes fra alle pasienter som gjennomgikk radiografisk undersøkelse for terapeutiske formål.Seoul Korea University St. Mary's Hospital (IRB) frafalt kravet om informert samtykke.
Utviklingsstadier av bimaxillære andre og tredje molarer ble vurdert i henhold til Demircan-kriteriene25.Kun én tann ble valgt hvis samme type tann ble funnet på venstre og høyre side av hver kjeve.Hvis homologe tenner på begge sider var på forskjellige utviklingsstadier, ble tannen med det nedre utviklingsstadiet valgt for å ta hensyn til usikkerhet i estimert alder.Ett hundre tilfeldig utvalgte røntgenbilder fra treningssettet ble scoret av to erfarne observatører for å teste interobservatør-pålitelighet etter forhåndskalibrering for å bestemme dental modenhet.Intraobservatørens pålitelighet ble vurdert to ganger med tre måneders intervaller av den primære observatøren.
Kjønn og utviklingsstadiet til andre og tredje jeksler i hver kjeve i treningssettet ble estimert av en primær observatør trent med forskjellige DM-modeller, og den faktiske alderen ble satt som målverdi.SLP- og MLP-modeller, som er mye brukt i maskinlæring, ble testet mot regresjonsalgoritmer.DM-modellen kombinerer lineære funksjoner ved å bruke utviklingsstadiene til de fire tennene og kombinerer disse dataene for å estimere alder.SLP er det enkleste nevrale nettverket og inneholder ikke skjulte lag.SLP fungerer basert på terskeloverføring mellom noder.SLP-modellen i regresjon er matematisk lik multippel lineær regresjon.I motsetning til SLP-modellen har MLP-modellen flere skjulte lag med ikke-lineære aktiveringsfunksjoner.Eksperimentene våre brukte et skjult lag med bare 20 skjulte noder med ikke-lineære aktiveringsfunksjoner.Bruk gradientnedstigning som optimaliseringsmetode og MAE og RMSE som tapsfunksjon for å trene vår maskinlæringsmodell.Den best oppnådde regresjonsmodellen ble brukt på de interne og eksterne testsettene og alderen på tennene ble estimert.
Det ble utviklet en klassifiseringsalgoritme som bruker modenheten til fire tenner på treningssettet for å forutsi om en prøve er 18 år gammel eller ikke.For å bygge modellen, utledet vi syv representasjonsmaskinlæringsalgoritmer6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost og (7) MLP .LR er en av de mest brukte klassifiseringsalgoritmene44.Det er en overvåket læringsalgoritme som bruker regresjon til å forutsi sannsynligheten for at data tilhører en bestemt kategori fra 0 til 1 og klassifiserer dataene som tilhørende en mer sannsynlig kategori basert på denne sannsynligheten;hovedsakelig brukt til binær klassifisering.KNN er en av de enkleste maskinlæringsalgoritmene45.Når det gis nye inngangsdata, finner den k data nær det eksisterende settet og klassifiserer dem deretter i klassen med høyest frekvens.Vi setter 3 for antall naboer som vurderes (k).SVM er en algoritme som maksimerer avstanden mellom to klasser ved å bruke en kjernefunksjon for å utvide det lineære rommet til et ikke-lineært rom kalt fields46.For denne modellen bruker vi bias = 1, potens = 1 og gamma = 1 som hyperparametre for polynomkjernen.DT har blitt brukt i ulike felt som en algoritme for å dele et helt datasett i flere undergrupper ved å representere beslutningsregler i en trestruktur47.Modellen er konfigurert med et minimum antall poster per node på 2 og bruker Gini-indeksen som et mål på kvalitet.RF er en ensemblemetode som kombinerer flere DT-er for å forbedre ytelsen ved å bruke en bootstrap-aggregeringsmetode som genererer en svak klassifiserer for hver prøve ved å tilfeldig trekke prøver av samme størrelse flere ganger fra det originale datasettet48.Vi brukte 100 trær, 10 tredybder, 1 minimum nodestørrelse og Gini-blandingsindeks som nodeseparasjonskriterier.Klassifiseringen av nye data bestemmes ved flertall.XGBoost er en algoritme som kombinerer boostingsteknikker ved å bruke en metode som tar feilen mellom de faktiske og predikerte verdiene til den forrige modellen som treningsdata og forsterker feilen ved å bruke gradients49.Det er en mye brukt algoritme på grunn av sin gode ytelse og ressurseffektivitet, samt høy pålitelighet som en overtilpasset korreksjonsfunksjon.Modellen er utstyrt med 400 støttehjul.MLP er et nevralt nettverk der ett eller flere perseptroner danner flere lag med ett eller flere skjulte lag mellom input- og output-lagene38.Ved å bruke dette kan du utføre ikke-lineær klassifisering der når du legger til et inputlag og får en resultatverdi, sammenlignes den predikerte resultatverdien med den faktiske resultatverdien og feilen spres tilbake.Vi laget et skjult lag med 20 skjulte nevroner i hvert lag.Hver modell vi utviklet ble brukt på interne og eksterne sett for å teste klassifiseringsytelse ved å beregne sensitivitet, spesifisitet, PPV, NPV og AUROC.Sensitivitet er definert som forholdet mellom et utvalg estimert til å være 18 år eller eldre og et utvalg estimert til å være 18 år eller eldre.Spesifisitet er andelen prøver under 18 år og de som er beregnet til å være under 18 år.
Tannstadiene som ble vurdert i treningssettet ble omgjort til numeriske stadier for statistisk analyse.Multivariat lineær og logistisk regresjon ble utført for å utvikle prediktive modeller for hvert kjønn og utlede regresjonsformler som kan brukes til å estimere alder.Vi brukte disse formlene for å beregne tannalderen for både interne og eksterne testsett.Tabell 4 viser regresjons- og klassifikasjonsmodellene som er brukt i denne studien.
Intra- og interobservatørreliabilitet ble beregnet ved hjelp av Cohens kappa-statistikk.For å teste nøyaktigheten til DM og tradisjonelle regresjonsmodeller, beregnet vi MAE og RMSE ved å bruke de estimerte og faktiske alderen til de interne og eksterne testsettene.Disse feilene brukes ofte til å evaluere nøyaktigheten av modellprediksjoner.Jo mindre feilen er, desto høyere er nøyaktigheten av prognosen24.Sammenlign MAE og RMSE for interne og eksterne testsett beregnet ved bruk av DM og tradisjonell regresjon.Klassifiseringsytelsen til 18-års cutoff i tradisjonell statistikk ble vurdert ved å bruke en 2 × 2 beredskapstabell.Den beregnede sensitiviteten, spesifisiteten, PPV, NPV og AUROC til testsettet ble sammenlignet med de målte verdiene til DM-klassifiseringsmodellen.Data er uttrykt som gjennomsnitt ± standardavvik eller antall (%) avhengig av datakarakteristikker.Tosidige P-verdier <0,05 ble ansett som statistisk signifikante.Alle rutinemessige statistiske analyser ble utført ved bruk av SAS versjon 9.4 (SAS Institute, Cary, NC).DM-regresjonsmodellen ble implementert i Python ved å bruke Keras50 2.2.4 backend og Tensorflow51 1.8.0 spesifikt for matematiske operasjoner.DM-klassifiseringsmodellen ble implementert i Waikato Knowledge Analysis Environment og Konstanz Information Miner (KNIME) 4.6.152 analyseplattform.
Forfatterne erkjenner at data som støtter studiens konklusjoner finnes i artikkelen og tilleggsmateriell.Datasettene generert og/eller analysert i løpet av studien er tilgjengelig fra den tilsvarende forfatteren på rimelig forespørsel.
Ritz-Timme, S. et al.Aldersvurdering: toppmoderne for å oppfylle de spesifikke kravene til rettsmedisinsk praksis.internasjonalitet.J. Rettsmedisin.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. og Olze, A. Nåværende status for rettsmedisinsk aldersvurdering av levende subjekter for straffeforfølgelsesformål.Forensics.medisin.Patologi.1, 239–246 (2005).
Pan, J. et al.En modifisert metode for å vurdere tannlegealderen til barn i alderen 5 til 16 år i det østlige Kina.klinisk.Muntlig undersøkelse.25, 3463–3474 (2021).
Lee, SS etc. Kronologi av utviklingen av andre og tredje jeksler hos koreanere og dens anvendelse for rettsmedisinsk aldersvurdering.internasjonalitet.J. Rettsmedisin.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY og Lee, SS Nøyaktighet av aldersestimering og estimering av 18-årsgrensen basert på modenhet av andre og tredje jeksler hos koreanere og japansk.PLoS ONE 17, e0271247 (2022).
Kim, JY, et al.Preoperativ maskinlæringsbasert dataanalyse kan forutsi behandlingsresultatet for søvnkirurgi hos pasienter med OSA.vitenskapen.Rapport 11, 14911 (2021).
Han, M. et al.Nøyaktig aldersestimat fra maskinlæring med eller uten menneskelig innblanding?internasjonalitet.J. Rettsmedisin.136, 821–831 (2022).
Khan, S. og Shaheen, M. Fra datautvinning til datautvinning.J.Informasjon.vitenskapen.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. og Shaheen, M. WisRule: The First Cognitive Algorithm for Association Rule Mining.J.Informasjon.vitenskapen.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. og Abdullah U. Karm: Tradisjonell datautvinning basert på kontekstbaserte assosiasjonsregler.regne ut.Matt.Fortsette.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. og Habib M. Dyplæringsbasert semantisk likhetsdeteksjon ved bruk av tekstdata.informere.teknologier.kontroll.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., og Shahin, M. Et system for å gjenkjenne aktivitet i sportsvideoer.multimedia.Verktøy Programmer https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al.RSNA maskinlæringsutfordring i pediatrisk beinalder.Radiologi 290, 498–503 (2019).
Li, Y. et al.Rettsmedisinsk aldersestimat fra bekkenrøntgen ved hjelp av dyp læring.EURO.stråling.29, 2322–2329 (2019).
Guo, YC, et al.Nøyaktig aldersklassifisering ved hjelp av manuelle metoder og dype konvolusjonelle nevrale nettverk fra ortografiske projeksjonsbilder.internasjonalitet.J. Rettsmedisin.135, 1589–1597 (2021).
Alabama Dalora et al.Benaldersestimering ved bruk av forskjellige maskinlæringsmetoder: en systematisk litteraturgjennomgang og metaanalyse.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. og Yang, J. Befolkningsspesifikk aldersestimat av afroamerikanere og kinesere basert på massekammervolumer av første molarer ved bruk av kjeglestråle-tomografi.internasjonalitet.J. Rettsmedisin.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK og Oh KS Bestemme aldersgrupper av levende mennesker ved hjelp av kunstig intelligens-baserte bilder av første jeksler.vitenskapen.Rapport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., og Urschler, M. Automatisk aldersestimering og majoritetsaldersklassifisering fra multivariate MR-data.IEEE J. Biomed.Helsevarsler.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. og Li, G. Aldersestimering basert på 3D-massekammersegmentering av første jeksler fra kjeglestråledatatomografi ved å integrere dyp læring og nivåsett.internasjonalitet.J. Rettsmedisin.135, 365–373 (2021).
Wu, WT, et al.Datautvinning i klinisk stordata: vanlige databaser, trinn og metodemodeller.Verden.medisin.ressurs.8, 44 (2021).
Yang, J. et al.Introduksjon til medisinske databaser og datautvinningsteknologier i Big Data-æraen.J. Avid.Grunnmedisin.13, 57–69 (2020).
Shen, S. et al.Camerers metode for å estimere tannalder ved hjelp av maskinlæring.BMC Oral Health 21, 641 (2021).
Galliburg A. et al.Sammenligning av forskjellige maskinlæringsmetoder for å forutsi tannalder ved hjelp av Demirdjian-staging-metoden.internasjonalitet.J. Rettsmedisin.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. og Tanner, JM Et nytt system for vurdering av tannalder.fnyse.biologi.45, 211-227 (1973).
Landis, JR, og Koch, GG Mål for observatøravtale om kategoriske data.Biometrics 33, 159-174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK og Choi HK.Teksturell, morfologisk og statistisk analyse av todimensjonal magnetisk resonansavbildning ved bruk av kunstig intelligens-teknikker for differensiering av primære hjernesvulster.Helseinformasjon.ressurs.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Innleggstid: Jan-04-2024