Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Takk for at du besøker Nature.com. Versjonen av nettleseren du bruker har begrenset CSS -støtte. For best resultat anbefaler vi å bruke en nyere versjon av nettleseren din (eller slå av kompatibilitetsmodus i Internet Explorer). I mellomtiden, for å sikre kontinuerlig støtte, viser vi nettstedet uten styling eller JavaScript.
Tenner regnes som den mest nøyaktige indikatoren på menneskekroppens alder og brukes ofte i rettsmedisinske aldersvurderinger. Vi hadde som mål å validere data mining-baserte tannleger estimater ved å sammenligne estimeringsnøyaktigheten og klassifiseringsytelsen til den 18-årige terskelen med tradisjonelle metoder og data mining-baserte aldersestimater. Totalt 2657 panoramiske røntgenbilder ble samlet inn fra koreanske og japanske borgere i alderen 15 til 23 år. De ble delt inn i et treningssett, som hver inneholdt 900 koreanske røntgenbilder, og et internt testsett som inneholder 857 japanske røntgenbilder. Vi sammenlignet klassifiseringsnøyaktigheten og effektiviteten til tradisjonelle metoder med testsett med data mining -modeller. Nøyaktigheten av den tradisjonelle metoden på det interne testsettet er litt høyere enn den for data mining -modellen, og forskjellen er liten (gjennomsnittlig absolutt feil <0,21 år, root mean square feil <0,24 år). Klassifiseringsytelsen for 18-årig avskjæring er også lik mellom tradisjonelle metoder og data mining-modeller. Dermed kan tradisjonelle metoder erstattes av data mining -modeller når de utfører rettsmedisinske aldersvurderinger ved bruk av modenheten til andre og tredje molars hos koreanske ungdommer og unge voksne.
Estimering av tannalderen er mye brukt i rettsmedisin og pediatrisk tannbehandling. Spesielt på grunn av den høye sammenhengen mellom kronologisk alder og tannutvikling, er aldersvurdering av tannutviklingsstadier et viktig kriterium for å vurdere alderen til barn og unge1,2,3. For unge mennesker har imidlertid estimering av tannalder basert på tannmodenhet sine begrensninger fordi tannlegevekst nesten er fullstendig, med unntak av de tredje jekslene. Det juridiske formålet med å bestemme ungdoms og ungdommer er å gi nøyaktige estimater og vitenskapelige bevis på om de har nådd flertallets alder. I medisinsk-juridisk praksis hos ungdommer og unge voksne i Korea ble alder estimert ved bruk av Lees metode, og en lovlig terskel på 18 år ble spådd basert på dataene rapportert av Oh et al 5.
Maskinlæring er en type kunstig intelligens (AI) som gjentatte ganger lærer og klassifiserer store mengder data, løser problemer på egen hånd og driver dataprogrammering. Maskinlæring kan oppdage nyttige skjulte mønstre i store mengder data6. I motsetning til dette kan klassiske metoder, som er arbeidsintensive og tidkrevende, ha begrensninger når de arbeider med store volum av komplekse data som er vanskelige å behandle manuelt7. Derfor har mange studier blitt utført nylig ved bruk av de nyeste datateknologiene for å minimere menneskelige feil og effektivt behandle multidimensjonale data8,9,10,11,12. Spesielt har dyp læring blitt mye brukt i medisinsk bildeanalyse, og forskjellige metoder for aldersestimering ved automatisk analyse av røntgenbilder er rapportert å forbedre nøyaktigheten og effektiviteten av aldersestimering13,14,15,16,17,18,19,20 . For eksempel utviklet Halabi et al 13 en maskinlæringsalgoritme basert på konvolusjonelle nevrale nettverk (CNN) for å estimere skjelettalder ved bruk av røntgenbilder av barns hender. Denne studien foreslår en modell som bruker maskinlæring på medisinske bilder og viser at disse metodene kan forbedre diagnostisk nøyaktighet. Li et al14 estimert alder fra røntgenbilder av bekkenet ved bruk av en dyp læring CNN og sammenlignet dem med regresjonsresultater ved bruk av Ossification Stage estimering. De fant at den dype lærte CNN -modellen viste samme aldersestimeringsytelse som den tradisjonelle regresjonsmodellen. Guo et al. Studien [15] evaluerte alderstoleranseklassifisering av CNN -teknologi basert på tann ortofotos, og resultatene fra CNN -modellen beviste at mennesker overgikk sin aldersklassifiseringsytelse.
De fleste studier på aldersestimering ved bruk av maskinlæring bruker dype læringsmetoder13,14,15,16,17,18,19,20. Aldersestimering basert på dyp læring er rapportert å være mer nøyaktig enn tradisjonelle metoder. Imidlertid gir denne tilnærmingen liten mulighet til å presentere det vitenskapelige grunnlaget for aldersestimater, for eksempel aldersindikatorene som brukes i estimatene. Det er også en juridisk tvist om hvem som gjennomfører inspeksjonene. Derfor er aldersestimering basert på dyp læring vanskelig å akseptere av administrative og rettslige myndigheter. Data mining (DM) er en teknikk som ikke bare kan oppdage forventet, men også uventet informasjon som en metode for å oppdage nyttige korrelasjoner mellom store mengder data6,21,22. Maskinlæring brukes ofte i data mining, og både data mining og maskinlæring bruker de samme nøkkelalgoritmene for å oppdage mønstre i data. Aldersestimering ved bruk av tannutvikling er basert på sensorens vurdering av modenheten til måltennene, og denne vurderingen uttrykkes som et stadium for hver måltann. DM kan brukes til å analysere sammenhengen mellom tannlegevurderingsstadium og faktisk alder og har potensial til å erstatte tradisjonell statistisk analyse. Derfor, hvis vi bruker DM -teknikker på estimering av alder, kan vi implementere maskinlæring i rettsmedisinske aldersestimering uten å bekymre oss for juridisk ansvar. Flere komparative studier er publisert på mulige alternativer til tradisjonelle manuelle metoder som brukes i rettsmedisinske praksis og EBM-baserte metoder for å bestemme tannalder. Shen et al23 viste at DM -modellen er mer nøyaktig enn den tradisjonelle kameratformelen. Galibourg et al24 anvendte forskjellige DM -metoder for å forutsi alder i henhold til Demirdjian Criterion25 og resultatene viste at DM -metoden overgikk Demirdjian og Willems -metodene for å estimere alderen til den franske befolkningen.
For å estimere tannalderen til koreanske ungdommer og unge voksne, er Lees metode 4 mye brukt i koreansk rettsmedisinsk praksis. Denne metoden bruker tradisjonell statistisk analyse (for eksempel multippel regresjon) for å undersøke forholdet mellom koreanske fag og kronologisk alder. I denne studien er aldersestimeringsmetoder oppnådd ved bruk av tradisjonelle statistiske metoder definert som "tradisjonelle metoder." Lees metode er en tradisjonell metode, og dens nøyaktighet er bekreftet av Oh et al. 5; Imidlertid er anvendeligheten av aldersestimering basert på DM -modellen i koreansk rettsmedisinsk praksis fortsatt tvilsom. Målet vårt var å vitenskapelig validere den potensielle nytten av aldersestimering basert på DM -modellen. Hensikten med denne studien var (1) å sammenligne nøyaktigheten av to DM -modeller for å estimere tannalder og (2) for å sammenligne klassifiseringsytelsen til 7 DM -modeller i en alder av 18 år med de som ble oppnådd ved bruk av tradisjonelle statistiske metoder modenhet på andre og tredje jeksler i begge kjever.
Midler og standardavvik for kronologisk alder etter stadium og tanntype vises online i tilleggstabell S1 (treningssett), supplementær tabell S2 (internt testsett) og tilleggstabell S3 (eksternt testsett). Kappa-verdiene for intra- og interobserver-pålitelighet oppnådd fra treningssettet var henholdsvis 0,951 og 0,947. P -verdier og 95% konfidensintervaller for kappa -verdier er vist i online tilleggstabell S4. Kappa -verdien ble tolket som "nesten perfekt", i samsvar med kriteriene til Landis og Koch26.
Når du sammenligner gjennomsnittlig absolutt feil (MAE), overgår den tradisjonelle metoden litt DM -modellen for alle kjønn og i det eksterne mannlige testsettet, med unntak av flerlags perceptron (MLP). Forskjellen mellom den tradisjonelle modellen og DM -modellen på det interne MAE -testsettet var 0,12–0,19 år for menn og 0,17–0,21 år for kvinner. For det eksterne testbatteriet er forskjellene mindre (0,001–0,05 år for menn og 0,05–0,09 år for kvinner). I tillegg er rotmidlers kvadratfeil (RMSE) litt lavere enn den tradisjonelle metoden, med mindre forskjeller (0,17–0,24, 0,2–0,24 for det mannlige interne testsettet, og 0,03–0,07, 0,04–0,08 for eksternt testsett). ). MLP viser litt bedre ytelse enn enkeltlags perceptron (SLP), bortsett fra i tilfelle av det kvinnelige eksterne testsettet. For MAE og RMSE scorer det eksterne testsettet høyere enn det interne testsettet for alle kjønn og modeller. Alle MAE og RMSE er vist i tabell 1 og figur 1.
Mae og RMSE av tradisjonelle og data mining regresjonsmodeller. Gjennomsnittlig absolutt feil MAE, Rot gjennomsnittlig kvadratfeil RMSE, enkeltlags perceptron SLP, flerlags perceptron MLP, tradisjonell CM -metode.
Klassifiseringsytelse (med en avskjæring på 18 år) av de tradisjonelle og DM -modellene ble demonstrert i form av følsomhet, spesifisitet, positiv prediktiv verdi (PPV), negativ prediktiv verdi (NPV) og område under mottakerens driftskarakteristiske kurve (AUROC) 27 (tabell 2, figur 2 og tilleggsfigur 1 online). Når det gjelder følsomheten til det interne testbatteriet, presterte tradisjonelle metoder best blant menn og verre blant kvinner. Forskjellen i klassifiseringsytelse mellom tradisjonelle metoder og SD er imidlertid 9,7% for menn (MLP) og bare 2,4% for kvinner (XGBOOST). Blant DM -modeller viste logistisk regresjon (LR) bedre følsomhet hos begge kjønn. Når det gjelder spesifisiteten til det interne testsettet, ble det observert at de fire SD -modellene presterte godt hos menn, mens den tradisjonelle modellen presterte bedre hos kvinner. Forskjellene i klassifiseringsytelse for menn og kvinner er henholdsvis 13,3% (MLP) og 13,1% (MLP), noe som indikerer at forskjellen i klassifiseringsytelse mellom modeller overstiger følsomheten. Blant DM -modellene presterte supportvektormaskinen (SVM), Decision Tree (DT) og Random Forest (RF) -modeller best blant menn, mens LR -modellen presterte best blant kvinner. AUROC for den tradisjonelle modellen og alle SD-modellene var større enn 0,925 (K-Nærest nabo (KNN) hos menn), noe som demonstrerte utmerket klassifiseringsytelse i diskriminerende 18 år gamle prøver28. For det eksterne testsettet var det en nedgang i klassifiseringsytelsen når det gjelder følsomhet, spesifisitet og AUROC sammenlignet med det interne testsettet. Dessuten varierte forskjellen i følsomhet og spesifisitet mellom klassifiseringsytelsen til de beste og verste modellene fra 10% til 25% og var større enn forskjellen i det interne testsettet.
Følsomhet og spesifisitet av data mining klassifiseringsmodeller sammenlignet med tradisjonelle metoder med en avskjæring på 18 år. Knn K nærmeste nabo, SVM -støttevektormaskin, LR Logistic Regression, DT Decision Tree, RF Random Forest, XGB XGBOOST, MLP Multilayer Perceptron, Traditional CM Method.
Det første trinnet i denne studien var å sammenligne nøyaktigheten av tannalderestimater oppnådd fra syv DM -modeller med de som ble oppnådd ved bruk av tradisjonell regresjon. MAE og RMSE ble evaluert i interne testsett for begge kjønn, og forskjellen mellom den tradisjonelle metoden og DM -modellen varierte fra 44 til 77 dager for MAE og fra 62 til 88 dager for RMSE. Selv om den tradisjonelle metoden var litt mer nøyaktig i denne studien, er det vanskelig å konkludere om en så liten forskjell har klinisk eller praktisk betydning. Disse resultatene indikerer at nøyaktigheten av estimering av tannalder ved bruk av DM -modellen er nesten den samme som for den tradisjonelle metoden. Direkte sammenligning med resultater fra tidligere studier er vanskelig fordi ingen studier har sammenlignet nøyaktigheten av DM -modeller med tradisjonelle statistiske metoder ved å bruke den samme teknikken for å registrere tenner i samme aldersområde som i denne studien. Galibourg et al24 sammenlignet MAE og RMSE mellom to tradisjonelle metoder (Demirjian Method25 og Willems Method29) og 10 DM -modeller i en fransk befolkning i alderen 2 til 24 år. De rapporterte at alle DM -modeller var mer nøyaktige enn tradisjonelle metoder, med forskjeller på 0,20 og 0,38 år i MAE og 0,25 og 0,47 år i RMSE sammenlignet med henholdsvis Willems og Demirdjian metoder. Avviket mellom SD -modellen og tradisjonelle metoder vist i Halibourg -studien tar hensyn til mange rapporter30,31,32,33 at Demirdjian -metoden ikke nøyaktig estimerer tannalderen i andre populasjoner enn de franske kanadierne som studien var basert på. I denne studien. Tai et al 34 brukte MLP -algoritmen for å forutsi tannalder fra 1636 kinesiske kjeveortopediske fotografier og sammenlignet dens nøyaktighet med resultatene fra Demirjian og Willems -metoden. De rapporterte at MLP har høyere nøyaktighet enn tradisjonelle metoder. Forskjellen mellom Demirdjian -metoden og den tradisjonelle metoden er <0,32 år, og Willems -metoden er 0,28 år, noe som ligner på resultatene fra den nåværende studien. Resultatene fra disse tidligere studiene24,34 stemmer også overens med resultatene fra denne studien, og aldersestimeringsnøyaktigheten til DM -modellen og den tradisjonelle metoden er like. Basert på de presenterte resultatene kan vi imidlertid bare forsiktig konkludere med at bruken av DM -modeller for å estimere alder kan erstatte eksisterende metoder på grunn av mangelen på sammenlignende og referanse tidligere studier. Oppfølgingsstudier som bruker større prøver er nødvendig for å bekrefte resultatene oppnådd i denne studien.
Blant studiene som tester nøyaktigheten av SD i estimering av tannalder, viste noen høyere nøyaktighet enn vår studie. Stepanovsky et al 35 anvendte 22 SD -modeller på panorama røntgenbilder av 976 tsjekkiske innbyggere i alderen 2,7 til 20,5 år og testet nøyaktigheten til hver modell. De vurderte utviklingen av totalt 16 øvre og nedre venstre permanente tenner ved å bruke klassifiseringskriteriene foreslått av Moorrees et al 36. Mae varierer fra 0,64 til 0,94 år og RMSE varierer fra 0,85 til 1,27 år, noe som er mer nøyaktige enn de to DM -modellene som ble brukt i denne studien. Shen et al23 brukte Cameriere -metoden for å estimere tannalderen på syv permanente tenner i venstre mandible i østlige kinesiske innbyggere i alderen 5 til 13 år og sammenlignet det med aldre estimert ved bruk av lineær regresjon, SVM og RF. De viste at alle tre DM -modellene har høyere nøyaktighet sammenlignet med den tradisjonelle kameratformelen. Mae og RMSE i Shens studie var lavere enn i DM -modellen i denne studien. Den økte presisjonen av studiene av Stepanovsky et al. 35 og Shen et al. 23 kan skyldes inkludering av yngre personer i studieprøvene. Fordi aldersestimater for deltakere med utvikling av tenner blir mer nøyaktige etter hvert som antallet tenner øker under tannutvikling, kan nøyaktigheten av den resulterende aldersestimeringsmetoden bli kompromittert når studiedeltakerne er yngre. I tillegg er MLPs feil i aldersestimering litt mindre enn SLP -er, noe som betyr at MLP er mer nøyaktig enn SLP. MLP anses som litt bedre for aldersestimering, muligens på grunn av de skjulte lagene i MLP38. Imidlertid er det et unntak for den ytre prøven av kvinner (SLP 1.45, MLP 1.49). Funnet at MLP er mer nøyaktig enn SLP i vurdering av alder, krever ytterligere retrospektive studier.
Klassifiseringsytelsen til DM-modellen og den tradisjonelle metoden ved en 18-årig terskel ble også sammenlignet. Alle testede SD-modeller og tradisjonelle metoder på det interne testsettet viste praktisk talt akseptable nivåer av diskriminering for den 18 år gamle prøven. Følsomheten for menn og kvinner var større enn henholdsvis 87,7% og 94,9%, og spesifisiteten var større enn 89,3% og 84,7%. AUROC for alle testede modeller overstiger også 0,925. Så vidt vi vet, har ingen studier testet ytelsen til DM-modellen for 18-årig klassifisering basert på tannmodenhet. Vi kan sammenligne resultatene fra denne studien med klassifiseringsytelsen til dype læringsmodeller på panoramiske røntgenbilder. Guo et al.15 beregnet klassifiseringsytelsen til en CNN-basert dyp læringsmodell og en manuell metode basert på Demirjians metode for en viss aldersterskel. Følsomheten og spesifisiteten til den manuelle metoden var henholdsvis 87,7% og 95,5%, og følsomheten og spesifisiteten til CNN -modellen oversteg henholdsvis 89,2% og 86,6%. De konkluderte med at dype læringsmodeller kan erstatte eller overgå manuell vurdering i klassifisering av aldersterskler. Resultatene fra denne studien viste lignende klassifiseringsytelse; Det antas at klassifisering ved bruk av DM -modeller kan erstatte tradisjonelle statistiske metoder for aldersestimering. Blant modellene var DM LR den beste modellen når det gjelder følsomhet for den mannlige prøven og følsomheten og spesifisiteten for den kvinnelige prøven. LR rangerer nummer to i spesifisitet for menn. Dessuten anses LR for å være en av de mer brukervennlige DM35-modellene og er mindre kompleks og vanskelig å behandle. Basert på disse resultatene ble LR ansett som den beste cutoff-klassifiseringsmodellen for 18-åringer i den koreanske befolkningen.
Totalt sett var nøyaktigheten av aldersestimering eller klassifiseringsytelse på det eksterne testsettet dårlig eller lavere sammenlignet med resultatene på det interne testsettet. Noen rapporter indikerer at klassifiseringsnøyaktighet eller effektivitet synker når aldersestimater basert på den koreanske befolkningen blir brukt på den japanske befolkningen5,39, og et lignende mønster ble funnet i denne studien. Denne forverringstrenden ble også observert i DM -modellen. For å estimere alder nøyaktig, selv når du bruker DM i analyseprosessen, bør metoder avledet fra native populasjonsdata, for eksempel tradisjonelle metoder, foretrekkes5,39,40,41,42. Siden det er uklart om dype læringsmodeller kan vise lignende trender, er studier som sammenligner klassifiseringsnøyaktighet og effektivitet ved bruk av tradisjonelle metoder, DM -modeller og dype læringsmodeller på de samme prøvene nødvendig for å bekrefte om kunstig intelligens kan overvinne disse rasemessige forskjeller i begrenset alder. vurderinger.
Vi demonstrerer at tradisjonelle metoder kan erstattes av aldersestimering basert på DM -modellen i rettsmedisinske aldersestimeringspraksis i Korea. Vi oppdaget også muligheten for å implementere maskinlæring for rettsmedisinske aldersvurderinger. Imidlertid er det klare begrensninger, for eksempel det utilstrekkelige antall deltakere i denne studien for å definitivt bestemme resultatene, og mangelen på tidligere studier for å sammenligne og bekrefte resultatene fra denne studien. I fremtiden bør DM -studier gjennomføres med større antall prøver og mer forskjellige populasjoner for å forbedre dens praktiske anvendbarhet sammenlignet med tradisjonelle metoder. For å validere muligheten for å bruke kunstig intelligens for å estimere alder i flere populasjoner, er det nødvendig med fremtidige studier for å sammenligne klassifiseringsnøyaktigheten og effektiviteten til DM og dype læringsmodeller med tradisjonelle metoder i de samme prøvene.
Studien brukte 2.657 ortografiske fotografier samlet fra koreanske og japanske voksne i alderen 15 til 23 år. De koreanske røntgenbildene ble delt inn i 900 treningssett (19,42 ± 2,65 år) og 900 interne testsett (19,52 ± 2,59 år). Opplæringssettet ble samlet inn på en institusjon (Seoul St. Mary's Hospital), og det eget testsettet ble samlet på to institusjoner (Seoul National University Dental Hospital og Yonsei University Dental Hospital). Vi samlet også 857 røntgenbilder fra en annen populasjonsbasert data (Iwate Medical University, Japan) for ekstern testing. Radiografer av japanske personer (19,31 ± 2,60 år) ble valgt som det eksterne testsettet. Data ble samlet inn retrospektivt for å analysere stadiene av tannutvikling på panoramiske røntgenbilder tatt under tannbehandling. Alle dataene som ble samlet inn var anonyme bortsett fra kjønn, fødselsdato og dato for radiograf. Inkludering og eksklusjonskriterier var de samme som tidligere publiserte studier 4, 5. Selve alderen på prøven ble beregnet ved å trekke fra fødselsdatoen fra datoen røntgenbildet ble tatt. Utvalgsgruppen ble delt inn i ni aldersgrupper. Alder og kjønnsfordelinger er vist i tabell 3 Denne studien ble utført i samsvar med erklæringen om Helsingfors og godkjent av Institutional Review Board (IRB) fra Seoul St. Mary's Hospital ved det katolske universitetet i Korea (KC22WISI0328). På grunn av den retrospektive utformingen av denne studien, kunne informert samtykke ikke fås fra alle pasienter som gjennomgår radiografisk undersøkelse for terapeutiske formål. Seoul Korea University St. Mary's Hospital (IRB) frafalt kravet om informert samtykke.
Utviklingsstadier av bimaxillary andre og tredje molar ble vurdert i henhold til Demircan Criteria25. Bare en tann ble valgt hvis samme type tann ble funnet på venstre og høyre side av hver kjeve. Hvis homologe tenner på begge sider var i forskjellige utviklingsstadier, ble tannen med det nedre utviklingsstadiet valgt for å redegjøre for usikkerhet i estimert alder. Hundre tilfeldig utvalgte røntgenbilder fra treningssettet ble scoret av to erfarne observatører for å teste interobserver -pålitelighet etter prekalibrering for å bestemme tannmodningstrinn. Intraobserver-pålitelighet ble vurdert to ganger med tre måneders intervaller av den primære observatøren.
Kjønns- og utviklingsstadiet til den andre og tredje molarene i hver kjeve i treningssettet ble estimert av en primær observatør trent med forskjellige DM -modeller, og den faktiske alderen ble satt som målverdien. SLP- og MLP -modeller, som er mye brukt i maskinlæring, ble testet mot regresjonsalgoritmer. DM -modellen kombinerer lineære funksjoner ved å bruke utviklingsstadiene til de fire tennene og kombinerer disse dataene for å estimere alder. SLP er det enkleste nevrale nettverket og inneholder ikke skjulte lag. SLP fungerer basert på terskeloverføring mellom noder. SLP -modellen i regresjon er matematisk lik multippel lineær regresjon. I motsetning til SLP -modellen, har MLP -modellen flere skjulte lag med ikke -lineære aktiveringsfunksjoner. Eksperimentene våre brukte et skjult lag med bare 20 skjulte noder med ikke -lineære aktiveringsfunksjoner. Bruk gradient nedstigning som optimaliseringsmetode og MAE og RMSE som tapsfunksjon for å trene vår maskinlæringsmodell. Den best oppnådde regresjonsmodellen ble brukt på de interne og eksterne testsettene, og tennene på tennene ble estimert.
En klassifiseringsalgoritme ble utviklet som bruker modenheten til fire tenner på treningssettet for å forutsi om en prøve er 18 år gammel eller ikke. For å bygge modellen avledet vi syv representasjonsmaskinlæringsalgoritmer6,43: (1) LR, (2) KNN, (3) SVM, (4) dt, (5) RF, (6) XGBOOST, og (7) MLP . LR er en av de mest brukte klassifiseringsalgoritmene44. Det er en overvåket læringsalgoritme som bruker regresjon for å forutsi sannsynligheten for data som tilhører en viss kategori fra 0 til 1 og klassifiserer dataene som tilhørende en mer sannsynlig kategori basert på denne sannsynligheten; hovedsakelig brukt til binær klassifisering. KNN er en av de enkleste maskinlæringsalgoritmene45. Når de får nye inndata, finner de K -data nær det eksisterende settet og klassifiserer dem deretter inn i klassen med den høyeste frekvensen. Vi satte 3 for antall naboer som ble vurdert (k). SVM er en algoritme som maksimerer avstanden mellom to klasser ved å bruke en kjernefunksjon for å utvide det lineære rommet til et ikke-lineært rom kalt Fields46. For denne modellen bruker vi skjevhet = 1, kraft = 1 og gamma = 1 som hyperparametre for polynomkjernen. DT har blitt brukt på forskjellige felt som en algoritme for å dele et helt datasett i flere undergrupper ved å representere beslutningsregler i en trestruktur47. Modellen er konfigurert med et minimum antall poster per node på 2 og bruker Gini -indeksen som et mål på kvalitet. RF er en ensemblemetode som kombinerer flere DT -er for å forbedre ytelsen ved å bruke en bootstrap -aggregeringsmetode som genererer en svak klassifiserer for hver prøve ved å tegne prøver av samme størrelse flere ganger fra den originale datasett48. Vi brukte 100 trær, 10 tredybder, 1 minimum node størrelse og Gini -blandingsindeks som nodeseparasjonskriterier. Klassifiseringen av nye data bestemmes av et flertall. XGBoost er en algoritme som kombinerer boostingsteknikker ved hjelp av en metode som tar som treningsdata feilen mellom de faktiske og forutsagte verdiene til den forrige modellen og forsterker feilen ved å bruke gradienters49. Det er en mye brukt algoritme på grunn av sin gode ytelse og ressurseffektivitet, samt høy pålitelighet som en overmonteringskorreksjonsfunksjon. Modellen er utstyrt med 400 støttehjul. MLP er et nevralt nettverk der ett eller flere perceptroner danner flere lag med ett eller flere skjulte lag mellom inngangs- og utgangslagene38. Ved å bruke dette kan du utføre ikke-lineær klassifisering der når du legger til et inngangslag og får en resultatverdi, sammenlignes den forutsagte resultatverdien med den faktiske resultatverdien og feilen blir forplantet tilbake. Vi opprettet et skjult lag med 20 skjulte nevroner i hvert lag. Hver modell vi utviklet ble brukt på interne og eksterne sett for å teste klassifiseringsytelse ved å beregne følsomhet, spesifisitet, PPV, NPV og AUROC. Følsomhet er definert som forholdet mellom en prøve estimert til å være 18 år eller eldre til en prøve som er estimert til å være 18 år eller eldre. Spesifisitet er andelen prøver under 18 år og de som er anslått til å være under 18 år.
Tannstadiene vurdert i treningssettet ble konvertert til numeriske stadier for statistisk analyse. Multivariat lineær og logistisk regresjon ble utført for å utvikle prediktive modeller for hvert kjønn og derive regresjonsformler som kan brukes til å estimere alder. Vi brukte disse formlene for å estimere tannalder for både interne og eksterne testsett. Tabell 4 viser regresjons- og klassifiseringsmodellene som ble brukt i denne studien.
Intra- og interobserver-pålitelighet ble beregnet ved bruk av Cohens Kappa-statistikk. For å teste nøyaktigheten av DM og tradisjonelle regresjonsmodeller, beregnet vi MAE og RMSE ved å bruke de estimerte og faktiske aldre for de interne og eksterne testsettene. Disse feilene brukes ofte til å evaluere nøyaktigheten av modellspådommer. Jo mindre feil, jo høyere er nøyaktigheten av prognosen24. Sammenlign MAE og RMSE for interne og eksterne testsett beregnet ved bruk av DM og tradisjonell regresjon. Klassifiseringsytelse for den 18-årige avskjæringen i tradisjonell statistikk ble vurdert ved bruk av en beredskapstabell 2 × 2. Den beregnede følsomheten, spesifisiteten, PPV, NPV og AUROC for testsettet ble sammenlignet med de målte verdiene til DM -klassifiseringsmodellen. Data uttrykkes som gjennomsnitt ± standardavvik eller antall (%) avhengig av datakarakteristikker. Tosidige P-verdier <0,05 ble ansett som statistisk signifikante. Alle rutinemessige statistiske analyser ble utført ved bruk av SAS versjon 9.4 (SAS Institute, Cary, NC). DM -regresjonsmodellen ble implementert i Python ved bruk av Keras50 2.2.4 Backend og TensorFlow51 1.8.0 spesielt for matematisk operasjoner. DM -klassifiseringsmodellen ble implementert i Waikato Knowledge Analysis Environment og Konstanz Information Miner (KNIME) 4.6.152 Analyseplattform.
Forfatterne erkjenner at data som støtter studiens konklusjoner, kan finnes i artikkelen og tilleggsmateriell. Datasettene generert og/eller analysert under studien er tilgjengelige fra den tilsvarende forfatteren på rimelig forespørsel.
Ritz-Timme, S. et al. Aldersvurdering: State of the Art for å oppfylle de spesifikke kravene til rettsmedisinske praksis. Internasjonalitet. J. Juridisk medisin. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., og Olze, A. Nåværende status for rettsmedisinsk aldersvurdering av levende personer for straffeforfølgelsesformål. Rettsmedisinske. medisin. Patologi. 1, 239–246 (2005).
Pan, J. et al. En modifisert metode for å vurdere tannalderen til barn i alderen 5 til 16 år i det østlige Kina. klinisk. Muntlig undersøkelse. 25, 3463–3474 (2021).
Lee, SS etc. Kronologi for utvikling av andre og tredje jeksler i koreanere og dens anvendelse for rettsmedisinske aldersvurderinger. Internasjonalitet. J. Juridisk medisin. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY og Lee, SS Nøyaktighet av aldersestimering og estimering av den 18-årige terskelen basert på modenheten til andre og tredje molars i koreanere og japansk. PLoS One 17, E0271247 (2022).
Kim, JY, et al. Preoperativ maskinlæringsbasert dataanalyse kan forutsi behandlingsresultat for søvnkirurgi hos pasienter med OSA. vitenskapen. Rapport 11, 14911 (2021).
Han, M. et al. Nøyaktig aldersestimering fra maskinlæring med eller uten menneskelig inngripen? Internasjonalitet. J. Juridisk medisin. 136, 821–831 (2022).
Khan, S. og Shaheen, M. Fra data mining til data mining. J.Information. vitenskapen. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. og Shaheen, M. Wisrule: Den første kognitive algoritmen for tilknytningsregel gruvedrift. J.Information. vitenskapen. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. og Abdullah U. Karm: Tradisjonell data mining basert på kontekstbaserte assosiasjonsregler. kalkulere. Matt. fortsette. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. og Habib M. Dyp læringsbasert semantisk likhetsdeteksjon ved bruk av tekstdata. informere. teknologier. kontroll. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., og Shahin, M. Et system for å gjenkjenne aktivitet i sportsvideoer. multimedia. Verktøyapplikasjoner https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge i pediatrisk beinalder. Radiologi 290, 498–503 (2019).
Li, Y. et al. Rettsmedisinske estimeringer fra røntgenstråler ved bruk av dyp læring. Euro. stråling. 29, 2322–2329 (2019).
Guo, YC, et al. Nøyaktig aldersklassifisering ved bruk av manuelle metoder og dype konvolusjonelle nevrale nettverk fra ortografiske projeksjonsbilder. Internasjonalitet. J. Juridisk medisin. 135, 1589–1597 (2021).
Alabama Dalora et al. Benalderestimering ved bruk av forskjellige maskinlæringsmetoder: en systematisk litteraturgjennomgang og metaanalyse. PLoS One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., og Yang, J. Befolkningsspesifikk aldersestimering av afroamerikanere og kinesere basert på masse kammervolum av første molarer ved bruk av kjeglebjelkeberegnet tomografi. Internasjonalitet. J. Juridisk medisin. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK og Oh KS som bestemmer aldersgrupper av levende mennesker som bruker kunstige intelligensbaserte bilder av første jeksler. vitenskapen. Rapport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., og Urschler, M. Automatisk aldersestimering og majoritetsalderklassifisering fra multivariat MR -data. IEEE J. Biomed. Helsevarsler. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. og Li, G. Aldersestimering basert på 3D -massekammersegmentering av første molarer fra kjeglebjelkeberegnet tomografi ved å integrere dype lærings- og nivåsett. Internasjonalitet. J. Juridisk medisin. 135, 365–373 (2021).
Wu, WT, et al. Data mining i kliniske big data: Vanlige databaser, trinn og metodemodeller. Verden. medisin. ressurs. 8, 44 (2021).
Yang, J. et al. Introduksjon til medisinske databaser og data mining -teknologier i Big Data -tiden. J. Avid. Grunnleggende medisin. 13, 57–69 (2020).
Shen, S. et al. Camerers metode for å estimere tannalder ved bruk av maskinlæring. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Sammenligning av forskjellige maskinlæringsmetoder for å forutsi tannalder ved bruk av Demirdjian -iscenesettelsesmetoden. Internasjonalitet. J. Juridisk medisin. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. og Tanner, JM et nytt system for å vurdere tannalder. snort. biologi. 45, 211–227 (1973).
Landis, JR og Koch, GG måler observatøravtale om kategoriske data. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK og Choi HK. Stekstur, morfologisk og statistisk analyse av todimensjonal magnetisk resonansavbildning ved bruk av kunstig intelligensteknikker for differensiering av primære hjernesvulster. Helseinformasjon. ressurs. https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Post Time: Jan-04-2024

Validering av en data miningmodell mot tradisjonelle estimeringsmetoder for tannleger blant koreanske ungdommer og unge voksne