• אָנוּ

אימות של מודל כריית נתונים מול שיטות הערכת גיל דנטלי מסורתיות בקרב מתבגרים קוריאנים ומבוגרים צעירים

תודה שביקרת ב-Nature.com.לגרסת הדפדפן שבה אתה משתמש יש תמיכת CSS מוגבלת.לקבלת התוצאות הטובות ביותר, אנו ממליצים להשתמש בגרסה חדשה יותר של הדפדפן שלך (או לכבות את מצב התאימות ב-Internet Explorer).בינתיים, כדי להבטיח תמיכה שוטפת, אנו מציגים את האתר ללא סטיילינג או JavaScript.
שיניים נחשבות לאינדיקטור המדויק ביותר לגיל גוף האדם ומשמשות לרוב בהערכת גיל משפטית.מטרתנו לאמת אומדני גיל שיניים מבוססי כריית נתונים על ידי השוואת דיוק האומדן וביצועי הסיווג של סף 18 השנים עם שיטות מסורתיות ואומדני גיל מבוססי כריית נתונים.בסך הכל נאספו 2657 צילומי רנטגן פנוראמיים מאזרחים קוריאנים ויפנים בגילאי 15 עד 23 שנים.הם חולקו לסט אימון, שכל אחד מהם הכיל 900 צילומי רנטגן קוריאניים, וערכת בדיקות פנימית שהכילה 857 צילומי רנטגן יפניים.השווינו את דיוק הסיווג והיעילות של שיטות מסורתיות עם ערכות בדיקה של מודלים של כריית נתונים.הדיוק של השיטה המסורתית במערך הבדיקות הפנימי גבוה מעט מזה של מודל כריית הנתונים, וההבדל קטן (ממוצע שגיאה מוחלטת <0.21 שנים, שגיאה מרובעת ממוצעת <0.24 שנים).ביצועי הסיווג עבור 18 שנות הפסקה דומים גם בין שיטות מסורתיות ומודלים של כריית נתונים.לפיכך, ניתן להחליף את השיטות המסורתיות במודלים של כריית נתונים בעת ביצוע הערכת גיל משפטית באמצעות הבשלות של טוחנות שנייה ושלישית אצל מתבגרים קוריאנים ומבוגרים צעירים.
הערכת גיל שיניים נמצאת בשימוש נרחב ברפואה משפטית וברפואת שיניים לילדים.בפרט, בגלל המתאם הגבוה בין גיל כרונולוגי להתפתחות שיניים, הערכת גיל לפי שלבי התפתחות שיניים היא קריטריון חשוב להערכת גילם של ילדים ובני נוער1,2,3.עם זאת, עבור צעירים, להערכת גיל השיניים על סמך בשלות השיניים יש מגבלות מכיוון שגדילת השיניים כמעט מלאה, למעט הטוחנות השלישיות.המטרה המשפטית של קביעת גילם של צעירים ומתבגרים היא לספק הערכות מדויקות והוכחות מדעיות האם הגיעו לגיל הבגרות.בפרקטיקה הרפואית-משפטית של מתבגרים ומבוגרים צעירים בקוריאה, הגיל נאמד בשיטת Lee, ונחזה סף חוקי של 18 שנים על סמך הנתונים שדווחו על ידי Oh et al 5.
למידת מכונה היא סוג של בינה מלאכותית (AI) שלומדת ומסווגת שוב ושוב כמויות גדולות של נתונים, פותרת בעיות בעצמה ומניעה תכנות נתונים.למידת מכונה יכולה לגלות דפוסים נסתרים שימושיים בכמויות גדולות של נתונים6.לעומת זאת, לשיטות קלאסיות, שהן דורשות עבודה וזמן רב, עשויות להיות מגבלות בעת התמודדות עם כמויות גדולות של נתונים מורכבים שקשה לעבד אותם באופן ידני7.לכן, מחקרים רבים נערכו לאחרונה תוך שימוש בטכנולוגיות המחשב העדכניות ביותר כדי למזער טעויות אנוש ולעבד ביעילות נתונים רב מימדיים8,9,10,11,12.בפרט, נעשה שימוש נרחב בלמידה עמוקה בניתוח תמונה רפואית, ודווחו שיטות שונות להערכת גיל על ידי ניתוח אוטומטי של צילומי רנטגן כדי לשפר את הדיוק והיעילות של הערכת גיל13,14,15,16,17,18,19,20 .לדוגמה, Halabi et al 13 פיתחו אלגוריתם למידת מכונה המבוסס על רשתות עצביות קונבולוציוניות (CNN) להערכת גיל השלד באמצעות צילומי רנטגן של ידי ילדים.מחקר זה מציע מודל המחיל למידת מכונה על תמונות רפואיות ומראה ששיטות אלו יכולות לשפר את דיוק האבחון.Li et al14 העריכו את הגיל מתמונות רנטגן של האגן תוך שימוש ב-CNN של למידה עמוקה והשוו אותם עם תוצאות רגרסיה תוך שימוש באומדן שלבי העצם.הם גילו שמודל הלמידה העמוקה של CNN הראה את אותו ביצועי הערכת גיל כמו מודל הרגרסיה המסורתי.המחקר של Guo וחב' [15] העריך את ביצועי סיווג סבילות הגיל של טכנולוגיית CNN בהתבסס על אורתופוטו-שיניים, ותוצאות מודל ה-CNN הוכיחו שבני אדם הוכיחו את ביצועי סיווג הגיל שלו.
רוב המחקרים על הערכת גיל באמצעות למידת מכונה משתמשים בשיטות למידה עמוקה13,14,15,16,17,18,19,20.הערכת גיל המבוססת על למידה עמוקה מדווחת כמדויקת יותר משיטות מסורתיות.עם זאת, גישה זו מספקת הזדמנות מועטה להציג את הבסיס המדעי להערכות גיל, כגון מדדי הגיל המשמשים באומדנים.כמו כן קיימת מחלוקת משפטית מי עורך את הבדיקות.לכן, הערכת גיל המבוססת על למידה עמוקה קשה לקבלה על ידי רשויות מנהליות ושיפוטיות.כריית נתונים (DM) היא טכניקה שיכולה לגלות לא רק מידע צפוי אלא גם לא צפוי כשיטה לגילוי מתאמים שימושיים בין כמויות גדולות של נתונים6,21,22.למידת מכונה משמשת לעתים קרובות בכריית נתונים, וגם כריית נתונים והן למידת מכונה משתמשות באותם אלגוריתמים מפתח כדי לגלות דפוסים בנתונים.הערכת גיל באמצעות פיתוח שיניים מבוססת על הערכת הבודק את בשלות שיני המטרה, והערכה זו מתבטאת כשלב לכל שן מטרה.ניתן להשתמש ב-DM כדי לנתח את המתאם בין שלב הערכת שיניים לגיל בפועל ויש לו פוטנציאל להחליף ניתוח סטטיסטי מסורתי.לכן, אם אנו מיישמים טכניקות DM להערכת גיל, נוכל ליישם למידת מכונה בהערכת גיל משפטית מבלי לדאוג לגבי אחריות משפטית.פורסמו מספר מחקרים השוואתיים על חלופות אפשריות לשיטות ידניות מסורתיות המשמשות בפרקטיקה משפטית ושיטות מבוססות EBM לקביעת גיל שיניים.Shen et al23 הראו שמודל ה-DM מדויק יותר מהנוסחה המסורתית של Camerer.Galibourg et al24 יישמו שיטות DM שונות כדי לחזות את הגיל על פי קריטריון Demirdjian25 והתוצאות הראו ששיטת DM עלתה על שיטות Demirdjian ו-Willems בהערכת גיל האוכלוסייה הצרפתית.
כדי להעריך את גיל השיניים של מתבגרים קוריאנים ומבוגרים צעירים, שיטה 4 של לי נמצאת בשימוש נרחב בפרקטיקה משפטית קוריאנית.שיטה זו משתמשת בניתוח סטטיסטי מסורתי (כגון רגרסיה מרובה) כדי לבחון את הקשר בין נבדקים קוריאנים לגיל כרונולוגי.במחקר זה, שיטות הערכת גיל המתקבלות בשיטות סטטיסטיות מסורתיות מוגדרות כ"שיטות מסורתיות".השיטה של ​​לי היא שיטה מסורתית, והדיוק שלה אושר על ידי Oh et al.5;עם זאת, ישימות הערכת גיל המבוססת על מודל DM בפרקטיקה פורנזית קוריאנית עדיין מוטלת בספק.המטרה שלנו הייתה לאמת באופן מדעי את התועלת הפוטנציאלית של הערכת גיל בהתבסס על מודל ה-DM.מטרת מחקר זה הייתה (1) להשוות את הדיוק של שני מודלים של DM בהערכת גיל דנטלי ו-(2) להשוות את ביצועי הסיווג של 7 מודלים של DM בגיל 18 עם אלו שהושגו בשיטות סטטיסטיות מסורתיות. וטוחנות שלישיות בשתי הלסתות.
אמצעים וסטיות תקן של גיל כרונולוגי לפי שלב וסוג שן מוצגים באופן מקוון בטבלה משלימה S1 (ערכת אימונים), טבלה משלימה S2 (ערכת בדיקות פנימית) ובטבלה משלימה S3 (ערכת בדיקות חיצונית).ערכי הקאפה לאמינות תוך-תצפיתניות שהתקבלו ממערך האימונים היו 0.951 ו-0.947, בהתאמה.ערכי P ורווחי סמך של 95% עבור ערכי קאפה מוצגים בטבלה משלימה מקוונת S4.ערך הקאפה התפרש כ"כמעט מושלם", בהתאם לקריטריונים של Landis ו-Koch26.
בהשוואה של טעות אבסולוטית ממוצעת (MAE), השיטה המסורתית עולה במעט על מודל ה-DM עבור כל המינים ובמערך הבדיקות הגברי החיצוני, למעט פרספטרון רב שכבתי (MLP).ההבדל בין הדגם המסורתי למודל ה-DM במערך בדיקות ה-MAE הפנימי היה 0.12-0.19 שנים לגברים ו-0.17-0.21 שנים לנשים.עבור סוללת הבדיקה החיצונית, ההבדלים קטנים יותר (0.001-0.05 שנים לגברים ו-0.05-0.09 שנים לנשים).בנוסף, שגיאת ה-Root Mean Square (RMSE) נמוכה במקצת מהשיטה המסורתית, עם הבדלים קטנים יותר (0.17-0.24, 0.2-0.24 עבור מערך הבדיקות הפנימיות לגברים ו-0.03-0.07, 0.04-0.08 עבור מערך הבדיקות החיצוניות).).MLP מציג ביצועים מעט טובים יותר מ-Single Layer Perceptron (SLP), למעט במקרה של מערך הבדיקות החיצוניות הנשי.עבור MAE ו-RMSE, ערכת המבחנים החיצונית מקבלת ציונים גבוהים יותר מקבוצת המבחנים הפנימיים עבור כל המינים והדגמים.כל ה-MAE וה-RMSE מוצגים בטבלה 1 ובאיור 1.
MAE ו-RMSE של דגמי רגרסיה מסורתיים וכריית נתונים.שגיאה אבסולוטית ממוצעת MAE, שגיאה מרובעת ממוצעת של שורש RMSE, SLP perceptron שכבה אחת, MLP multi-layer perceptron, שיטת CM מסורתית.
ביצועי הסיווג (עם חתך של 18 שנים) של המודלים המסורתיים וה-DM הוכחו במונחים של רגישות, ספציפיות, ערך ניבוי חיובי (PPV), ערך ניבוי שלילי (NPV) ושטח מתחת לעקומת המאפיין ההפעלה של המקלט (AUROC) 27 (טבלה 2, איור 2 ואיור משלים 1 באינטרנט).מבחינת רגישות סוללת הבדיקה הפנימית, השיטות המסורתיות התפקדו בצורה הטובה ביותר בקרב גברים וגרוע יותר בקרב נשים.עם זאת, ההבדל בביצועי הסיווג בין שיטות מסורתיות ל-SD הוא 9.7% לגברים (MLP) ורק 2.4% לנשים (XGBoost).בין מודלים של DM, רגרסיה לוגיסטית (LR) הראתה רגישות טובה יותר בשני המינים.לגבי הספציפיות של מערך הבדיקות הפנימי, נצפה כי ארבעת דגמי ה-SD פעלו היטב בזכרים, בעוד שהמודל המסורתי פעל טוב יותר בנקבות.ההבדלים בביצועי הסיווג לזכרים ולנקבות הם 13.3% (MLP) ו-13.1% (MLP), בהתאמה, מה שמצביע על כך שההבדל בביצועי הסיווג בין הדגמים עולה על הרגישות.בין דגמי ה-DM, המודלים של מכונת התמיכה הווקטורית (SVM), עץ ההחלטות (DT) והיער האקראי (RF) הציגו את הביצועים הטובים ביותר בקרב הזכרים, בעוד שמודל ה-LR הציג את הביצועים הטובים ביותר בקרב הנקבות.ה-AUROC של הדגם המסורתי וכל דגמי ה-SD היה גדול מ-0.925 (K-Narest Neighbor (KNN) אצל גברים), מה שהוכיח ביצועי סיווג מצוינים בהבחנה בין דגימות בני 18.עבור מערך הבדיקות החיצוניות, חלה ירידה בביצועי הסיווג במונחים של רגישות, ספציפיות ו-AUROC בהשוואה למערך הבדיקות הפנימי.יתרה מכך, ההבדל ברגישות ובספציפיות בין ביצועי הסיווג של הדגמים הטובים והגרועים ביותר נע בין 10% ל-25% והיה גדול מההבדל במערך הבדיקות הפנימי.
רגישות וסגוליות של מודלים לסיווג כריית נתונים בהשוואה לשיטות מסורתיות עם סף של 18 שנים.KNN k הקרוב ביותר, מכונה וקטורית תמיכת SVM, רגרסיה לוגיסטית LR, עץ החלטות DT, יער אקראי RF, XGB XGBoost, תפיסת רב שכבתית MLP, שיטת CM מסורתית.
השלב הראשון במחקר זה היה להשוות את הדיוק של הערכות גיל שיניים שהתקבלו משבעה מודלים של DM עם אלו שהתקבלו באמצעות רגרסיה מסורתית.MAE ו-RMSE הוערכו במבחנים פנימיים עבור שני המינים, וההבדל בין השיטה המסורתית למודל ה-DM נע בין 44 ל-77 ימים עבור MAE ובין 62 ל-88 ימים עבור RMSE.למרות שהשיטה המסורתית הייתה מעט יותר מדויקת במחקר זה, קשה להסיק האם להבדל כה קטן יש משמעות קלינית או מעשית.תוצאות אלו מצביעות על כך שהדיוק של הערכת גיל דנטלי באמצעות מודל DM כמעט זהה לזה של השיטה המסורתית.השוואה ישירה עם תוצאות ממחקרים קודמים היא קשה מכיוון שאף מחקר לא השווה את הדיוק של מודלים של DM עם שיטות סטטיסטיות מסורתיות תוך שימוש באותה טכניקה של רישום שיניים באותו טווח גילאים כמו במחקר זה.Galibourg et al24 השוו MAE ו-RMSE בין שתי שיטות מסורתיות (שיטת Demirjian25 ו-Willems method29) לבין 10 מודלים של DM באוכלוסייה צרפתית בגילאי 2 עד 24 שנים.הם דיווחו שכל דגמי ה-DM היו מדויקים יותר מהשיטות המסורתיות, עם הבדלים של 0.20 ו-0.38 שנים ב-MAE ו-0.25 ו-0.47 שנים ב-RMSE בהשוואה לשיטות Willems ו-Demirdjian, בהתאמה.הפער בין מודל ה-SD לבין השיטות המסורתיות שהוצגו במחקר האליבורג לוקח בחשבון דיווחים רבים30,31,32,33 לפיהם שיטת Demirdjian אינה מעריכה במדויק את גיל השיניים באוכלוסיות אחרות מלבד הקנדים הצרפתים שעליהם התבסס המחקר.במחקר זה.Tai et al 34 השתמשו באלגוריתם MLP כדי לחזות את גיל השיניים מ-1636 צילומי יישור שיניים סיניים והשוו את הדיוק שלו לתוצאות של שיטת Demirjian ו-Willems.הם דיווחו של-MLP יש דיוק גבוה יותר משיטות מסורתיות.ההבדל בין שיטת Demirdjian לשיטה המסורתית הוא <0.32 שנים, ושיטת ווילמס היא 0.28 שנים, דבר הדומה לתוצאות המחקר הנוכחי.התוצאות של מחקרים קודמים אלה24,34 תואמות אף הן את תוצאות המחקר הנוכחי, ודיוק הערכת הגיל של מודל ה-DM והשיטה המסורתית דומים.עם זאת, בהתבסס על התוצאות המוצגות, אנו יכולים רק להסיק בזהירות שהשימוש במודלים של DM להערכת גיל עשוי להחליף שיטות קיימות עקב היעדר השוואות והתייחסות למחקרים קודמים.יש צורך במחקרי המשך באמצעות דגימות גדולות יותר כדי לאשר את התוצאות שהתקבלו במחקר זה.
בין המחקרים שבדקו את הדיוק של SD בהערכת גיל השיניים, חלקם הראו דיוק גבוה יותר מהמחקר שלנו.Stepanovsky et al 35 יישמו 22 דגמי SD על צילומי רנטגן פנורמיים של 976 תושבים צ'כים בגילאי 2.7 עד 20.5 שנים ובדקו את הדיוק של כל דגם.הם העריכו את הפיתוח של סך של 16 שיניים קבועות משמאל עליון ותחתון באמצעות קריטריוני הסיווג שהוצעו על ידי Moorrees וחב' 36.ה-MAE נע בין 0.64 ל-0.94 שנים וה-RMSE נע בין 0.85 ל-1.27 שנים, שהם מדויקים יותר משני דגמי ה-DM המשמשים במחקר זה.Shen et al23 השתמשו בשיטת Cameriere כדי להעריך את גיל השיניים של שבע שיניים קבועות בלסת התחתונה השמאלית בתושבי מזרח סין בגילאי 5 עד 13 שנים והשוו אותו לגילאים המוערכים באמצעות רגרסיה ליניארית, SVM ו-RF.הם הראו שלכל שלושת דגמי ה-DM יש דיוק גבוה יותר בהשוואה לנוסחת הקאמרייר המסורתית.ה-MAE וה-RMSE במחקר של Shen היו נמוכים מאלו במודל ה-DM במחקר זה.הדיוק המוגבר של המחקרים על ידי Stepanovsky et al.35 ו-Shen et al.23 עשוי להיות בגלל הכללת נבדקים צעירים יותר בדגימות המחקר שלהם.מכיוון שהערכות גיל עבור משתתפים עם שיניים מתפתחות הופכות מדויקות יותר ככל שמספר השיניים גדל במהלך התפתחות השיניים, הדיוק של שיטת הערכת הגיל המתקבלת עשוי להיפגע כאשר משתתפי המחקר צעירים יותר.בנוסף, הטעות של MLP בהערכת הגיל קטנה מעט מזו של SLP, כלומר MLP מדויקת יותר מ-SLP.MLP נחשב מעט טוב יותר להערכת גיל, אולי בשל השכבות הנסתרות ב-MLP38.עם זאת, יש חריג למדגם החיצוני של נשים (SLP 1.45, MLP 1.49).הממצא שה-MLP מדויק יותר מה-SLP בהערכת הגיל דורש מחקרים רטרוספקטיביים נוספים.
כמו כן הושוו ביצועי הסיווג של מודל ה-DM והשיטה המסורתית ברף של 18 שנים.כל דגמי ה-SD שנבדקו והשיטות המסורתיות במערך המבחנים הפנימי הראו רמות מקובלות של אפליה עבור המדגם בן ה-18.הרגישות לגברים ולנשים הייתה גדולה מ-87.7% ו-94.9%, בהתאמה, והספציפיות הייתה גדולה מ-89.3% ו-84.7%.גם ה-AUROC של כל הדגמים שנבדקו עולה על 0.925.למיטב ידיעתנו, אף מחקר לא בדק את הביצועים של מודל ה-DM עבור סיווג של 18 שנים על בסיס בשלות שיניים.אנו יכולים להשוות את התוצאות של מחקר זה עם ביצועי הסיווג של מודלים של למידה עמוקה בצילומי רנטגן פנורמיים.Guo et al.15 חישבו את ביצועי הסיווג של מודל למידה עמוקה מבוסס CNN ושיטה ידנית המבוססת על השיטה של ​​Demirjian עבור סף גיל מסוים.הרגישות והספציפיות של השיטה הידנית היו 87.7% ו-95.5%, בהתאמה, והרגישות והספציפיות של מודל CNN עלו על 89.2% ו-86.6%, בהתאמה.הם הגיעו למסקנה שמודלים של למידה עמוקה יכולים להחליף או להעלות על הערכה ידנית בסיווג ספי גיל.תוצאות מחקר זה הראו ביצועי סיווג דומים;מאמינים שסיווג באמצעות מודלים של DM יכול להחליף שיטות סטטיסטיות מסורתיות להערכת גיל.מבין הדגמים, DM LR היה המודל הטוב ביותר מבחינת רגישות למדגם הזכר ורגישות וסגוליות עבור המדגם הנשי.LR מדורגת במקום השני בספציפיות לגברים.יתרה מכך, LR נחשב לאחד מדגמי ה-DM35 היותר ידידותיים למשתמש והוא פחות מורכב וקשה לעיבוד.בהתבסס על תוצאות אלו, LR נחשב למודל סיווג הניתוק הטוב ביותר עבור בני 18 באוכלוסייה הקוריאנית.
בסך הכל, הדיוק של הערכת גיל או ביצועי סיווג במערך המבחנים החיצוניים היה גרוע או נמוך יותר בהשוואה לתוצאות במערך המבחנים הפנימיים.כמה דיווחים מצביעים על כך שדיוק או יעילות הסיווג פוחתים כאשר הערכות גיל המבוססות על האוכלוסייה הקוריאנית מיושמות על האוכלוסייה היפנית5,39, ודפוס דומה נמצא במחקר הנוכחי.מגמת התדרדרות זו נצפתה גם במודל DM.לכן, כדי להעריך במדויק את הגיל, גם כאשר משתמשים ב-DM בתהליך הניתוח, יש להעדיף שיטות הנגזרות מנתוני אוכלוסיה ילידים, כגון שיטות מסורתיות5,39,40,41,42.מכיוון שלא ברור אם מודלים של למידה עמוקה יכולים להראות מגמות דומות, יש צורך במחקרים המשווים דיוק ויעילות של סיווג באמצעות שיטות מסורתיות, מודלים של DM ומודלים של למידה עמוקה על אותן דגימות כדי לאשר אם בינה מלאכותית יכולה להתגבר על פערים גזעיים אלה בגיל מוגבל.הערכות.
אנו מדגימים שניתן להחליף שיטות מסורתיות בהערכת גיל המבוססת על מודל ה-DM בפרקטיקה של הערכת גיל משפטית בקוריאה.גילינו גם את האפשרות ליישם למידת מכונה להערכת גיל משפטית.עם זאת, קיימות מגבלות ברורות, כגון מספר המשתתפים הלא מספיק במחקר זה כדי לקבוע באופן סופי את התוצאות, והיעדר מחקרים קודמים להשוואה ולאשר את תוצאות המחקר הזה.בעתיד, יש לערוך מחקרי DM עם מספר גדול יותר של דגימות ואוכלוסיות מגוונות יותר כדי לשפר את הישימות המעשית שלו בהשוואה לשיטות מסורתיות.כדי לאמת את ההיתכנות של שימוש בבינה מלאכותית להערכת גיל במספר אוכלוסיות, יש צורך במחקרים עתידיים כדי להשוות את דיוק הסיווג והיעילות של מודלים של DM ולמידה עמוקה עם שיטות מסורתיות באותן דגימות.
המחקר השתמש ב-2,657 תצלומים אורתוגרפיים שנאספו ממבוגרים קוריאנים ויפנים בגילאי 15 עד 23 שנים.צילומי הרנטגן הקוריאניים חולקו ל-900 ערכות אימון (19.42 ± 2.65 שנים) ו-900 ערכות בדיקה פנימיות (19.52 ± 2.59 שנים).ערכת ההכשרה נאספה במוסד אחד (בית החולים סיאול סנט מרי), ומערך הבדיקות שלו נאסף בשני מוסדות (בית החולים הלאומי לרפואת שיניים של אוניברסיטת סיאול ובית החולים השיניים האוניברסיטאי יונסאי).אספנו גם 857 צילומי רנטגן מנתונים אחרים המבוססים על אוכלוסיה (אוניברסיטת Iwate Medical, יפן) לבדיקה חיצונית.צילומי רנטגן של נבדקים יפניים (19.31 ± 2.60 שנים) נבחרו כמערך הבדיקות החיצוניות.הנתונים נאספו בדיעבד כדי לנתח את שלבי התפתחות השיניים בצילומי רנטגן פנוראמיים שצולמו במהלך טיפול שיניים.כל הנתונים שנאספו היו אנונימיים למעט מין, תאריך לידה ותאריך הרנטגן.קריטריוני הכללה והדרה היו זהים למחקרים שפורסמו בעבר 4, 5.גיל הדגימה בפועל חושב על ידי הפחתת תאריך הלידה מתאריך צילום הרנטגן.קבוצת המדגם חולקה לתשע קבוצות גיל.התפלגות הגיל והמינים מוצגות בטבלה 3 מחקר זה נערך בהתאם להצהרת הלסינקי ואושר על ידי המועצה לביקורת מוסדית (IRB) של בית החולים סיאול סנט מרי של האוניברסיטה הקתולית של קוריאה (KC22WISI0328).בשל התכנון הרטרוספקטיבי של מחקר זה, לא ניתן היה לקבל הסכמה מדעת מכל החולים שעברו בדיקה רנטגנית למטרות טיפוליות.בית החולים סנט מרי של אוניברסיטת סיאול קוריאה (IRB) ויתר על הדרישה להסכמה מדעת.
שלבי התפתחות של טוחנות דו-מקסימליות שניות ושלישיות הוערכו על פי קריטריונים של Demircan25.רק שן אחת נבחרה אם נמצא אותו סוג שן בצד שמאל וימין של כל לסת.אם שיניים הומולוגיות משני הצדדים היו בשלבי התפתחות שונים, השן עם השלב ההתפתחותי התחתון נבחרה כדי להסביר את אי הוודאות בגיל המשוער.מאה צילומי רנטגן שנבחרו באקראי ממערך האימונים קיבלו ניקוד על ידי שני צופים מנוסים כדי לבדוק מהימנות בין צופים לאחר כיול מקדים לקביעת שלב בשלות השיניים.מהימנות תוך צופה הוערכה פעמיים במרווחים של שלושה חודשים על ידי הצופה הראשי.
המין והשלב ההתפתחותי של הטוחנות השנייה והשלישית של כל לסת במערך האימונים הוערכו על ידי צופה ראשוני שאומן במודלים שונים של DM, והגיל בפועל נקבע כערך היעד.מודלים של SLP ו-MLP, שנמצאים בשימוש נרחב בלמידת מכונה, נבדקו מול אלגוריתמי רגרסיה.מודל ה-DM משלב פונקציות ליניאריות תוך שימוש בשלבי ההתפתחות של ארבע השיניים ומשלב נתונים אלו להערכת גיל.SLP היא הרשת העצבית הפשוטה ביותר ואינה מכילה שכבות נסתרות.SLP עובד על בסיס שידור סף בין צמתים.מודל SLP ברגרסיה דומה מבחינה מתמטית לרגרסיה ליניארית מרובה.בניגוד למודל SLP, למודל MLP יש מספר רב של שכבות נסתרות עם פונקציות הפעלה לא ליניאריות.הניסויים שלנו השתמשו בשכבה נסתרת עם רק 20 צמתים נסתרים עם פונקציות הפעלה לא ליניאריות.השתמש בירידה בשיפוע כשיטת האופטימיזציה וב-MAE ו-RMSE כפונקציית ההפסד כדי לאמן את מודל למידת המכונה שלנו.מודל הרגרסיה הטוב ביותר שהושג יושם על מערכי הבדיקה הפנימיים והחיצוניים והוערך גיל השיניים.
פותח אלגוריתם סיווג המשתמש בבגרות של ארבע שיניים במערך האימונים כדי לחזות אם המדגם הוא בן 18 או לא.כדי לבנות את המודל, הפקנו שבעה אלגוריתמי למידת מכונה לייצוג6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost ו-(7) MLP .LR הוא אחד מאלגוריתמי הסיווג הנפוצים ביותר44.זהו אלגוריתם למידה מפוקח המשתמש ברגרסיה כדי לחזות את ההסתברות של נתונים שייכים לקטגוריה מסוימת מ-0 עד 1 ומסווג את הנתונים כשייכים לקטגוריה סבירה יותר בהתבסס על הסתברות זו;משמש בעיקר לסיווג בינארי.KNN הוא אחד מאלגוריתמים הפשוטים ביותר של למידת מכונה45.כאשר מקבלים נתוני קלט חדשים, הוא מוצא K נתונים קרובים לקבוצה הקיימת ולאחר מכן מסווג אותם למחלקה בתדירות הגבוהה ביותר.קבענו 3 למספר השכנים הנחשבים (ק).SVM הוא אלגוריתם שממקסם את המרחק בין שתי מחלקות על ידי שימוש בפונקציית ליבה להרחבת המרחב הליניארי למרחב לא ליניארי הנקרא fields46.עבור מודל זה, אנו משתמשים בהטיה = 1, כוח = 1, וגמא = 1 כפרמטרים היפר-פרמטרים לגרעין הפולינומי.DT יושם בתחומים שונים כאלגוריתם לחלוקת מערך נתונים שלם למספר תת-קבוצות על ידי ייצוג כללי החלטה במבנה עץ47.המודל מוגדר עם מספר מינימלי של רשומות לצומת של 2 ומשתמש במדד Gini כמדד לאיכות.RF היא שיטת אנסמבל המשלבת DTs מרובים כדי לשפר את הביצועים באמצעות שיטת צבירה של bootstrap שיוצרת מסווג חלש עבור כל מדגם על ידי ציור אקראי של דגימות באותו גודל מספר פעמים ממערך הנתונים המקורי48.השתמשנו ב-100 עצים, 10 עומקי עצים, גודל צומת מינימלי אחד ואינדקס תערובת ג'יני כקריטריונים להפרדת צומת.סיווג הנתונים החדשים נקבע ברוב קולות.XGBoost הוא אלגוריתם המשלב טכניקות חיזוק באמצעות שיטה שלוקחת כנתוני אימון את השגיאה בין הערכים האמיתיים והחזויים של הדגם הקודם ומגדילה את השגיאה באמצעות gradients49.זהו אלגוריתם בשימוש נרחב בשל הביצועים הטובים שלו ויעילות המשאבים שלו, כמו גם האמינות הגבוהה כפונקציית תיקון התאמת יתר.הדגם מצויד ב-400 גלגלי תמיכה.MLP היא רשת עצבית שבה פרספטרון אחד או יותר יוצרים שכבה מרובת עם שכבה נסתרת אחת או יותר בין שכבת הקלט והפלט38.באמצעות זה, אתה יכול לבצע סיווג לא ליניארי כאשר כאשר אתה מוסיף שכבת קלט ומקבל ערך תוצאה, ערך התוצאה החזוי מושווה לערך התוצאה בפועל והשגיאה מופצת בחזרה.יצרנו שכבה נסתרת עם 20 נוירונים נסתרים בכל שכבה.כל מודל שפיתחנו יושם על סטים פנימיים וחיצוניים כדי לבדוק את ביצועי הסיווג על ידי חישוב רגישות, ספציפיות, PPV, NPV ו-AUROC.רגישות מוגדרת כיחס בין מדגם המוערך בגיל 18 ומעלה לבין מדגם המוערך בגיל 18 ומעלה.הספציפיות היא שיעור הדגימות מתחת לגיל 18 ואלו המוערכות מתחת לגיל 18.
שלבי השיניים שהוערכו במערך ההכשרה הומרו לשלבים מספריים לצורך ניתוח סטטיסטי.רגרסיה ליניארית ולוגיסטית רב-משתנית בוצעה כדי לפתח מודלים חזויים לכל מין ולהסיק נוסחאות רגרסיה שניתן להשתמש בהן להערכת גיל.השתמשנו בנוסחאות אלה כדי להעריך את גיל השיניים עבור מערכי בדיקה פנימיים וחיצוניים כאחד.טבלה 4 מציגה את דגמי הרגרסיה והמיון המשמשים במחקר זה.
מהימנות תוך ותצפיתניות חושבה באמצעות סטטיסטיקת קאפה של כהן.כדי לבדוק את הדיוק של DM ומודלים של רגרסיה מסורתיים, חישבנו MAE ו-RMSE תוך שימוש בגילאים המשוערים והממשיים של מערכי הבדיקה הפנימיים והחיצוניים.שגיאות אלה משמשות בדרך כלל כדי להעריך את הדיוק של תחזיות המודל.ככל שהשגיאה קטנה יותר, דיוק התחזית גבוה יותר24.השווה את ה-MAE וה-RMSE של ערכות בדיקות פנימיות וחיצוניות המחושבות באמצעות DM ורגרסיה מסורתית.ביצועי הסיווג של הפסקת 18 שנים בסטטיסטיקה מסורתית הוערכו באמצעות טבלת מגירה של 2 × 2.הרגישות המחושבת, הספציפיות, PPV, NPV ו-AUROC של מערך הבדיקות הושוו עם הערכים הנמדדים של מודל סיווג ה-DM.הנתונים מבוטאים כממוצע ± סטיית תקן או מספר (%) בהתאם למאפייני הנתונים.ערכי P דו-צדדיים <0.05 נחשבו מובהקים סטטיסטית.כל הניתוחים הסטטיסטיים השגרתיים בוצעו באמצעות SAS גרסה 9.4 (SAS Institute, Cary, NC).מודל הרגרסיה של DM יושם ב-Python באמצעות Keras50 2.2.4 backend ו-Tensorflow51 1.8.0 במיוחד עבור פעולות מתמטיות.מודל הסיווג DM יושם בסביבת ניתוח הידע של Waikato ובפלטפורמת הניתוח של Konstanz Information Miner (KNIME) 4.6.152.
המחברים מודים כי ניתן למצוא נתונים התומכים במסקנות המחקר במאמר ובחומרים משלימים.מערכי הנתונים שנוצרו ו/או נותחו במהלך המחקר זמינים מהמחבר המתאים לפי בקשה סבירה.
Ritz-Timme, S. et al.הערכת גיל: עדכניות כדי לעמוד בדרישות הספציפיות של תרגול משפטי.בינלאומיות.י. רפואה משפטית.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., and Olze, A. מצב נוכחי של הערכת גיל משפטית של נתינים חיים לצורכי תביעה פלילית.זיהוי פלילי.תרופה.פָּתוֹלוֹגִיָה.1, 239–246 (2005).
Pan, J. et al.שיטה שונה להערכת גיל השיניים של ילדים בגילאי 5 עד 16 שנים במזרח סין.קלינית.סקר בעל פה.25, 3463–3474 (2021).
Lee, SS וכו'. כרונולוגיה של התפתחות טוחנות שנייה ושלישית בקוריאנים ויישומה להערכת גיל משפטית.בינלאומיות.י. רפואה משפטית.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY and Lee, SS דיוק של הערכת גיל ואומדן של סף 18 שנים על סמך הבשלות של טוחנות שנייה ושלישית בקוריאנים ויפנים.PLoS ONE 17, e0271247 (2022).
Kim, JY, et al.ניתוח נתונים מבוסס למידת מכונה לפני ניתוח יכול לחזות את תוצאות הטיפול בניתוחי שינה בחולים עם OSA.המדע.דו"ח 11, 14911 (2021).
האן, מ' ועוד.הערכת גיל מדויקת מלמידת מכונה עם או בלי התערבות אנושית?בינלאומיות.י. רפואה משפטית.136, 821–831 (2022).
Khan, S. and Shaheen, M. מכריית נתונים לכריית נתונים.J.Information.המדע.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. and Shaheen, M. WisRule: The First Cognitive Algorithm for Association Rule Mining.J.Information.המדע.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. and Abdullah U. Karm: כריית נתונים מסורתית המבוססת על כללי אסוציאציה מבוססי הקשר.לחשב.מאט.לְהַמשִׁיך.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. and Habib M. זיהוי דמיון סמנטי מבוסס למידה עמוקה באמצעות נתוני טקסט.לדווח.טכנולוגיות.לִשְׁלוֹט.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
טביש מ', טנולי ז' ושאהין מ' מערכת לזיהוי פעילות בסרטוני ספורט.מולטימדיה.יישומי כלים https://doi.org/10.1007/s11042-021-10519-6 (2021).
חלבי, SS וחב'.אתגר למידת מכונה של RSNA בגיל העצם בילדים.רדיולוגיה 290, 498–503 (2019).
לי, י. ועוד.הערכת גיל משפטית מצילומי רנטגן של האגן באמצעות למידה עמוקה.יוֹרוֹ.קְרִינָה.29, 2322–2329 (2019).
Guo, YC, et al.סיווג גילאים מדויק באמצעות שיטות ידניות ורשתות עצביות קונבולוציוניות עמוקות מתמונות הקרנה אורתוגרפיות.בינלאומיות.י. רפואה משפטית.135, 1589–1597 (2021).
אלבמה דלורה וחב'הערכת גיל עצם באמצעות שיטות למידת מכונה שונות: סקירת ספרות שיטתית ומטה-אנליזה.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K., and Yang, J. הערכת גיל ספציפית לאוכלוסייה של אפרו-אמריקאים וסינים מבוססת על נפחי תא עיסת של טוחנות ראשונות באמצעות טומוגרפיה ממוחשבת של קרן קונוס.בינלאומיות.י. רפואה משפטית.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK ו-Oh KS קביעת קבוצות גיל של אנשים חיים באמצעות תמונות מבוססות בינה מלאכותית של טוחנות ראשונות.המדע.דו"ח 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., and Urschler, M. הערכת גיל אוטומטית וסיווג גיל הרוב מנתוני MRI רב משתנים.IEEE J. Biomed.התראות בריאות.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. ו-Li, G. הערכת גיל מבוססת על פילוח תא עיסת תלת מימדי של טוחנות ראשונות מטומוגרפיה ממוחשבת של אלומת חרוט על ידי שילוב למידה עמוקה וערכות רמה.בינלאומיות.י. רפואה משפטית.135, 365–373 (2021).
Wu, WT, et al.כריית נתונים בביג דאטה קליני: מסדי נתונים נפוצים, שלבים ומודלים של שיטות.עוֹלָם.תרופה.מַשׁאָב.8, 44 (2021).
Yang, J. et al.היכרות עם מאגרי מידע רפואיים וטכנולוגיות כריית נתונים בעידן הביג דאטה.ג'יי אוויד.רפואה בסיסית.13, 57–69 (2020).
Shen, S. et al.שיטת Camerer להערכת גיל השיניים באמצעות למידת מכונה.BMC Oral Health 21, 641 (2021).
Galliburg A. et al.השוואה בין שיטות למידת מכונה שונות לחיזוי גיל דנטלי בשיטת Demirdjian.בינלאומיות.י. רפואה משפטית.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. and Tanner, JM מערכת חדשה להערכת גיל דנטלי.נְחִירָה.ביולוגיה.45, 211–227 (1973).
Landis, JR, and Koch, GG מדדים של הסכם משקיף על נתונים קטגוריים.ביומטריה 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK וצ'וי HK.ניתוח טקסטואלי, מורפולוגי וסטטיסטי של הדמיית תהודה מגנטית דו מימדית באמצעות טכניקות בינה מלאכותית להבדלה של גידולי מוח ראשוניים.מידע בריא.מַשׁאָב.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


זמן פרסום: ינואר-04-2024