Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

תודה שביקרת ב- Nature.com. הגרסה של הדפדפן בה אתה משתמש יש תמיכה מוגבלת של CSS. לקבלת התוצאות הטובות ביותר, אנו ממליצים להשתמש בגרסה חדשה יותר של הדפדפן שלך (או לכבות את מצב התאימות ב- Internet Explorer). בינתיים, כדי להבטיח תמיכה שוטפת, אנו מציגים את האתר ללא סטיילינג או JavaScript.
שיניים נחשבות לאינדיקטור המדויק ביותר לגיל גוף האדם ומשמשות לעתים קרובות בהערכת גיל משפטי. כיוונו לאמת אומדני גיל שיניים מבוססי כריית נתונים על ידי השוואה בין דיוק ההערכה וביצועי הסיווג של סף 18 שנה לשיטות מסורתיות ואומדני גיל מבוססי כריית נתונים. בסך הכל נאספו 2657 רדיוגרפים פנורמיים מאזרחים קוריאנים ויפנים בגילאי 15 עד 23 שנים. הם חולקו למערך אימונים, שכל אחד מהם מכיל 900 רדיוגרפים קוריאניים, ומערכת מבחן פנימית המכילה 857 רדיוגרפים יפניים. השווינו את דיוק הסיווג והיעילות של שיטות מסורתיות עם מערכות בדיקה של מודלים לכריית נתונים. הדיוק של השיטה המסורתית במערך הבדיקות הפנימי מעט גבוה יותר מזה של מודל כריית הנתונים, וההבדל הוא קטן (ממוצע שגיאה מוחלטת <0.21 שנים, שגיאת ריבוע ממוצעת שורש <0.24 שנים). ביצועי הסיווג לניתוק של 18 שנה דומה גם בין שיטות מסורתיות ומודלים של כריית נתונים. לפיכך, ניתן להחליף שיטות מסורתיות על ידי מודלים לכריית נתונים בעת ביצוע הערכת גיל משפטי תוך שימוש בבגרות של טוחנות שנייה ושלישית בקרב מתבגרים קוריאנים ומבוגרים צעירים.
הערכת גיל שיניים נמצאת בשימוש נרחב ברפואה משפטית וברפואת שיניים לילדים. בפרט, בגלל המתאם הגבוה בין גיל כרונולוגי להתפתחות שיניים, הערכת גיל בשלבים התפתחותיים שיניים היא קריטריון חשוב להערכת גילם של ילדים ומתבגרים 1,2,3. עם זאת, עבור צעירים, הערכת גיל השיניים המבוססת על בגרות שיניים יש מגבלות מכיוון שגידול השיניים כמעט שלם, למעט הטוחנות השלישיות. המטרה החוקית של קביעת גילם של צעירים ומתבגרים היא לספק הערכות מדויקות וראיות מדעיות אם הם הגיעו לגיל הרוב. בתרגול הרפואי-משפטי של מתבגרים ומבוגרים צעירים בקוריאה, הוערך הגיל בשיטה של לי, ונחזה סף חוקי של 18 שנה על סמך הנתונים שדווחו על ידי OH et al 5.
למידת מכונה היא סוג של בינה מלאכותית (AI) שלומדת שוב ושוב ומסווגת כמויות גדולות של נתונים, פותרת בעיות בפני עצמה ומניעה את תכנות הנתונים. למידת מכונה יכולה לגלות דפוסים נסתרים שימושיים בכמויות גדולות של נתונים 6. לעומת זאת, שיטות קלאסיות, שהן עתירות עבודה וגוזלות זמן, עשויות להיות בעלות מגבלות בעת התמודדות עם נפחים גדולים של נתונים מורכבים שקשה לעבד אותם ידנית 7. לפיכך, מחקרים רבים נערכו לאחרונה באמצעות טכנולוגיות המחשבים האחרונות כדי למזער שגיאות אנושיות ולמעבד ביעילות נתונים רב -ממדיים 8,9,10,11,12. בפרט, הלמידה העמוקה הייתה בשימוש נרחב בניתוח דימוי רפואי, ושיטות שונות להערכת גיל על ידי ניתוח אוטומטי של רדיוגרפים דווחו כמשפרים את הדיוק והיעילות של אומדן הגיל 13,14,15,16,17,18,19,20 ו לדוגמה, Halabi et al 13 פיתחו אלגוריתם למידת מכונה המבוסס על רשתות עצביות מפותלות (CNN) כדי להעריך את גיל השלד באמצעות רדיוגרפים של ידי ילדים. מחקר זה מציע מודל המיישם למידת מכונה על תמונות רפואיות ומראה ששיטות אלה יכולות לשפר את דיוק האבחון. Li et al14 העריכו גיל מתמונות רנטגן באגן באמצעות CNN למידה עמוקה והשווה אותם עם תוצאות רגרסיה באמצעות הערכת שלב האוספיקציה. הם מצאו כי מודל ה- CNN הלמידה העמוקה הראה את ביצועי הערכת הגיל כמו מודל הרגרסיה המסורתי. המחקר של Guo et al. [15] העריך את ביצועי סיווג הסובלנות לגיל של טכנולוגיית CNN המבוססת על אורתופוטו שיניים, ותוצאות מודל ה- CNN הוכיחו כי בני האדם ביצעו את ביצועי סיווג הגילאים שלה.
מרבית המחקרים על הערכת גיל באמצעות למידת מכונות משתמשים בשיטות למידה עמוקה 12,14,15,16,17,18,19,20. על פי הדיווחים, הערכת גיל המבוססת על למידה עמוקה מדויקת יותר משיטות מסורתיות. עם זאת, גישה זו מספקת הזדמנות מועטה להציג את הבסיס המדעתי לאומדני גיל, כמו מדדי הגיל המשמשים באומדנים. יש גם מחלוקת חוקית על מי שמנהל את הבדיקות. לפיכך, קשה לקבל את הערכת הגיל המבוססת על למידה עמוקה על ידי הרשויות המינהליות והשיפוטיות. כריית נתונים (DM) היא טכניקה שיכולה לגלות לא רק צפוי אלא גם מידע בלתי צפוי כשיטה לגילוי מתאם שימושי בין כמויות גדולות של נתונים 6,21,22. למידת מכונה משמשת לרוב בכריית נתונים, ושני כריית נתונים וגם למידת מכונה משתמשים באותם אלגוריתמי מפתח כדי לגלות דפוסים בנתונים. הערכת גיל תוך שימוש בפיתוח שיניים מבוססת על הערכת הבוחן של בגרות שיני המטרה, והערכה זו באה לידי ביטוי כשלב לכל שן יעד. ניתן להשתמש ב- DM לניתוח המתאם בין שלב הערכת שיניים לגיל בפועל ויש לו פוטנציאל להחליף ניתוח סטטיסטי מסורתי. לכן, אם אנו מיישמים טכניקות DM על הערכת גיל, אנו יכולים ליישם למידת מכונה באומדן גיל משפטי מבלי לדאוג לאחריות משפטית. מספר מחקרים השוואתיים פורסמו על אלטרנטיבות אפשריות לשיטות ידניות מסורתיות המשמשות בפרקטיקה משפטית ובשיטות מבוססות EBM לקביעת גיל השיניים. Shen et al23 הראו שמודל ה- DM מדויק יותר מהנוסחה המסורתית של קמרר. Galibourg et al24 יישמו שיטות DM שונות כדי לחזות את הגיל על פי הקריטריון Demirdjian25 והתוצאות הראו כי שיטת DM ביצעה את השיטות של Demirdjian ו- Willems בהערכת גיל האוכלוסייה הצרפתית.
כדי להעריך את עידן השיניים של מתבגרים קוריאנים ומבוגרים צעירים, השיטה 4 של לי נמצאת בשימוש נרחב בתרגול משפטי קוריאני. שיטה זו משתמשת בניתוח סטטיסטי מסורתי (כמו רגרסיה מרובה) כדי לבחון את הקשר בין נבדקים קוריאנים לגיל הכרונולוגי. במחקר זה, שיטות הערכת גיל המתקבלות בשיטות סטטיסטיות מסורתיות מוגדרות כ"שיטות מסורתיות ". השיטה של לי היא שיטה מסורתית, והדיוק שלה אושר על ידי OH et al. 5; עם זאת, עדיין מוטל בספק את תחולת הערכת הגיל המבוסס על מודל DM בתרגול משפטי קוריאני. מטרתנו הייתה לאמת מדעית את התועלת הפוטנציאלית של הערכת הגיל על בסיס מודל DM. מטרת המחקר הייתה (1) להשוות את הדיוק של שני מודלים של DM בהערכת גיל השיניים ו (2) להשוות את ביצועי הסיווג של 7 דגמי DM בגיל 18 שנים עם אלה שהושגו בשיטות סטטיסטיות מסורתיות בשלות של שנייה וטוחנות שלישיות בשני הלסתות.
אמצעים וסטיות תקן של גיל כרונולוגי לפי שלב וסוג השן מוצגים באופן מקוון בטבלה משלימה S1 (מערך אימונים), טבלה משלימה S2 (מערך בדיקות פנימי) וטבלה משלימה S3 (מערך בדיקות חיצוני). ערכי הקאפה לאמינות תוך-צופים והתקבלו ממערך האימונים היו 0.951 ו- 0.947 בהתאמה. ערכי P ומרווחי ביטחון של 95% לערכי קאפה מוצגים בטבלה משלימה מקוונת S4. ערך הקאפה התפרש כ"כמעט מושלם ", בקנה אחד עם הקריטריונים של לנדיס ו- Koch26.
כאשר משווים בין שגיאה מוחלטת ממוצעת (MAE), השיטה המסורתית עולה על ביצועי מודל ה- DM של כל המינים ובמערכת הבדיקה החיצונית של הגברים, למעט Perceptron רב שכבתי (MLP). ההבדל בין המודל המסורתי למודל DM במערכת הבדיקה הפנימית של MAE היה 0.12–0.19 שנים לגברים ו- 0.17–0.21 שנים לנשים. עבור סוללת הבדיקה החיצונית ההבדלים קטנים יותר (0.001–0.05 שנים לגברים ו- 0.05–0.09 שנים לנשים). בנוסף, שגיאת ריבוע ממוצע השורש (RMSE) נמוכה מעט מהשיטה המסורתית, עם הבדלים קטנים יותר (0.17–0.24, 0.2–0.24 עבור מערך הבדיקה הפנימי הגברי, ו- 0.03–0.07, 0.04–0.08 עבור מערך הבדיקה החיצוני). ). MLP מציג ביצועים מעט טובים יותר מאשר Perceptron בשכבה יחידה (SLP), למעט במקרה של מערך הבדיקה החיצוני הנשי. עבור MAE ו- RMSE, מערך הבדיקה החיצוני ציוני ציוני גבוה יותר מאשר מערך הבדיקה הפנימי עבור כל המינים והדגמים. כל MAE ו- RMSE מוצגים בטבלה 1 ובאיור 1.
MAE ו- RMSE של מודלים של רגרסיה מסורתית וכריית נתונים. שגיאה מוחלטת ממוצעת, שגיאה ממוצעת שגיאה מרובעת RMSE, שכבה יחידה perceptron SLP, MLPTRON MLP, שיטת CM מסורתית.
הוכח ביצועי סיווג (עם ניתוק של 18 שנה) של מודלים המסורתיים וה- DM מבחינת רגישות, ספציפיות, ערך חיזוי חיובי (PPV), ערך חיזוי שלילי (NPV), ואזור תחת עקומת האופיינית להפעלת המקלט (AUROC) 27 (טבלה 2, איור 2 ואיור משלים 1 באופן מקוון). מבחינת הרגישות של סוללת הבדיקה הפנימית, שיטות מסורתיות ביצעו בצורה הטובה ביותר בקרב גברים וגרוע מכך בקרב נשים. עם זאת, ההבדל בביצועי הסיווג בין שיטות מסורתיות ל- SD הוא 9.7% עבור גברים (MLP) ורק 2.4% לנשים (XGBOOST). בקרב דגמי DM, רגרסיה לוגיסטית (LR) הראתה רגישות טובה יותר בשני המינים. לגבי הספציפיות של מערך הבדיקה הפנימי, נצפה כי ארבעת דגמי ה- SD ביצעו ביצועים טובים אצל גברים, בעוד שהמודל המסורתי ביצע טוב יותר אצל נקבות. ההבדלים בביצועי הסיווג של גברים ונשים הם 13.3% (MLP) ו- 13.1% (MLP), בהתאמה, מה שמצביע על כך שההבדל בביצועי הסיווג בין דגמים עולה על הרגישות. בין דגמי ה- DM, דגמי וקטור התמיכה (SVM), עץ ההחלטה (DT) ודגמי יער אקראי (RF) ביצעו את הטוב ביותר בקרב גברים, ואילו דגם ה- LR ביצע את הטוב ביותר בקרב נקבות. ה- AUROC של הדגם המסורתי וכל דגמי ה- SD היה גדול מ- 0.925 (K-Nearest (KNN) אצל גברים), והפגין ביצועי סיווג מצוינים בהבחנה של דגימות 18 שנה. עבור מערך הבדיקות החיצוני, חלה ירידה בביצועי הסיווג מבחינת הרגישות, הספציפיות וה- AUROC בהשוואה למערכת הבדיקה הפנימית. יתר על כן, ההבדל ברגישות ובספציפיות בין ביצועי הסיווג של הדגמים הטובים והגרועים ביותר נע בין 10% ל- 25% והיה גדול יותר מההבדל במערכת הבדיקה הפנימית.
רגישות וספציפיות של דגמי סיווג כריית נתונים בהשוואה לשיטות מסורתיות עם ניתוק של 18 שנה. Knn K השכן הקרוב ביותר, מכונת וקטור תמיכה ב- SVM, רגרסיה לוגיסטית של LR, עץ ההחלטה של DT, RF Random Forest, XGB XGBOOST, MLP Multibayer Perceptron, שיטת CM מסורתית.
השלב הראשון במחקר זה היה להשוות את הדיוק של אומדני גיל השיניים שהתקבלו משבעה מודלים של DM עם אלה שהתקבלו באמצעות רגרסיה מסורתית. MAE ו- RMSE הוערכו במערכות בדיקות פנימיות לשני המינים, וההבדל בין השיטה המסורתית למודל DM נע בין 44 ל- 77 יום עבור MAE ומ 62 ל- 88 יום עבור RMSE. למרות שהשיטה המסורתית הייתה מעט מדויקת במחקר זה, קשה להסיק אם להבדל כה קטן יש משמעות קלינית או מעשית. תוצאות אלה מצביעות על כך שהדיוק של הערכת גיל השיניים באמצעות מודל DM זהה כמעט לזה של השיטה המסורתית. השוואה ישירה עם תוצאות ממחקרים קודמים היא קשה מכיוון שאף מחקר לא השווה את הדיוק של מודלים של DM עם שיטות סטטיסטיות מסורתיות תוך שימוש באותה טכניקה של רישום שיניים באותו טווח גילאים כמו במחקר זה. Galibourg et al24 השוו את MAE ו- RMSE בין שתי שיטות מסורתיות (Demirjian Method25 ו- Willems Method29) ו- 10 דגמי DM באוכלוסייה צרפתית בגילאי שנתיים עד 24 שנים. הם דיווחו כי כל דגמי ה- DM היו מדויקים יותר משיטות מסורתיות, עם הבדלים של 0.20 ו- 0.38 שנים ב- MAE ו- 0.25 ו- 0.47 שנים ב- RMSE בהשוואה לשיטות Willeems ו- Demirdjian, בהתאמה. הפער בין מודל ה- SD לשיטות המסורתיות המוצגות במחקר הליבורג לוקח בחשבון מספר דוחות 30,31,32,33 כי שיטת דמירדיאן אינה מעריכה במדויק את גיל השיניים באוכלוסיות שאינן הקנדים הצרפתים עליהם התבסס המחקר. במחקר זה. Tai et al 34 השתמשו באלגוריתם ה- MLP כדי לחזות את גיל השן משנת 1636 תצלומים אורתודונטיים סיניים והשווה את דיוקו עם תוצאות שיטת Demirjian ו- Willems. הם דיווחו כי ל- MLP יש דיוק גבוה יותר מאשר שיטות מסורתיות. ההבדל בין שיטת Demirdjian לשיטה המסורתית הוא <0.32 שנים, ושיטת Willems היא 0.28 שנים, הדומה לתוצאות המחקר הנוכחי. תוצאות המחקרים הקודמים הללו24,34 תואמים גם את תוצאות המחקר הנוכחי, ודיוק הערכת הגיל של מודל DM והשיטה המסורתית דומים. עם זאת, בהתבסס על התוצאות שהוצגו, אנו יכולים רק להסיק בזהירות כי השימוש במודלי DM כדי להעריך את הגיל עשוי להחליף שיטות קיימות בגלל היעדר מחקרים קודמים והתייחסות. יש צורך במחקרי מעקב המשתמשים בדגימות גדולות יותר כדי לאשר את התוצאות שהתקבלו במחקר זה.
בין המחקרים שבדקו את הדיוק של SD באומדן גיל השיניים, חלקם הראו דיוק גבוה יותר מהמחקר שלנו. Stepanovsky et al 35 יישמו 22 דגמי SD על רדיוגרפים פנורמיים של 976 תושבים צ'כים בגילאי 2.7 עד 20.5 שנים ובדקו את הדיוק של כל דגם. הם העריכו את התפתחותם של 16 שיניים קבועות שמאליות עליונות ותחתונות בעזרת קריטריוני הסיווג שהוצעו על ידי Moorrees et al 36. ה- MAE נע בין 0.64 ל- 0.94 שנים וה- RMSE נע בין 0.85 ל 1.27 שנים, שהם מדויקים יותר משני דגמי ה- DM ששימשו במחקר זה. Shen et al23 השתמשו בשיטת קממרר כדי להעריך את גיל השיניים של שבע שיניים קבועות במנדט השמאלי בתושבי מזרח סינים בגילאי 5 עד 13 שנים והשווה אותה עם הגילאים המוערכים באמצעות רגרסיה לינארית, SVM ו- RF. הם הראו כי לשלושת דגמי ה- DM יש דיוק גבוה יותר בהשוואה לנוסחה המסורתית של Cameriere. ה- MAE ו- RMSE במחקר של שן היו נמוכים יותר מאלו במודל DM במחקר זה. הדיוק המוגבר של המחקרים של סטפנובסקי ואח '. 35 ושן ואח '. 23 יכול לנבוע מהכללתם של נבדקים צעירים יותר בדגימות המחקר שלהם. מכיוון שאומדני גיל למשתתפים עם פיתוח שיניים הופכים מדויקים יותר ככל שמספר השיניים עולה במהלך התפתחות השיניים, הדיוק של שיטת הערכת הגיל המתקבלת עשוי להיפגע כאשר משתתפי המחקר צעירים יותר. בנוסף, השגיאה של MLP באומדן הגיל מעט קטנה יותר מזו של SLP, כלומר MLP מדויקת יותר מ- SLP. MLP נחשב מעט טוב יותר לאומדן הגיל, אולי כתוצאה מהשכבות הנסתרות ב- MLP38. עם זאת, יש חריג למדגם החיצוני של נשים (SLP 1.45, MLP 1.49). הממצא כי ה- MLP מדויק יותר מה- SLP בהערכת הגיל דורש מחקרים רטרוספקטיביים נוספים.
הושווה גם את ביצועי הסיווג של מודל DM והשיטה המסורתית בסף של 18 שנה. כל דגמי ה- SD שנבדקו ושיטות מסורתיות במערכת הבדיקה הפנימית הראו רמות אפליה מקובלות למעשה עבור המדגם בן ה -18. הרגישות לגברים ונשים הייתה גדולה מ- 87.7% ו- 94.9% בהתאמה, והספציפיות הייתה גדולה מ- 89.3% ו 84.7%. ה- AUROC של כל הדגמים שנבדקו עולה גם על 0.925. למיטב ידיעתנו, אף מחקר לא בדק את הביצועים של מודל DM לסיווג של 18 שנה על בסיס בגרות שיניים. אנו יכולים להשוות את תוצאות המחקר עם ביצועי הסיווג של מודלים של למידה עמוקה ברדיוגרפים פנורמיים. Guo et al.15 חישבו את ביצועי הסיווג של מודל למידה עמוקה מבוסס CNN ושיטה ידנית המבוססת על השיטה של דמירג'יאן לסף גיל מסוים. הרגישות והספציפיות של השיטה הידנית היו 87.7% ו- 95.5% בהתאמה, והרגישות והספציפיות של מודל ה- CNN עברו 89.2% ו- 86.6% בהתאמה. הם הגיעו למסקנה שמודלים של למידה עמוקה יכולים להחליף או לעלות על ההערכה הידנית בסיווג ספי הגיל. תוצאות המחקר הראו ביצועי סיווג דומים; ההערכה היא כי סיווג באמצעות דגמי DM יכול להחליף שיטות סטטיסטיות מסורתיות להערכת גיל. בין הדגמים, DM LR היה המודל הטוב ביותר מבחינת הרגישות למדגם הגברי והרגישות והספציפיות עבור המדגם הנשי. LR מדורגת במקום השני בספציפיות לגברים. יתר על כן, LR נחשב לאחד מדגמי DM35 ידידותיים יותר למשתמש והוא פחות מורכב וקשה לעיבוד. בהתבסס על תוצאות אלה, LR נחשב למודל סיווג הניתוק הטוב ביותר עבור ילדים בני 18 באוכלוסייה הקוריאנית.
בסך הכל, הדיוק של הערכת הגיל או ביצועי הסיווג במערך הבדיקות החיצוני היה גרוע או נמוך יותר בהשוואה לתוצאות במערכת הבדיקה הפנימית. חלק מהדיווחים מצביעים על כך שדיוק הסיווג או היעילות יורדים כאשר אומדני הגיל המבוססים על האוכלוסייה הקוריאנית מיושמים על האוכלוסייה היפנית 5,39, ונמצא דפוס דומה במחקר הנוכחי. מגמת הידרדרות זו נצפתה גם במודל DM. לפיכך, כדי להעריך במדויק את הגיל, גם בעת שימוש ב- DM בתהליך הניתוח, יש להעדיף שיטות הנגזרות מנתוני אוכלוסייה ילידים, כמו שיטות מסורתיות, 5,39,40,41,42. מכיוון שלא ברור אם מודלים של למידה עמוקה יכולים להציג מגמות דומות, מחקרים המשווים בין דיוק סיווג ויעילות בשיטות מסורתיות, מודלים של DM ומודלים של למידה עמוקה על אותן דגימות נדרשים כדי לאשר אם בינה מלאכותית יכולה להתגבר על הפערים הגזעיים הללו בגיל מוגבל. הערכות.
אנו מדגימים כי ניתן להחליף שיטות מסורתיות על ידי הערכת גיל על בסיס מודל DM בתרגול הערכת גיל פלילי בקוריאה. גילינו גם את האפשרות ליישם למידת מכונות לצורך הערכת גיל משפטי. עם זאת, ישנן מגבלות ברורות, כמו המספר הלא מספיק של המשתתפים במחקר זה כדי לקבוע באופן סופי את התוצאות, והיעדר מחקרים קודמים כדי להשוות ולאשר את תוצאות המחקר. בעתיד, יש לערוך מחקרי DM עם מספר גדול יותר של דגימות ואוכלוסיות מגוונות יותר כדי לשפר את תחולתה המעשית בהשוואה לשיטות המסורתיות. כדי לאמת את היתכנות השימוש בבינה מלאכותית כדי להעריך את הגיל באוכלוסיות מרובות, יש צורך במחקרים עתידיים כדי להשוות את דיוק הסיווג ויעילותם של DM ומודלים של למידה עמוקה עם שיטות מסורתיות באותן דגימות.
המחקר השתמש ב -2,657 תצלומים אורתוגרפיים שנאספו ממבוגרים קוריאנים ויפנים בגילאי 15 עד 23. הרדיוגרפים הקוריאניים חולקו ל 900 מערכות אימונים (19.42 ± 2.65 שנים) ו 900 מערכות בדיקות פנימיות (19.52 ± 2.59 שנים). מערך ההדרכה נאסף במוסד אחד (בית החולים סנט מרי סיאול), ומערכת המבחנים שלו נאספה בשני מוסדות (בית החולים השיניים הלאומי באוניברסיטת סיאול ובית החולים השיניים של אוניברסיטת יונסי). אספנו גם 857 רדיוגרפים מנתונים אחרים מבוססי אוכלוסייה (האוניברסיטה הרפואית IWATE, יפן) לבדיקה חיצונית. רדיוגרפים של נבדקים יפניים (19.31 ± 2.60 שנים) נבחרו כמערכת הבדיקה החיצונית. הנתונים נאספו בדיעבד כדי לנתח את שלבי התפתחות השיניים ברדיוגרפים פנורמיים שנלקחו במהלך טיפול שיניים. כל הנתונים שנאספו היו אנונימיים למעט מגדר, תאריך לידה ותאריך הרדיוגרף. קריטריוני הכללה והדרה היו זהים למחקרים שפורסמו בעבר 4, 5. הגיל בפועל של המדגם חושב על ידי הפחתת תאריך הלידה מהמועד בו נלקח הרדיוגרף. קבוצת הדגימה חולקה לתשע קבוצות גיל. התפלגות הגיל והמין מוצגות בלוח 3 מחקר זה נערך בהתאם להצהרת הלסינקי ואושר על ידי מועצת הביקורת המוסדית (IRB) מבית החולים סיאול סנט מרי באוניברסיטה הקתולית בקוריאה (KC222WISI0328). בשל התכנון הרטרוספקטיבי של מחקר זה, לא ניתן היה להשיג הסכמה מדעת מכל החולים העוברים בדיקה רדיוגרפית למטרות טיפוליות. אוניברסיטת סיאול קוריאה, בית החולים סנט מרי (IRB) ויתר על הדרישה להסכמה מדעת.
שלבים התפתחותיים של טוחנות שנייה ושלישית בבימקסילרי הוערכו על פי קריטריונים Demircan25. רק שן אחת נבחרה אם נמצא אותו סוג של שן בצד שמאל וימין של כל לסת. אם שיניים הומולוגיות משני הצדדים היו בשלבים התפתחותיים שונים, השן עם שלב ההתפתחות התחתון נבחרה כדי להסביר את חוסר הוודאות בגיל המשוער. מאה רדיוגרפים שנבחרו באופן אקראי ממערך האימונים נקבעו על ידי שני משקיפים מנוסים לבדיקת אמינות בין -צופים לאחר כיול מראש לקביעת שלב הבגרות השיניים. אמינות בין-שרים הוערכה פעמיים במרווחים של שלושה חודשים על ידי הצופה הראשי.
שלב המין וההתפתחות של הטוחנות השנייה והשלישית של כל לסת במערך האימונים הוערך על ידי מתבונן ראשוני שהוכשר עם דגמי DM שונים, והגיל בפועל נקבע כערך היעד. דגמי SLP ו- MLP, הנמצאים בשימוש נרחב בלימוד מכונות, נבדקו כנגד אלגוריתמי רגרסיה. מודל ה- DM משלב פונקציות לינאריות תוך שימוש בשלבים ההתפתחותיים של ארבע השיניים ומשלב נתונים אלה כדי להעריך את הגיל. SLP היא הרשת העצבית הפשוטה ביותר ואינה מכילה שכבות נסתרות. SLP עובד על בסיס העברת סף בין צמתים. מודל ה- SLP ברגרסיה דומה באופן מתמטי לרגרסיה לינארית מרובה. בניגוד למודל SLP, לדגם MLP יש שכבות נסתרות מרובות עם פונקציות הפעלה לא לינאריות. הניסויים שלנו השתמשו בשכבה נסתרת עם 20 צמתים נסתרים בלבד עם פונקציות הפעלה לא לינאריות. השתמש בירידת שיפוע כשיטת האופטימיזציה ו- MAE ו- RMSE כפונקציית האובדן כדי להכשיר את מודל למידת המכונה שלנו. מודל הרגרסיה המתקבל הטוב ביותר הוחל על מערכות הבדיקה הפנימיות והחיצוניות וגיל השיניים הוערך.
פותח אלגוריתם סיווג המשתמש בבגרות של ארבע שיניים באימונים שנקבעו כדי לחזות אם מדגם בן 18 או לא. כדי לבנות את המודל, הגענו לשבעה ייצוג אלגוריתמים למידת מכונות 6,43: (1) LR, (2) Knn, (3) SVM, (4) DT, (5) RF, (6) XGBOOST ו- (7) MLP ו LR הוא אחד מאלגוריתמי הסיווג הנפוצים ביותר 44. זהו אלגוריתם למידה בפיקוח המשתמש ברגרסיה כדי לחזות את ההסתברות לנתונים השייכים לקטגוריה מסוימת מ- 0 ל- 1 ומסווג את הנתונים כשייכים לקטגוריה סבירה יותר על סמך הסתברות זו; משמש בעיקר לסיווג בינארי. KNN הוא אחד מאלגוריתמי למידת המכונה הפשוטים ביותר 45. כאשר מקבלים נתוני קלט חדשים, הוא מוצא נתוני K קרובים לסט הקיים ואז מסווגים אותם לכיתה עם התדר הגבוה ביותר. קבענו 3 למספר השכנים הנחשבים (k). SVM הוא אלגוריתם שממקסם את המרחק בין שתי סוגים באמצעות פונקציית גרעין כדי להרחיב את המרחב הליניארי לחלל לא לינארי שנקרא Fields46. עבור מודל זה אנו משתמשים בהטיה = 1, כוח = 1, וגמא = 1 כהיפר -פרמטרים עבור הגרעין הפולינומי. DT מיושם בתחומים שונים כאלגוריתם לחלק מערך נתונים שלם למספר קבוצות משנה על ידי ייצוג כללי ההחלטה במבנה העץ 47. הדגם מוגדר עם מספר מינימלי של רשומות לכל צומת של 2 ומשתמש במדד GINI כמדד לאיכות. RF היא שיטת אנסמבל המשלבת מספר DTS לשיפור הביצועים בשיטת צבירה של רצועת אתחול המייצרת מסווג חלש עבור כל מדגם על ידי ציור אקראי של דגימות בגודל זהה פעמים רבות מהנתונים המקוריים 48. השתמשנו במאה עצים, 10 עומקי עץ, 1 גודל צומת מינימלי ומדד תערובת ג'יני כקריטריוני הפרדת צומת. סיווג הנתונים החדשים נקבע על ידי רוב קולות. XGBOOST הוא אלגוריתם המשלב טכניקות הגברה בשיטה שלוקחת כנתוני אימונים את השגיאה בין הערכים בפועל לחזוי של המודל הקודם ומגדילה את השגיאה באמצעות Glasients49. זהו אלגוריתם בשימוש נרחב בגלל הביצועים הטובים והיעילות שלו במשאבים, כמו גם אמינות גבוהה כפונקציה לתיקון יתר על המידה. הדגם מצויד ב -400 גלגלי תמיכה. MLP היא רשת עצבית בה אחד או יותר תפירה אחת יוצרים שכבות מרובות עם שכבה אחת או יותר נסתרת בין שכבות הקלט לפלט 38. בעזרת זה אתה יכול לבצע סיווג לא לינארי כאשר כאשר אתה מוסיף שכבת קלט ולקבל ערך תוצאה, ערך התוצאה החזוי מושווה לערך התוצאה בפועל והשגיאה מופצת בחזרה. יצרנו שכבה נסתרת עם 20 נוירונים נסתרים בכל שכבה. כל מודל שפיתחנו הוחל על קבוצות פנימיות וחיצוניות לבדיקת ביצועי הסיווג על ידי חישוב הרגישות, הספציפיות, PPV, NPV ו- AUROC. הרגישות מוגדרת כיחס בין מדגם המוערך בגיל 18 ומעלה למדגם המוערך בגיל 18 ומעלה. הספציפיות היא שיעור הדגימות מתחת לגיל 18 ואלו המוערכים מתחת לגיל 18.
שלבי השיניים שהוערכו במערך האימונים הוסבו לשלבים מספריים לניתוח סטטיסטי. רגרסיה לינארית ולוגיסטית רב -משתנית בוצעה כדי לפתח מודלים חזויים לכל מין ולהפיק נוסחאות רגרסיה שניתן להשתמש בהן כדי להעריך את הגיל. השתמשנו בנוסחאות אלה כדי להעריך את גיל השיניים עבור מערכות בדיקה פנימיות וחיצוניות כאחד. טבלה 4 מציגה את מודלי הרגרסיה והסיווג המשמשים במחקר זה.
אמינות תוך-צופים וחושבה באמצעות נתון הקאפה של כהן. כדי לבדוק את הדיוק של DM ומודלים של רגרסיה מסורתית, חישבנו MAE ו- RMSE באמצעות הגילאים המשוערים והאמיתיים של מערכות הבדיקה הפנימיות והחיצוניות. שגיאות אלה משמשות לרוב כדי להעריך את הדיוק של תחזיות המודל. ככל שהשגיאה קטנה יותר, כך הדיוק של התחזית 24 גבוהה יותר. השווה את ה- MAE ו- RMSE של ערכות בדיקה פנימיות וחיצוניות המחושבות באמצעות DM ורגרסיה מסורתית. ביצועי הסיווג של הניתוק של 18 שנה בסטטיסטיקה מסורתית הוערך באמצעות טבלת מגירה 2 × 2. הרגישות המחושבת, הספציפיות, PPV, NPV ו- AUROC של מערך הבדיקה הושוו עם הערכים הנמדדים של מודל סיווג DM. הנתונים באים לידי ביטוי כממוצע ± סטיית תקן או מספר (%) בהתאם למאפייני הנתונים. ערכי P דו צדדיים <0.05 נחשבו למובהקים סטטיסטית. כל הניתוחים הסטטיסטיים השגרתיים בוצעו באמצעות SAS גרסה 9.4 (SAS Institute, Cary, NC). מודל הרגרסיה של DM יושם בפייתון באמצעות Keras50 2.2.4 Backend ו- TensorFlow51 1.8.0 במיוחד לפעולות מתמטיות. מודל סיווג ה- DM יושם בסביבת ניתוח הידע של Waikato ובפלטפורמת ניתוח המידע Konstanz (Knime) 4.6.152.
המחברים מכירים בכך שניתן למצוא נתונים התומכים במסקנות המחקר במאמר ובחומרים המשלימים. מערכי הנתונים שנוצרו ו/או מנותחים במהלך המחקר זמינים מהמחבר המתאים בבקשה סבירה.
Ritz-Timme, S. et al. הערכת גיל: מצב האמנות כדי לעמוד בדרישות הספציפיות של תרגול משפטי. בינלאומי. ג '. רפואה משפטית. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., and Olze, A. המצב הנוכחי של הערכת גיל משפטית של נושאים חיים למטרות תביעה פלילית. פלילי. תרופה. פָּתוֹלוֹגִיָה. 1, 239–246 (2005).
Pan, J. et al. שיטה שונה להערכת גיל השיניים של ילדים בגילאי 5 עד 16 שנים במזרח סין. קליני. סקר בעל פה. 25, 3463–3474 (2021).
Lee, SS וכו 'כרונולוגיה של התפתחות טוחנות שנייה ושלישית בקוריאנים ויישומה להערכת גיל משפטי. בינלאומי. ג '. רפואה משפטית. 124, 659–665 (2010).
הו, ש., קומגאי, א., קים, סי ולי, דיוק SS של הערכת הגיל ואומדן הסף של 18 שנה על בסיס בגרותן של טוחנות שנייה ושלישית בקוריאנים ויפנים. PLOS ONE 17, E0271247 (2022).
קים, JY, et al. ניתוח נתונים מבוסס למידת מכונה לפני הניתוח יכול לחזות את תוצאת הטיפול בניתוחי שינה בקרב חולים עם OSA. המדע. דוח 11, 14911 (2021).
Han, M. et al. הערכת גיל מדויקת מלמידת מכונות עם או בלי התערבות אנושית? בינלאומי. ג '. רפואה משפטית. 136, 821–831 (2022).
חאן, ש 'ושאהין, מ' מכריית נתונים לכריית נתונים. J. Information. המדע. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. and Shaheen, M. Wisrule: האלגוריתם הקוגניטיבי הראשון לכריית שלטון האגודה. J. Information. המדע. https://doi.org/10.1177/01655515221108695 (2022).
שאהין מ 'ועבדאללה U. KARM: כריית נתונים מסורתית המבוססת על כללי אסוציאציה מבוססי הקשר. לְחַשֵׁב. מאט. לְהַמשִׁיך. 68, 3305–3322 (2021).
מוחמד מ ', רחמן ז', שאהין מ ', חאן מ' וחביב מ. זיהוי דמיון סמנטי מבוסס למידה עמוקה באמצעות נתוני טקסט. לְהוֹדִיעַ. טכנולוגיות. לִשְׁלוֹט. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., and Shahin, M. מערכת להכרה בפעילות בסרטוני ספורט. מולטימדיה. יישומי כלים https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, Ss et al. אתגר למידת מכונה של RSNA בעידן העצם לילדים. רדיולוגיה 290, 498–503 (2019).
Li, Y. et al. הערכת גיל משפטי מצילומי רנטגן באגן באמצעות למידה עמוקה. יוֹרוֹ. קְרִינָה. 29, 2322–2329 (2019).
Guo, YC, et al. סיווג גיל מדויק בשיטות ידניות ורשתות עצביות מפותלות עמוקות מתמונות הקרנה אורתוגרפיות. בינלאומי. ג '. רפואה משפטית. 135, 1589–1597 (2021).
אלבמה דלורה ואח '. הערכת גיל העצם בשיטות למידת מכונות שונות: סקירת ספרות שיטתית ומטא-אנליזה. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., and Yang, J. הערכת גיל ספציפית לאוכלוסייה של אפריקאים אמריקאים וסינים על בסיס נפחי תא עיסת של טוחנות ראשונות באמצעות טומוגרפיה ממוחשבת של קרן חרוט. בינלאומי. ג '. רפואה משפטית. 136, 811–819 (2022).
קים ס., לי YH, נוח י.ק. המדע. דוח 11, 1073 (2021).
Stern, D., Pameer, C., Giuliani, N., and Urschler, M. הערכת גיל אוטומטית וסיווג גיל הרוב מנתוני MRI רב -משתנים. IEEE J. BIOMED. התראות בריאותיות. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. ו- Li, G. הערכת גיל המבוססת על פילוח תא עיסת תלת מימד של טוחנות ראשונות מטומוגרפיה ממוחשבת של חרוט קרן על ידי שילוב של למידה עמוקה ומערכות רמה. בינלאומי. ג '. רפואה משפטית. 135, 365–373 (2021).
WU, WT, et al. כריית נתונים בנתונים גדולים קליניים: מסדי נתונים נפוצים, שלבים ושיטות. עוֹלָם. תרופה. מַשׁאָב. 8, 44 (2021).
Yang, J. et al. מבוא למאגרי מידע רפואיים וטכנולוגיות כריית נתונים בעידן הביג דאטה. ג '. רפואה בסיסית. 13, 57–69 (2020).
Shen, S. et al. השיטה של קמרר להערכת גיל השן באמצעות למידת מכונה. BMC בריאות הפה 21, 641 (2021).
Galliburg A. et al. השוואה בין שיטות למידת מכונות שונות לחיזוי גיל שיניים בשיטת הבימוי Demirdjian. בינלאומי. ג '. רפואה משפטית. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. ו- Tanner, JM מערכת חדשה להערכת גיל השיניים. נְחִירָה. ביולוגיה. 45, 211–227 (1973).
מדדי Landis, Jr ו- Koch, GG של הסכמת Observer על נתונים קטגוריים. ביומטריה 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK ו- Choi HK. ניתוח מרקם, מורפולוגי וסטטיסטי של הדמיית תהודה מגנטית דו ממדית בטכניקות בינה מלאכותית לבידול בגידולים במוח ראשוני. מידע בריאותי. מַשׁאָב. https://doi.org/10.4258/hir.2022.28.1.46 (2022).

זמן ההודעה: ינואר -04-2024

אימות מודל כריית נתונים כנגד שיטות הערכת גיל שיניים מסורתיות בקרב מתבגרים קוריאנים ומבוגרים צעירים