پیام خود را بنویسید


جلد 19، شماره 1 - ( مجله علمی بیماری های پستان ایران 1405 )                   جلد 19 شماره 1 صفحات 76-64 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Khademi M, Khodabakhsh P, Heidarpoor Z, Paktinat S, Atashi A. Prediction of Breast Cancer Metastasis Using Tree-Based Machine Learning Models: A Retrospective Analysis of Iranian Women. ijbd 2027; 19 (1) :64-76
URL: http://ijbd.ir/article-1-1191-fa.html
خادمی مریم، خدابخش پونه، حیدرپور زیبا، پاک طینت صهبا، آتشی علیرضا. پیش‌بینی متاستاز سرطان پستان با استفاده از مدل‌های یادگیری ماشین مبتنی بر درخت: یک تحلیل گذشته‌نگر در میان زنان ایرانی. بیماری‌های پستان ایران. 1405; 19 (1) :64-76

URL: http://ijbd.ir/article-1-1191-fa.html


1- گروه ریاضی کاربردی، دانشگاه آزاد اسلامی واحد تهران جنوب، تهران، ایران ، maryam_khademi@iau.ac.ir
2- گروه مهندسی فناوری اطلاعات و کامپیوتر، دانشگاه آزاد اسلامی واحد تهران جنوب، تهران، ایران
3- دکترای پزشکی، دانشگاه آزاد اسلامی واحد پزشکی تهران، تهران، ایران
4- گروه انفورماتیک پزشکی، مرکز تحقیقات سرطان پستان، پژوهشگاه ملی سرطان، جهاد دانشگاهی (ACECR)، تهران، ایران و گروه هوش‌مصنوعی، دانشکده فناوری‌های نوین در پزشکی، دانشگاه علوم پزشکی تهران، تهران، ایران
چکیده:   (75 مشاهده)

مقدمه: متاستاز سرطان پستان یکی از علل اصلی مرگ‌ومیر ناشی از سرطان است. پیش‌بینی دقیق پیشرفت متاستاتیک برای تصمیم‌گیری بالینی ضروری است. هدف این مطالعه، توسعه و اعتبارسنجی مدل‌های یادگیری ماشین مبتنی بر درخت برای پیش‌بینی متاستاز سرطان پستان در زنان ایرانی با استفاده از داده‌های بالینی واقعی دارای میزان بالای داده‌های مفقود بوده است.
روش بررسی: این مطالعه‌ی گذشته‌نگر شامل سوابق بالینی ۸٬۱۴۸ بیمار مبتلا به سرطان پستان بود که بین سال‌های ۱۹۹۷ تا ۲۰۲۰ در تهران تحت درمان قرار گرفتند. پس از حذف متغیرهایی که بیش از ۵۰% داده‌ی مفقود داشتند و رکوردهای مرتبط با آنها، ۴٬۳۱۰ نمونه‌ی کامل باقیماند (برای مثال، اندازه‌ی تومور دارای 4/94% داده‌ی مفقود بود.) سه مدل درخت تصمیم، جنگل تصادفی و XGBoost (با قابلیت ذاتی در برخورد با داده‌های ناقص) با دو الگوریتم مرجع K-NN و Naïve Bayes، با استفاده از اعتبارسنجی متقابل ده‌تایی مقایسه شدند. عملکرد مدل‌ها با شاخص‌های AUC، حساسیت، ویژگی و امتیاز F1 ارزیابی شد.
یافته‌ها: مدل‌های مبتنی بر درخت عملکرد بهتری نسبت به روش‌های سنتی داشتند؛ XGBoost بالاترین تمایز را نشان داد (AUC=0.96، دقت=99.4F1=0.96) و درخت تصمیم بیشترین قابلیت تفسیر بالینی را ارائه داد (حساسیت =94%، ویژگی=96.9%). علیرغم حذف متغیرهای کلیدی مانند اندازه‌ی تومور و وضعیت HER2، متغیرهای باقی‌مانده مانند گیرنده‌های هورمونی و سن شروع قاعدگی توانستند پیش‌بینی‌های دقیقی ارائه دهند. الگوریتم K-NN از نظر بالینی عملکرد ضعیفی داشت (حساسیت=%6) در حالی‌که Naïve Bayes ناپایداری نسبی نشان داد (حساسیت=89.01).
نتیجه‌گیری: مدل‌های درخت تصمیم و تجمیع‌شده‌ی آن‌ها می‌توانند به‌طور قابل‌اعتمادی متاستاز را در داده‌های واقعی ناقص پیش‌بینی کنند و از این رو برای محیط‌های با منابع محدود گزینه‌های مناسبی بهشمار می‌روند. پژوهش‌های آینده باید بر استانداردسازی جمع‌آوری داده‌ها و توسعه‌ی رویکردهای ترکیبی جایگزینی داده‌های مفقود تمرکز داشتهباشند. این مطالعه بر اهمیت استفاده از مدل‌های یادگیری ماشین قابل‌تفسیر در کاربردهای انکولوژی، به‌ویژه در جمعیت‌های کمتر مورد مطالعه، تأکید دارد.

متن کامل [PDF 683 kb]   (27 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: انفورماتیک پزشکی
دریافت: 1404/3/15 | پذیرش: 1404/7/16 | انتشار: 1405/1/5

فهرست منابع
2. [13] Suyal M, Goyal P. A review on analysis of k-nearest neighbor classification machine learning algorithms based on supervised learning. International Journal of Engineering Trends and Technology. 2022; 70(7):43-8. doi:10.14445/22315381/IJETT-V70I7P205 [DOI:10.14445/22315381/IJETT-V70I7P205]
3. [14] Bafjaish S. S., Comparative analysis of Naive Bayesian techniques in health-related for classification task. Journal of Soft Computing and Data Mining. 2020;1(2):1-10. doi:10.30880/jscdm.2020.01.02.001
4. [15] Bell ML, Floden L, Rabe BA, Hudgens S, Dhillon HM, Bray VJ, et al. Analytical approaches and estimands to take account of missing patient-reported data in longitudinal studies. Patient Relat Outcome Meas. 2019;10:129-40. doi: 10.2147/PROM.S178963. [DOI:10.2147/PROM.S178963] [PMID] []
5. [16] Arafat HM, Omar J, Muhamad R, Al-Astani TAD, Shafii N, Al Laham NA, et al. Breast Cancer Risk From Modifiable and Non-Modifiable Risk Factors among Palestinian Women: A Systematic Review and Meta-Analysis. Asian Pac J Cancer Prev. 2021;22(7):1987-95. doi: 10.31557/APJCP.2021.22.7.1987. [DOI:10.31557/APJCP.2021.22.7.1987] [PMID] []
6. [17] Youn HJ, Han W. A Review of the Epidemiology of Breast Cancer in Asia: Focus on Risk Factors. Asian Pac J Cancer Prev. 2020;21(4):867-80. doi: 10.31557/APJCP.2020.21.4.867. [DOI:10.31557/APJCP.2020.21.4.867] [PMID] []
7. [18] Ho PJ, Lau HSH, Ho WK, Wong FY, Yang Q, Tan KW, et al. Incidence of breast cancer attributable to breast density, modifiable and non-modifiable breast cancer risk factors in Singapore. Sci Rep. 2020;10(1):503. doi: 10.1038/s41598-019-57341-7. [DOI:10.1038/s41598-019-57341-7] [PMID] []
8. [19] Daly AA, Rolph R, Cutress RI, Copson ER. A Review of Modifiable Risk Factors in Young Women for the Prevention of Breast Cancer. Breast Cancer (Dove Med Press). 2021;13:241-57. doi: 10.2147/BCTT.S268401. [DOI:10.2147/BCTT.S268401] [PMID] []
9. [20] Dadziak M, Olko P, Zapala M A, Hunek A, Chmielarz K, Wiśiewska-Skomra J, et al. The non-modifiable risk factors for breast cancer development in women. Journal of Education, Health and Sport. Online. 2023.;25(1): 134-46. doi: 10.12775/JEHS.2023.25.01.012. [DOI:10.12775/JEHS.2023.25.01.012]
10. [21] Vishwakarma G, Mehta A, Saifi M, Garg D, Paliwal D. Modifiable (Sleeping Pattern and Stress) and Non-Modifiable Risk Factors Associated with Breast Cancer: A Matched Case-Control Study in Delhi, India. Asian Pac J Cancer Prev. 2022;23(7):2469-76. doi: 10.31557/APJCP.2022.23.7.2469. [DOI:10.31557/APJCP.2022.23.7.2469] [PMID] []
11. [22] Bastos D. R. d. Risk factors related to breast cancer development. Mastology. 2019;29(4):218-23. doi:10.29289/2594539420190000461 [DOI:10.29289/2594539420190000461]
12. [23] Yazdani A, Dorri S, Atashi A, Shirafkan H, Zabolinezhad H. Bone Metastasis Prognostic Factors in Breast Cancer. Breast Cancer (Auckl). 2019;13:1178223419830978. doi: 10.1177/1178223419830978. [DOI:10.1177/1178223419830978] [PMID] []
13. [24]Tapak L, Shirmohammadi-khoram N, Amini P, Poorolajal J. P. Prediction of survival and metastasis in breast cancer patients using machine learning classifiers. Clinical Epidemiology and Global Health. 2019;7(3):293-9. [DOI:10.1016/j.cegh.2018.10.003]
14. [25]Razavi M, Wang L, Karssemeijer N, Linsen L, Frese U, Hahn H. et al, Novel Morphological Features for Non-mass-like Breast Lesion Classification on DCE-MRI. Lecture Notes in Computer Science. 2016:305-12. doi:10.1007/978-3-319-47157-0_37. [DOI:10.1007/978-3-319-47157-0_37]
15. [26]Jakkanwar B. S. Review on Multiple Cancer Disease Prediction And Identification using Machine Learning Techniques. International Journal for Research in Applied Science and Engineering Technology. 2023;11(6):1333-7. doi:10.22214/ijraset.2023.53112 [DOI:10.22214/ijraset.2023.53112]
16. [27] Mao L, Wang H, Hu LS, Tran NL, Canoll PD, Swanson KR, Li J. Knowledge-Informed Machine Learning for Cancer Diagnosis and Prognosis: A Review. IEEE Trans Autom Sci Eng. 2025;22:10008-28. doi:10.1109/tase.2024.3515839. [DOI:10.1109/TASE.2024.3515839] [PMID] []

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

تمامی حقوق نرم‌افزاری اين وب سایت متعلق به مجله علمی بیماری‌های پستان ایران می‌باشد.

طراحی و برنامه نویسی: یکتاوب افزار شرق

© 2026 CC BY-NC 4.0 | Iranian Journal of Breast Diseases

Designed & Developed by: Yektaweb