<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Iranian Journal of Breast Diseases</title>
<title_fa>بیماری‌های پستان ایران</title_fa>
<short_title>ijbd</short_title>
<subject>Medical Sciences</subject>
<web_url>http://ijbd.ir</web_url>
<journal_hbi_system_id>0</journal_hbi_system_id>
<journal_hbi_system_user>user</journal_hbi_system_user>
<journal_id_issn>1735-9406</journal_id_issn>
<journal_id_issn_online>2645-7482</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/ijbd</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1405</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2027</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<volume>19</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>en</language>
	<article_id_doi></article_id_doi>
	<title_fa>پیش‌بینی متاستاز سرطان پستان با استفاده از مدل‌های یادگیری ماشین مبتنی بر درخت: یک تحلیل گذشته‌نگر در میان زنان ایرانی</title_fa>
	<title>Prediction of Breast Cancer Metastasis Using Tree-Based Machine Learning Models: A Retrospective Analysis of Iranian Women</title>
	<subject_fa>انفورماتیک پزشکی</subject_fa>
	<subject>Health informatics</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p data-end=&quot;239&quot; data-start=&quot;19&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size:16px;&quot;&gt;&lt;span style=&quot;font-family:nasimYW;&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;مقدمه: &lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;متاستاز سرطان پستان یکی از علل اصلی مرگ&#8204;ومیر ناشی از سرطان است. پیش&#8204;بینی دقیق پیشرفت متاستاتیک برای تصمیم&#8204;گیری بالینی ضروری است. هدف این مطالعه، توسعه و اعتبارسنجی مدل&#8204;های یادگیری ماشین مبتنی بر درخت برای پیش&#8204;بینی متاستاز سرطان پستان در زنان ایرانی با استفاده از داده&#8204;های بالینی واقعی دارای میزان بالای داده&#8204;های مفقود بوده است.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;روش بررسی:&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot;&gt; این مطالعه&#8204;ی گذشته&#8204;نگر شامل سوابق بالینی ۸&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;٬&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;۱۴۸ بیمار مبتلا به سرطان پستان بود که بین سال&#8204;های ۱۹۹۷ تا ۲۰۲۰ در تهران تحت درمان قرار گرفتند. پس از حذف متغیرهایی که بیش از ۵۰% داده&#8204;ی مفقود داشتند و رکوردهای مرتبط با آنها، ۴&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;٬&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;۳۱۰ نمونه&#8204;ی کامل باقی&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&#8204;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;ماند (برای مثال، اندازه&#8204;ی تومور دارای 4/94% داده&#8204;ی مفقود بود.)&lt;/span&gt; &lt;span lang=&quot;AR-SA&quot;&gt;سه مدل درخت تصمیم، جنگل تصادفی و &lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;NL&quot;&gt;XGBoost&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt; (با قابلیت ذاتی در برخورد با داده&#8204;های ناقص) با دو الگوریتم مرجع &lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;DE&quot;&gt;K-NN&lt;/span&gt; &lt;span lang=&quot;AR-SA&quot;&gt;و &lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;Na&amp;iuml;ve Bayes&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;، با استفاده از اعتبارسنجی متقابل ده&#8204;تایی مقایسه شدند. عملکرد مدل&#8204;ها با شاخص&#8204;های &lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;DE&quot;&gt;AUC&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;، حساسیت، ویژگی و امتیاز &lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;RU&quot;&gt;F1&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt; ارزیابی شد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;یافته&#8204;ها:&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot;&gt; مدل&#8204;های مبتنی بر درخت عملکرد بهتری نسبت به روش&#8204;های سنتی داشتند؛ &lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;NL&quot;&gt;XGBoost&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt; بالاترین تمایز را نشان داد (&lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;DE&quot;&gt;AUC=0.96&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;، دقت&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;=99.4&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;%،&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;F1=0.96&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;) و درخت تصمیم بیشترین قابلیت تفسیر بالینی را ارائه داد (حساسیت &lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;=94&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;%، ویژگی&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;=96.9&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;%). علی&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&#8204;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;رغم حذف متغیرهای کلیدی مانند اندازه&#8204;ی تومور و وضعیت &lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;DE&quot;&gt;HER2&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;، متغیرهای باقی&#8204;مانده مانند گیرنده&#8204;های هورمونی و سن شروع قاعدگی توانستند پیش&#8204;بینی&#8204;های دقیقی ارائه دهند. الگوریتم &lt;/span&gt;&lt;span dir=&quot;LTR&quot; lang=&quot;DE&quot;&gt;K-NN &lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;از نظر بالینی عملکرد ضعیفی داشت (حساسیت=%6)&lt;/span&gt; &lt;span lang=&quot;AR-SA&quot;&gt;در حالی&#8204;که &lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;Na&amp;iuml;ve Bayes&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt; ناپایداری نسبی نشان داد (حساسیت=&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;89.01&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;)&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;.&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;font-family:&quot;B Nazanin&quot;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;نتیجه&#8204;گیری:&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot;&gt; مدل&#8204;های درخت تصمیم و تجمیع&#8204;شده&#8204;ی آن&#8204;ها می&#8204;توانند به&#8204;طور قابل&#8204;اعتمادی متاستاز را در داده&#8204;های واقعی ناقص پیش&#8204;بینی کنند و از این رو برای محیط&#8204;های با منابع محدود گزینه&#8204;های مناسبی به&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&#8204;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;شمار می&#8204;روند. پژوهش&#8204;های آینده باید بر استانداردسازی جمع&#8204;آوری داده&#8204;ها و توسعه&#8204;ی رویکردهای ترکیبی جایگزینی داده&#8204;های مفقود تمرکز داشته&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&#8204;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;باشند. این مطالعه بر اهمیت استفاده از مدل&#8204;های یادگیری ماشین قابل&#8204;تفسیر در کاربردهای انکولوژی، به&#8204;ویژه در جمعیت&#8204;های کمتر مورد مطالعه، تأکید دارد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;</abstract_fa>
	<abstract>&lt;p style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size:14px;&quot;&gt;&lt;span style=&quot;font-family:Times New Roman;&quot;&gt;&lt;b&gt;Introduction: &lt;/b&gt;Breast cancer metastasis is a major cause of cancer-related death. Accurate prediction helps doctors make better decisions. This study developed and evaluated tree-based machine learning models to predict metastasis in Iranian women, using real clinical data with substantial missing values.&lt;br&gt;
&lt;b&gt;Methods: &lt;/b&gt;They looked at clinical records of 8,148 breast cancer patients in Tehran from 1997 to 2020. Variables with over 50% missing data were removed, leaving 4,310 complete cases. They compared Decision Tree, Random Forest, and XGBoost (which handles missing data well) against K-NN and Na&amp;iuml;ve Bayes (which need data imputation). They used stratified 10-fold cross-validation to check for overfitting and class imbalance, and then tested the best models on a separate hold-out set. Performance was measured using AUC, sensitivity, specificity, accuracy, and F1 score.&lt;br&gt;
&lt;b&gt;Results: &lt;/b&gt;Tree-based models worked better than the others. XGBoost had the best discrimination (AUC = 0.96, accuracy = 99.4%, F1 = 0.96), and Decision Trees were highly interpretable (sensitivity = 94%, specificity = 96.9%). Even though key predictors such as tumor size were excluded, other variables, such as hormone receptor status and age at menarche, allowed for strong predictions. K-NN had very low sensitivity (6%), and Na&amp;iuml;ve Bayes was inconsistent.&lt;br&gt;
&lt;b&gt;Conclusion: &lt;/b&gt;Decision trees and similar models can reliably predict breast cancer metastasis using incomplete, imbalanced real-world data, provided they are properly validated. These models are good for places with fewer resources. Future work should focus on better data collection and imputation methods. This study demonstrates the utility of interpretable machine learning for cancer applications in underrepresented populations.&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;</abstract>
	<keyword_fa>سرطان پستان, متاستاز, یادگیری ماشین, درخت تصمیم, XGBoost, ایران</keyword_fa>
	<keyword>Breast Cancer, Metastasis, Machine Learning, Decision Trees, XGBoost, Iran</keyword>
	<start_page>64</start_page>
	<end_page>76</end_page>
	<web_url>http://ijbd.ir/browse.php?a_code=A-10-1884-1&amp;slc_lang=en&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Maryam</first_name>
	<middle_name></middle_name>
	<last_name>Khademi</last_name>
	<suffix></suffix>
	<first_name_fa>مریم</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>خادمی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>maryam_khademi@iau.ac.ir</email>
	<code>000319475328460013731</code>
	<orcid>000319475328460013731</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Department of Applied Mathematics, Islamic Azad University South Tehran Branch, Tehran, Iran</affiliation>
	<affiliation_fa>گروه ریاضی کاربردی، دانشگاه آزاد اسلامی واحد تهران جنوب، تهران، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Pooneh</first_name>
	<middle_name></middle_name>
	<last_name>Khodabakhsh</last_name>
	<suffix></suffix>
	<first_name_fa>پونه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>خدابخش</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>St_p_khodabakhsh@azad.ac.ir</email>
	<code>000319475328460013732</code>
	<orcid>000319475328460013732</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of IT and Computer Engineering, Islamic Azad University South Tehran Branch, Tehran, Iran</affiliation>
	<affiliation_fa>گروه مهندسی فناوری اطلاعات و کامپیوتر، دانشگاه آزاد اسلامی واحد تهران جنوب، تهران، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>ziba</first_name>
	<middle_name></middle_name>
	<last_name>Heidarpoor</last_name>
	<suffix></suffix>
	<first_name_fa>زیبا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>حیدرپور</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>heydarpoor_shooka@yahoo.com</email>
	<code>000319475328460013733</code>
	<orcid>0009-0003-5894-1823</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Doctor of Medicine (MD), Islamic Azad University, Tehran Medical Branch, Tehran, Iran</affiliation>
	<affiliation_fa>دکترای پزشکی، دانشگاه آزاد اسلامی واحد پزشکی تهران، تهران، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Sahba</first_name>
	<middle_name></middle_name>
	<last_name>Paktinat</last_name>
	<suffix></suffix>
	<first_name_fa>صهبا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پاک طینت</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>sahbap67@gmail.com</email>
	<code>000319475328460013734</code>
	<orcid>000319475328460013734</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of IT and Computer Engineering, Islamic Azad University South Tehran Branch, Tehran, Iran</affiliation>
	<affiliation_fa>گروه مهندسی فناوری اطلاعات و کامپیوتر، دانشگاه آزاد اسلامی واحد تهران جنوب، تهران، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Alireza</first_name>
	<middle_name></middle_name>
	<last_name>Atashi</last_name>
	<suffix></suffix>
	<first_name_fa>علیرضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>آتشی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>Aratashi@sina.tums.ac.ir</email>
	<code>000319475328460013735</code>
	<orcid>000319475328460013735</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Medical Informatics Department, Breast Cancer Research Center, Iranian National Cancer Institute, ACECR, Tehran, Iran</affiliation>
	<affiliation_fa>گروه انفورماتیک پزشکی، مرکز تحقیقات سرطان پستان، پژوهشگاه ملی سرطان، جهاد دانشگاهی (ACECR)، تهران، ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
