مقدمه: سرطان پستان ، شایعترین سرطان و دومین علت مرگومیر ناشی از سرطان در زنان است و بهدلیل تکثیر غیرقابلکنترل سلولهای بافت پستان رخ میدهد. بررسی بیان ژن در این سرطان، اطلاعات ارزشمندی درباره رفتار و پیشرفت بیماری ارائه میدهد و با استفاده از دادههای میکروآرایه DNA، محققان میتوانند الگوهای خاص ژنی را شناسایی کنند که به تشخیص دقیقتر و بهبود درمان کمک میکند. با این حال، حجم بالای دادههای میکروآرایه چالشهای پیچیدهای را برای الگوریتمهای یادگیری ماشین به همراه دارد. برای رفع این مشکل، از روش انتخاب ویژگی برای کاهش ابعاد دادهها استفاده میشود که علاوه بر افزایش دقت، زمان پردازش را نیز کاهش میدهد و در تشخیص و طبقهبندی مؤثرتر سرطان مفید است.
روش بررسی: در این تحقیق، هدف انتخاب ژنهای مرتبط با سرطان پستان در دادههای میکروآرایهای است که حاوی اطلاعات بسیار پیچیدهای از بیان ژنها هستند. برای بهبود دقت و کارایی طبقهبندی این دادهها، از یک رویکرد ترکیبی استفاده شده است که ترکیب دو روش انتخاب ویژگی فیلتر و لفاف را با الگوریتم ساخت اهرام جیزه چندهدفه (FWGPC) و یادگیری عمیق بهکار میگیرد.
یافتهها: نتایج تجربی نشان میدهد که این روش بر روی مجموعه دادههای مختلف (BC-TCGA، GSE) به ترتیب دقتی برابر با 99.96 % و 96.1% را بهدست آورده و از بسیاری از روشهای طبقهبندی دیگر در تشخیص نمونههای جدید سرطان پستان عملکرد بهتری دارد.
نتیجه گیری: در این رویکرد، جمعیت اولیه الگوریتم GPC به دو گروه تقسیم میشود: یکی براساس تابع تناسب مبتنی بر روش فیلتر و دیگری براساس تابع تناسب مبتنی بر روش لفاف. هر بخش ویژگیهای خود را براساس معیارهای خاص ارزیابی میکند و در نهایت، یک مسابقه بین بهترین نتایج دو بخش برگزار میشود. یادگیری عمیق با بررسی دقت طبقهبندی، برنده نهایی را اعلام میکند که بهترین دقت را در طبقهبندی دادههای جدید سرطان پستان دارد.
بازنشر اطلاعات | |
![]() |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |