نشريه تخصصي مهندسي صنايع، دوره 50، شماره 1، بهار و تابستان 1395، از صفحه 109تا 119

پيش بيني بروز حملة حاد قلبي با استفاده از رگرسيون لجستيك
(مطالعة موردي: بيمارستاني در ايران)

آرزو نشاطي تنها1، پريا سليماني2 *
كارشناس ارشد دانشكدة مهندسي صنايع، دانشگاه آزاد اسلامي واحد تهران جنوب
استاديار دانشكدة مهندسي صنايع، دانشگاه آزاد اسلامي واحد تهران جنوب

(تاريخ دريافت 05/02/94 ـ تاريخ دريافت روايت اصلاحشده 08/06/94 ـ تاريخ تصويب 25/11/94) چكيده
سكتة قلبي اولين عامل مرگ ومير در ايران است كه بيش از نيمي از بيماران آن قبل از رسيدن به بيمارستان ميميرند. برخي از حمـلات قلبـيناگهاني و شديدند، اما بيشتر آنها به آهستگي آغاز مي شوند و با درد يا ناراحتي خفيفي همراه هستند. تشخيص زودرس اين علائـم در بيمـارانبراي نجات و درمان موفقيتآميز آنان حياتي است و اين امر اهميت، نياز، ضرورت و سودمندي طراحي سيستمهايي را بـراي يـاريرسـاندن بـهپزشك در تشخيص زودهنگام بروز حملات حاد قلبي بيش از پيش مشخص مي كند. هدف اصـلي ايـن پـژوهش طراحـي و سـاخت يـك مـدلپيش بيني بروز حملة حاد قلبي در ايران، براساس فاكتورهاي باليني قابل گزارش توسط بيمـار در خـارج از بيمارسـتان اسـت؛ يعنـي زمـانيكـهاطلاعات آزمايش هاي تشخيصي و معاينات پزشكي در دسترس نيستند. اين مدل براي كاهش متوسط زمان از شروع علائم هشداردهندة سـكتة قلبي تا آغاز درمان قابل استفاده است. به اين منظور، داده هاي مربوط به 711 بيمار قلبي جمـع آوري شـد و سـه مـدل بـا اسـتفاده از رگرسـيونلجستيك و يك مدل با استفاده از درخت تصميم براي پيش بيني احتمال بروز حملة حاد قلبي ساخته شد. بهترين مدل رگرسيون لجسـتيك ازلحاظ عملكرد داراي آمارة C، 955/0 و دقت 9/94 درصد بود و متغيرهاي درد شديد قفسة سينه، درد پشت، تعريق سرد، تنگـي نفـس، حالـتتهوع و استفراغ به عنوان شاخص هاي اصلي و مؤثر در بروز حملة حاد قلبـي شناسـايي شـدند و در مـدل درخـت تصـميم بـا آمـارةC ، 938/0 متغيرهاي مستقل تنگي نفس، تپش قلب، ورم اندام ها، تعريق سرد، درد سمت چپ قفسة سينه، درد شديد قفسة سينه، سن و حالت تهوع قادر به پيشبيني تغييرات متغير وابسته (احتمال بروز حملة حاد قلبي) بودند.

واژه هاي كليدي: بيماري عروق كرونري قلب، پيشبيني، حملة حاد قلبي، درخت تصميم، رگرسيون لجستيك.

مقدمه
بيماري هاي قلبي- عروقي درحال حاضر جزء سه علـت اول مرگ ومير و ناتواني انسان در سراسر دنيا هستند و در آينده به اصلي ترين عامل مرگ ومير يا نـاتواني در اغلـب كشـورها تبديل مي شوند. هر سال نزديك به 32 ميليون مورد سـكت ة قلبي و مغزي در دنيا رخ مي دهد كه موجب مـرگ بـيش از17 ميليون نفر مي شود. 60 درصـد از مـرگ وميـر در سـال

Email: [email protected] 0217763845 :نويسندة مسئول: تلفن: 02177638853 فكس *
2000 در جهان بهعل ت بيماري هاي غيرواگير بـوده اسـت و برآورد مي شود اين ميزان تا سال 2020 به 73 درصد برسد. سهم بيماري هاي قلبي- عروقي از ايـن ميـزان بـيش از 48 درصد است، به طوري كـه بـيش از 20 ميليـون مـورد از 64 ميليون مرگ در سال 2015 به بيماري هاي قلبـي – عروقـي مربوط است و درصورتي كه اقدامات مؤثر انجام نگيرد، موارد مرگ ناشي از بيمـاري هـاي مـزمن از سـال هـاي 2005 تـا2015 حدود 17 درصد افـزايش مـي يابـد و از 35 ميليـون مرگ به 41 ميليون مرگ مي رسد [1]. در سال هـاي اخيـر ، به علت اقدامات پيشگيرانه و مداخلات مؤثر، روند مرگ هـاي ناشــي از بيمــاري هــاي قلبــي- عروقــي در كشــورهاي توسعه يافته رو به كاهش بوده است، درحالي كه ايـن مـوارددر كشورهاي درحال توسعه همچنان سير صعودي دارد.
توسعة اقتصادي و صنعتي و گسترش ارتباطات موجـب ماشيني شدن زندگي و به دنبال آن سبب تغييراتي در شـيو ة آن و افزايش بروز بيماري هاي قلبي- عروقي (بيمـاري هـايعروق كرونر قلب) شده است. اين تغييـرات شـامل مصـرف دخانيات، كم تحركي و رژيم غذايي ناسالم است.
هدف پژوهش پيش رو بررسي اين مسئله است كه يـكمدل ساخته شده با استفاده از روش هاي كلاسيك رگرسيون لجستيك و درخت تصميم، چگونه به خوبي و بدون استفاده از تست هاي تشخيصي و يافته هاي معاينات فيزيكي و فقـطبراساس فاكتورهاي تاريخچـ ة بـاليني قابـل گـزارش توسـطبيمار، بروز حملة قلبي را پيشبيني مي كند.
به ايـن منظـور، داده هـاي مربـوط بـه 711 بيمـار قلبـيجمع آوري شد. بعد از شناسايي و حذف نقاط پرت و پرنفوذ، تعداد نهايي نمونه ها به 663 بيمار با ميانگين سـني 29/63 سال (انحراف معيار 37/14) رسيد. براساس مرور ادبيـات ومشورت با پزشكان متخصـص قلـب و عـروق، 28 مشخصـةمربوط به فاكتورهاي باليني قابلگزارش توسط بيمار بررسي شد. سپس سه مدل رگرسيون لجستيك و يك مدل درخت تصميم براي پيش بيني احتمال بروز حملة حاد قلبـي فقـطبراساس مشخصه هـاي بـاليني قابـل گـزارش توسـط بيمـارساخته شد. عوامل خطر پيش بيني شده در بروز حملات حاد قلبي در مدل هاي طراحي شـده در ايـن پـژوهش، براسـاسعوامل بسيار مهم خطر از نظـر پزشـكان متخصـص قلـب وعروق در وقوع اين عارضـه تأييـد شـد كـه ايـن موضـوع ازدستاوردهاي مهم پژوهش حاضر است و ميزان اطمينان بـهاين مدلها را افزايش ميدهد.
در ايران، تاكنون پيش بيني احتمـال بـروز حملـة حـادقلبي با استفاده از مشخصه هاي باليني قابل گـزارش توسـطبيمار و بدون انجام دادن معاينـات فيزيكـي و آزمـايش هـايتشخيصي در خارج از بيمارسـتان صـورت نگرفتـه اسـت ومحققان توجه چنداني به آن نداشته اند؛ بنابراين، اين مـدلبه خوبي موضوع مذبور را پيشبيني مي كند و در برنامه هـايكــاربردي خــارج از بيمارســتان- كــه هنــوز اطلاعــاتآزمايش هاي تشخيصي در دسترس نيستند- بـراي مشـاورةدقيق به بيمار بسيار مفيد است. با توجه به ميزان مرگومير بسيار زياد ناشي از سكتة قلبـي در كشـور ، حتـي كمتـرينتأثير بر كاهش متوسط زمان از شروع علائم تـا درمـان ، بـهنجات جان تعداد زيادي از مردم منجر ميشود.
درادامه، مطالعات گذشته مـرور مـي شـود و مـدل هـايپيشنهادي ارائه مي شود. سپس مقايسـة مـدل هـا و تحليـلنتايج صورت ميگيرد. درنهايت، نتيجه بيان مي شود.
تخصصيصنايع،شمارهتابستانمرور ادبيات موضوع
رگرسيون لجستيك يكـي از تكنيـك هـاي كـاربردي بـرايتحليل داده هاي طبقه بندي شده است. رگرسيون لجسـتيكدر اواخر دهة 1960 و اوايل دهـة 1970 بـه عنـوان بـديليب راي روش رگرس يون خط ي1 و همچن ين تحلي ل ت ابع تشخيصي2 مطرح شد. زمـاني كـه متغيـر وابسـته در سـطحاسمي است و متغيرهاي مستقل (پيش بين) هـم ترتيبـي وفاصله اي هسـتند، روش هـاي رگرسـيون خطـي معمـولي وتحليل تشخيصي، مقدار برآوردها را كمتـر از مقـدار واقعـينشان مي دهند.
رگرسيون لجستيك شبيه رگرسيون خطي است با ايـنتفاوت كه نحوة محاسـبة ضـرايب در ايـن دو روش يكسـاننيست؛ يعني رگرسيون لجسـتيك بـه جـاي حـداقل كـردنمجذور خطاها (OLS)3 (كاري كه رگرسـيون خطـي انجـاممي دهد)، احتمال وقـوع يـك واقعـه را حـداكثر مـيكنـد ودرواقع از خاصيت حـداكثر درسـتنمايي (MLE)4 اسـتفادهمي كند. همچنين، در تحليل رگرسيون خطي بـراي آزمـونبرازش مدل و معني داربودن اثر هر متغير در مدل، به ترتيب از آماره هاي F و t استفاده مي شود، درحالي كه در رگرسيون لجستيك، از آماره هـاي كـاي اسـكوئر (2χ) و والـد (wald) استفاده مي شود. در رگرسيون لجستيك، احتمال وقوع يك پديده در داخل محدودة صـفر تـا يـك قـرار دارد و رعايـتپيش فرض نرمال بودن متغيرهاي مستقل لازم نيست. يكـياز اقسام رگرسـيون لجسـتيك، مـدل رگرسـيون لجسـتيكباينري است كه در اين مدل دو طبقـه بنـدي بـراي متغيـر پاسخ وجود دارد. اگر بيش از دو طبقه بنـدي وجـود داشـتهباشد، با توجه به جنس متغيـر وابسـته (اسـمي و ترتيبـي)مدل هـاي رگرسـيون لجسـتيك اسـمي و ترتيبـي حاصـلمي شود [20].
در ابتـدا ، ايـن روش بـه طور عمـده درمـورد كاربردهـاي پزشكي براي احتمال وقوع يك بيماري استفاده مي شد، امـاامروزه در تمام زمينه هاي علمي كاربرد وسيعي يافته اسـت . هري پي سلكر و همكاران در سال 1995 مقايسه اي را بين عملكرد مدل هاي پيش بيني رگرسـيون لجسـتيك، درخـتتصميم و شبكة عصبي براي تشخيص بيماري ايسكمي حاد قلبي در بين بيماران بخش اورژانس با استفاده از داده هـايباليني آن ها انجام دادند. از نظر آن ها، ممكن بود همـة ايـن
بروزرگرسيون
روش ها پـيش بينـي هـاي بسـيار خـوبي دربـارة پيامـدهاي پزشــكي بــراي كمــك بــه تصــميمگيــري پزشــكان وسياست گذاري در اين زمينه انجام دهند، ولي انتخاب بـيناين روش ها بايد براساس نيازهاي كاربرد خـاص مـورد نظـرصورت مي گرفت، نه فـرض قـوي تربـودن يكـي نسـبت بـهديگري [2].
وانــگ و همكــاران در ســال 2001 در پــژوهش خــود مقايسه اي بين عملكـرد مـدل هـاي رگرسـيون لجسـتيك وشبكة عصبي مصنوعي براي پيش بيني احتمال بـروز سـكتةقلبي در بيماران براساس فاكتورهـاي بـاليني قابـل گـزارشتوسط بيمار (30 مشخصه) انجام دادند. آن ها نتيجه گرفتند هر دو مدل منتخب رگرسـيون لجسـتيك و شـبكة عصـبيمصنوعي عملكرد خوبي داشتند و تفاوت آمـاري معنـاداريبين آن ها وجود نداشت. براي ساخت مـدل هـاي رگرسـيونلجستيك و شـبكة عصـبي از روشهـاي مختلفـي اسـتفادهكردند كه هركدام ده بار به صـورت تصـادفي تكـرار شـدند ومقايسة عملكرد مدل هـا را بـا اسـتفاده از شـاخص آمـارةc (ســطح زيــر نمــودارROC ) انجــام دادنــد. بــه منظــور اعتبارسنجي، مدل ها را پس از ساخت با استفاده از مجموعة داده هاي بهدست آمده از بيماران مراجعه كننده به واحـدهاي اورژانس بيمارستان ها آزمايش كردند و نتايج پذيرفتني بود. هدف نهايي اين پژوهش استفادة كاربردي از اين مدل ها در خارج از بيمارستان- زماني كه نتايج آزمايش هاي تشخيصـي بيمـ اران در دسـ ترس نيسـ تند- بـ ه منظـ ور كـــاهش مـرگ وميرهـاي ناشـي از سـكتة قلبـي بـود [3]. كنـدي و همكاران در سال 1996 در پژوهشـي تشـخيص زود هنگـامسكتة حاد قلبي را با استخراج و ارزيابي مدل هاي رگرسيون لجستيك با استفاده از داده هاي باليني و نوار قلب در هنگام مراجعة بيمار بررسـي كردنـد [4]. دو و همكـاران در سـال1997 پژوهشي را با رويكرد توافقي براي تشخيص بيمـاريعروق كرونر قلب براساس داده هـاي بـاليني و تسـت ورزشبيماران ارائه دادند. آن هـا بـا اسـتفاده از تركيـب معـادلاتپيش بيني رگرسيون لجستيك براساس متغيرهاي تستهاي ورزش و بـاليني بـه دسـت آمـده از جوامـع آمـاري مختلـف بيماران، آن ها را به سه گروه كم خطـر، بـا خطـر متوسـط وپرخطر طبقه بندي كردند و توانستند ويژگي هاي تشخيصـيبسيار عالي را با استفاده از داده هاي ساده و اندازه گيري هاي به دست آمده به دست آورند. اين روش توافقي بهترين اجرا را با استفاده از يك ماشين حساب قابل برنامه ريـزي يـا برنامـة كامپيوتري براي تسهيل فرايند محاسـب ة احتمـال بيمـاريعروق كرونر با استفاده از سـه معادلـه داشـت [5]. هنريـكهارالدسـون و همكـاران در سـال 2004 در پـژوهش خـود مدلي را با استفاده از شبكة عصبي مصنوعي براي تشـخي ص خودكار سكتة حاد قلبي در بيماران براساس دوازده اشتقاق نوارهاي قلبي (ECGs) ارائـه دادنـد. روش آن هـا بـه عنـوان سيستم پشتيبان تصميم گيري كه بينشي خوب و مناسب را براي تشخيص پزشك فراهم مـي آورد قابـل اسـتفاده اسـت[6]. هريســون و كنــدي در ســال 2005 بــا اســتفاده ازمدل هاي شبكة عصبي مصنوعي پيش بينـي سـندروم حـادعروق كرونر قلب را با استفاده از داده هـاي بـاليني از زمـانارائه بررسي كردند. اين مطالعه تأييد مـي كنـد شـبكه هـاي عصـبي مصـنوعي مـي تواننـد روش مفيـدي بـراي توسـعة الگوريتم هاي تشخيصي براي بيماران داراي درد قفسة سينه پيشنهاد دهد [14]. بيگلريان و همكاران در سال 2010 بـااستفاده از شبكه هاي عصبي مصنوعي، عوامل قابلپيش بيني سرطان معده را در مبتلايـان تعيـين كردنـد [7]. در سـال2012، آنـوج بـا اسـتفاده از قـوانين فـازي وزندهـي شـده براساس سيستم پشـتيباني تصـميم گيـري بـاليني، ميـزانريسك ابتلا به بيماريهـاي قلبـي را پـيشبينـي كـرد [8]. آتكف و همكاران در سال 2012 پژوهشي را براي تشخيص بيماري عروق كرونري قلب براسـاس پارامترهـاي بـاليني وژنتيكي با استفاده از شبكه هاي عصبي مصنوعي انجام دادند [10]. راجسواري و همكاران در سـال 2012 بـا اسـتفاده ازشبكه هاي عصبي مصـنوعي بـ ه كـاهش شاخصـه هـا بـراي تشــخيص بيمــاري ايســكميك قلــب (IHD)5 پرداختنــد.
بيماري ايسكميك قلب درواقع يك بيماري قلبـي – عروقـياست كه با سرعت نگران كننده اي در سراسر جهـان درحـالافزايش است. درواقع، در اين تحقيق آن ها به دنبـال كـاهش تعداد شاخصههاي مورد بررسي بـراي شناسـايي بيمـار ي IHDبودند كه كاهش شاخصه ها، كـاهش زمـان پزشـكان وبيماران و كاهش هزينه ها را نيز در پي دارد. اهداف پژوهش آن ها عبارت است از: مشاهدة شبكه هـاي عصـبي، بـه ويـژه شبكه هاي عصبي پس انتشار، مطالعه دربارة بي مـاري IHD، شناسايي تركيب هاي مختلف از پارامترهـا يـا ويژگـي هـايي براي تشخيص بيماري IHD. آن ها توانسـتند شاخصـه هـاي ورودي را از هفده به دوازده شاخصه كاهش دهند. با وجـوددوازده شاخصة ورودي، دقت و صحت پيش بينـي در طـول آموزش 4/89 درصد و در آزمايش اين دقت به 2/82 درصد رسيد. با كاهش بيشتر شاخصه ها، دقت مـدل كـاهش پ يـدا كرد. درنتيجه، آن ها دريافتند مناسب تـرين تعـداد شاخصـهب راي تش خيص بيم اري ايس كميك قلب ي هم ان دوازده شاخصه است [9]. صـفدري و همكـاران در سـال 2013 در پـژوهش خ ود يـك م دل را بـا اس تفاده از تكنيـ كه اي داده كاوي براي پيشبيني سكته قلبي طراحي كردنـد [11].
سوچيترا و ماهسواري در سال 2014 پژوهشي را بـا هـدفساخت يك سيستم ويژه (كارآمد) با طبقه بندي كنندة كاملاً خودكار براي تشـخيص وجـود بيمـاري ايسـكمي قلـب بـااستفاده از تكنيكهاي هوش مصنوعي انجام دادند [12].
مدل پيشنهادي داده ها
تحقيق حاضر يـك مطالعـة تشخيصـي اسـت كـه براسـاسمتغيره اي مس تقل، احتمـال ب رو ز حمل ة ح اد قلب ي را پيشگويي مي كند. جامعة آماري بيماراني هسـتند كـه طـيسال هاي 1392 تا 1393 به اورژانس بيمارسـتان تخصصـيقلب و عروق اكباتان همدان مراجعه كردهاند. حجـم جامعـةآماري مورد بررسي 711 بيمار بـود كـه پـس از شناسـاييداده هاي پرت، پروندة اين بيمـاران دوبـاره بررسـي شـد تـامشخص شود داده ها اشتباه وارد شده اند يا خير. بعد از ايـنبررسي بعضي مقادير اصلاح و بقية دادههاي پرت حذف شد. تعداد نهايي نمونه ها به 663 بيمار با ميانگين سـني 29/63 سال (انحراف معيار 37/14) رسيد. داده هـاي بيمـاران هـمشامل داده هاي كمي و هم شامل داده هاي كيفي بود.
تخصصيصنايع،شمارهتابستان
فشارخون،12 چربي خون،13: درد شديد قفسه سـينه، 14 درد سمت چپ قفسة سينه،15 درد سمت راست قفسة سـينه ،1 درد پشت،17 درد دست چپ،18 درد دست راست،19 تعريـقســرد،20 تنگــي نفــس، 21 حالــت تهــوع ،22 اســتفراغ،23 بـ يهوشـي،24 تـپش قلـب،25 درد فـوق المعـدي،26 سـابقة بيماري قلبي،27 ورم اندام ها،28 خواب آلودگي،29 سرگيجه،30 ض عف و ب ـيح الي،31 س رفه،32 اض طراب و دلش وره33 و سردرد34. تمام متغيرها به جز سن، دودويي (باينري) بودنـد(0= عدم وجود، 1= وجود) و بـراي متغيـر جنسـيت بيمـاركدهاي 0= زن و 1= مرد درنظر گرفته شد.
رگرسيون لجستيك
مـدل رگرسـيون لجسـتيك، مـدل خطـي تعمـ يميافتـ هاي محسوب مي شود كه از تابع لوجيـت بـه عنـوان تـابع پيونـداستفاده مي كند و خطايش از توزيـع چندجملـه اي پيـرويمي كند. براي انتخـاب الگـوريتمي بـا بـالاترين دقـت بـرايپيش بيني بروز حملة حاد قلبي، سـه نـوع مـدل رگرسـيونلجستيك با استفاده از تمام 28 مشخصة باليني گزارششده توسط بيماران و سه الگوريتم انتخاب متغيرها يعني Enter، Forward و Backward و ب ا ب هك ارگيري معي ار 50.0=α به عنوان معيار ورود و خروج متغيرها به مـدل سـاخته شـد[3] و به ترتيب مدل 1، مدل 2 و مدل 3 ناميده شدند. براي ساختن مدل هاي مذكور، مجموعـة دادة نهـايي 663 بيمـاربه طـور تصـادفي بـه دو مجموعـه و بـه نسـبت 80 درصـد(آموزش) و 20 درصد (ارزيابي) تقسيم شد.
مدلها
مدل 1 رگرسيون ساخته شده با استفاده از الگوريتم انتخاب متغير Enter است كه معادلة تابع پيشنهادي آن بـه صـورتمعادلة 1 است:
(1)
140268158985

P ^ x  ln   3.125 2.996 CP 4.552 BP 
1 P ^ x 
4.030 Sweats 4.985 SOB  5.668 Nausea 
Vomiting5.329 درمورد مدل 1 مي توان گفت متغيرهاي مسـتقلBP ،CP ، Nausea ،SOB ،Sweats و Vomiting قادر بـه پـيش بينـي
بروزرگرسيون
تغييرات متغير وابسـته (احتمـال بـروز حملـة حـاد قلبـي)هستند و توانايي پيش بيني آن ها در سطح خطـاي كمتـر از05/0 معنادار است.
مدل 2 رگرسيون ساخته شـده بـا اسـتفاده از الگـوريتم
انتخاب متغير Forward Stepwise:LR است كه معادلة تابع پيشنهادي آن به صورت معادلة 2 است:
20878880058

ln P ^ x   1.708 0.38 Age 
1 P ^ x 
.1736 CP 1.665 BP  2.183 Sweats  (2)
.2898 SOB 1. 946 Cough

مدل 2 در گام نهم متغيرهـاي مسـتقلBP ،CP ،Age ، SOB ،Sweats و Cough قادر به پيش بيني تغييرات متغير وابسته (احتمال بروز حملة حـاد قلبـي) هسـتند و توانـاييپيش بيني آن هـا در سـطح خطـاي كمتـر از 05/0 معنـاداراست.
مدل 3 رگرسيون ساخته شـده بـا اسـتفاده از الگـوريتم
انتخاب متغير Backward Stepwise:LR است كـه معادلـةتابع پيشنهادي آن به صورت معادلة 3 است:
(3)
ln

P ^ x   1.225 2.481 HTN  4.167 HLP 
1 P ^ x 
2.926 CP 3.848 BP  2.914 Sweats 
4.771 SOB 5.892 Nausea 3.487 Vomoting 
Cough553.2 بنابراين، درمورد مدل 3 مي توان گفت در گام شانزدهم متغيرهاي مستقل CP ،Hyperlipidemia ،Hypertension، Vomiting ،Nausea ،SOB ،Sweats ،BP و Cough قـــادر به پيش بيني تغييرات متغير وابسـته (احتمـال بـروز حملـةحاد قلبي) هسـتند و توانـايي پـيش بينـي آن هـا در سـطحخطاي كمتر از 05/0 معنادار است.
درخت تصميم
درخت تصميم يكي از مشهورترين و قديمي ترين روش هاي ساخت مدل دسته بندي است. براي تهية يك مدل كاربردي در اين تحقيق از الگوريتم درخت تصميم CHAID استفاده شده است. در ايـن روش، بـراي جداسـازي و شـاخه زدن از معيار p-value استفاده ميشود و چنانچه اخـتلاف بـين دودسته به صورت آماري معني دار باشد، عمـل شـاخه زنـي دردرخت انجـام مـي گيـرد و در غيـر ايـن صـورت در درخـتشاخه اي ايجاد نمي شود [2]. براي پـيش بينـي بـروز حملـةحاد قلبي در بيماران، مدل دسـته بنـد درخـت تصـميم بـااستفاده از تمام 28 مشخصـة بـاليني گـزارش شـده توسـطبيم اران و ب ا ب هكـارگيري معي ار 50.0= α س اخته ش د.
به اين منظور مجموعة دادة نهايي 663 بيمار به طور تصـادفيبه دو مجموعه و به نسبت 80 درصد (آموزش) و 20 درصد
(ارزيابي) تقسيم شد.
مدل درخت تصميم
در نمــودار 1، ميــزان اهميــت متغيرهــاي مســتقل مــدلساخته شده با استفاده از درخت تصميم در پيش بيني بـروزحملة حاد قلبي نشان داده مي شود. دليل اهميت متغيرهاي مستقل در تشخيص اين نكته است كه مقـادير پـيش بينـيشده توسط مدل به چه ميزان با تغيير مقادير متغير مستقل تغيير مي كنند و تا چه ميزان نسبت به آن حساس است.

نمودار 1. ميزان اهميت متغيرهاي مستقل مدل درخت تصميم

درمورد اين مـدل مـي تـوان گفـت متغيرهـاي مسـتقلCP ،Age ،LCP ،Sweats ،Edema ،Palpitations ،SOB و Nausea قادر به پيش بيني تغييرات متغير وابسته (احتمـالبروز حملة حاد قلبي) هستند و توانايي پيش بيني آن هـا درسطح خطاي كمتر از 05/0 معنادار است.
تخصصيصنايع،شمارهتابستان

نمودار 2. درخت تصميم به دست آمده براي پي شبيني بروز حملة حاد قلبي

-224788-1258

محاسبات و تحليل نتايج
با توجه به اينكه يكي از معيارهاي سنجش تناسب مدل هـا،نمودار ROC است، اين منحني به صورت مقايسه اي براي هر سه نوع مدل رگرسيون سـاخته شـده در نمـودار 3 و بـرايمدل درخت تصميم در نمودار 4 ارائه شـده اسـت [19]. بـامقايسة سطح زير منحني ROC بـراي مـدل هـاي 1، 2 و 3 رگرسيون لجستيك در جدول 1 و سطح زير منحني مذكور براي مدل درخت تصميم در جدول 2، مشخص است مـدلرگرســيون لجســتيك 1 بــا الگــوريتم انتخــاب متغيــر
95/5 با سـطح زيـر منحنـي Enter(automatic stepwise)
درصد بهترين عملكـرد را در مقايسـه بـا سـاير مـدل هـاي نمودار 3. نمودار مقايسهاي سطح زير منحني ROC ساخته شده دارد. (معادل CStatistic) براي م دلهاي 1، 2 و 3
بروزرگرسيونجدول 1. سطح زير نمودار ROC (معادل C Statistic) براي
مدل هاي 1، 2 و 3
Area Under the Curve Test Result Variable(s) Area Std. Errora Asymp totic
Sig.b Asymptotic 95%
Confidence
Interval
Lower Bound Upper Bound
Predicted probability
(Enter) .012 .000 .931 .979
.955 Predicted probability
(Forward) .934 .013 .000 .908 .960
Predicted probability
(Backward) .938 .017 .000 .905 .972
Under the nonparametric assumption
Null hypothesis: true area = 0.5

نمودار 4. نمودار سطح زير منحني ROC براي مدل درخت
تصميم

جدول 2. سطح زير نمودار ROC (معادل C Statistic) براي
مدل درخت تصميم
Area Under the Curve
Test Result Variable(s):Predicted probability
Asymptotic 95%
Asympt Confidence Interval
Area Std. Erroraotic Sig.bLower Upper
91440-987600



قیمت: تومان


دیدگاهتان را بنویسید