نشریه تخصصی مهندسی صنایع، دوره 47، شماره 1، فروردین ماه 1392، از صفحه 15 تا 24
رویکردي نوین در مدل سازي شبکه عصبی مصنوعی بر اساس منطق
رگرسیون فازي و کاربرد آن در پیش بینی
(مورد کاوي: پیش بینی قیمت گاز مایع ژاپن)

سیدعلی ترابی1 ، شیما پاشاپورعلی نظري*2 و نجمه نشاط3
 دانشیار دانشکده مهندسی صنایع – پردیس دانشکده هاي فنی- دانشگاه تهران
فارغ التحصیل کارشناسی ارشد مهندسی صنایع – پردیس دانشکده هاي فنی- دانشگاه تهران
دانشجوي دکتراي مهندسی صنایع- دانشگاه تریبت مدرس
(تاریخ دریافت 16/2/91، تاریخ دریافت روایت اصلاح شده 17/4/91، تاریخ تصویب 24/1/92 )

چکیده
در این مقاله، یک رویکرد جدید مدلسازي براي مدل هاي شبکه عصبی مصنوعی بر مبناي مفاهیم شبکههاي عصبی و رگرسیون فازي ارائه شده است. به این منظور، مدل شبکه عصبی مصنوعی در قالب یک مدل رگرسیون غیرخطی فازي فرموله شده است، به نحوي که این مدل، مزایاي هر دو مدل رگرسیون فازي و شبکه عصبی مصنوعی را دارد. بنابراین، این مدل به دلیل انعطافپذیري بالا، قابلیت استفاده در شرایط نبود قطعیت، مبهم یا پیجیده را دارد. علاوه بر این، مطالعه موردي پیش بینی قیمت گاز مایع در بازار ژاپن (بزرگ ترین وارد کننده گاز طبیعی جهان) براي نشان دادن نحوه استفاده از این رویکرد ارائه شده است. نتایج به دست آمده نشان میدهد که قدرت پیش بینی مدل ارائه شده قابل قبول است. علاوه بر این، در شرایط غیرقطعی و پیچیده می تواند بر خلاف مدل هاي شبکه عصبی، اطلاعات شفافی از روابط موجود بین متغیرهاي ورودي و پاسخ مدل به تصیمگیرنده ارائه دهد.

واژه هاي کلیدي: شبکههاي عصبی مصنوعی، رگرسیون فازي، مدلسازي قیمت گاز طبیعی

مقدمه
در دنیاي امروز، ارائه مدلهاي کمی براي اهداف پیش بینی در بازارها که منجر به سرمایهگذاريها و تصمیمات بهبودیافته میشود، مسئله اي اساسی است. شبکههاي عصبی مصنوعی به عنوان یک رویکرد شناخته شده، به طور وسیعی در مسائل پیشبینی مورد استفاده قرار میگیرد.
مدل ارائه شده با مدل هاي شبکه عصبی فازي بازگشتی،
Email: [email protected] 88013102 :نویسنده مسئول: تلفن: 5242617- 0443، فاکس *

در ادبیات مربوطه، تلاش هاي زیادي در زمینه مدل سازي دادههاي رگرسیون فازي با به کار بردن رویکرد شبکه عصبی مصنوعی انجام شده است. به این منظور، شبکههاي عصبی فازي1 توسعه یافته و اغلب با تکنیکهاي دیگر ادغام شده است تا جایگزین مناسبی براي رویکردهاي رگرسیون فازي ارائه کند. با این وجود، نبود مزایاي مدلهاي رگرسیونی در این رویکردها محسوس است. از جمله می توان به کار چین تنگ و همکاران [1] اشاره کرد که توانایی و دقت بالاي رگرسیون برداري پشتیبان2 و قدرت استدلالگري کاراي شبکه عصبی فازي را براي حل مسائل در شرایط نبود قطعیت، ادغام کرده اند.
در این رویکرد، رگرسیون برداري، پشتیبان مزیت بهینه-سازي عمومی را در طراحی شبکه عصبی فازي فراهم می-کند. نتایج به دست آمده نشان دهنده این مسئله است که روش شبکه عصبی فازي- رگرسیون برداري پشتیبان3 ، میتواند به صورت اتوماتیک، قوانین فازي را تولید کند و با کاهش قابل ملاحظه توابع اصلی فازي در تقریب، عملکرد خوبی ارائه دهد.
به طور مشابه، چیافنگ جوانگ و همکاران [2]، چیافنگ جوانگ و چنگ دا [3] یک مدل بازگشتی جدید ارائه کردند که به عنوان مدل بازگشتی محلی شبکه عصبی فازي با رگرسیون برداري پشتیبان شناخته شده است. در این مقاله، نویسندگان، یادگیري عصبی را براي آموزش پارامترهاي شبکه به کار بردند. هدف این رویکرد، مینیمم کردن خطاي یادگیري توسط الگوریتم رگرسیون برداري پشتیبان است. مقایسه نتایج حاصل از شبیه سازي حاکی از بهبود عملکرد در صورت استفاده از این مدل است.
به علاوه توسعه شبکههاي عصبی مصنوعی ساده به شبکههاي عصبی مصنوعی غیرمتقارن4 (مصلح و همکاران[4]) و شبکههاي عصبی رگرسیونی عمومی بر مبناي فازي5 براي کنترل سرعت مکش موتور (نوغونداري و رشیدي[5]) را در میان کارهاي انجامشده میتوان یافت.
به تازگی، مدلی ترکیبی از شبکههاي عصبی مصنوعی و رگرسیون فازي براي پیشبینی سريهاي زمانی توسط خاشعی و همکاران[6] ارائه شده است. مولفینیک مدل شبکه عصبی مصنوعی را به صورت مدل سريهاي زمانی فرمولبندي کردند، به نحوي که در شرایط وجود داده هاي ناقص و نیز زمانی که دادههاي تاریخی در دسترس نباشند، قابل استفاده است.
در یک جمع بندي کلی، می توان گفت شبکههاي عصبی، مثالهایی از رویکردهاي رگرسیون انعطافپذیر هستند، اما تفاوتهاي اساسی با تکنیکهاي کلاسیک (پارامتریک) دارند که از جمله می توان به این موارد اشاره کرد: 1) هیچ فرض اولیهاي در رابطه با شکل مدل در روند ساخت مدل مورد نیاز نیست. جوابهایی که براي مدل سازي روابط غیرخطی پیچیده فراهم میکنند، بهتر از مدلهاي پارامتریک هستند 3) توانایی زیادي در برخورد با مسائلی که شامل روابط غیرخطی بین متغیرها هستند، از خود نشان میدهند. با این وجود، شبکههاي عصبی، توانایی حل مسائلی که در شرایط نبود قطعیت تعریف می شوند را ندارند و به عنوان تکنیکهاي جعبه سیاه شناخته می شوند. شرایط نبود قطعیت اغلب در خلال توسعه سریع تکنولوژيهاي جدید، دادههاي غیردقیق و ناکافی و نیز نبود اطمینان از کفایت متغیرهاي مستقل تعریفشده به وجود می آیند. بنابراین همواره لازم است که وضعیت بعدي در شرایط نبود قطعیت و مبهم پیشبینی شود. مدلهاي رگرسیون فازي، مدلهاي مناسبی در این-گونه موارد هستند. با این وجود، توانایی نگاشت توابع با رفتار غیرخطی را ندارند.
با توجه به آنچه ذکر شد، در این مقاله مراحل بازنویسی روابط بین متغیرهاي ورودي و خروجی یک مدل شبکه عصبی، در قالب یک رگرسیون غیرخطی فازي، تشریح می شود. این مدل، توانایی حل مسائل در شرایط نبود قطعیت و نگاشت توابع غیرخطی (همانند یک مدل هاي شبکه عصبی) و قابلیت کشف روابط موجود بین متغیرهاي ورودي و پاسخ یک مدل را همانند مدل هاي کلاسیک دارد. همچنین مزایاي هر دو مدل شبکه هاي عصبی و رگرسیون فازي را نیز دارد، به نحوي که کاستی هاي ذکر شده آنها را بر طرف کند. ویژگیهاي منحصر به فردي که این مدل دارد، از ترکیب شبکه عصبی مصنوعی با رگرسیون فازي ناشی میشود. بنابراین، به دلیل انعطاف پذیري بالایی که دارد، در شرایط نبود قطعیت ،مبهم و پیچیده قابل استفاده است.
آنچه که در ادامه مقاله میآید به این شرح سازماندهی شده است: بخش دوم، رویکرد مدل سازي پیشنهادي را معرفی می کند و بخش سوم، اختصاص به مطالعه موردي دارد. نتیجهگیري و ملاحظات پایانی در بخش چهار ارائه شدهاند. در ادامه این بخش، تکنیکهایی که در مدل پیشنهادي گنجانده شدهاند، توضیح داده شدهاند. بخش 1,1 مدلهاي رگرسیون فازي و بخش 2,1 مدلهاي شبکه عصبی را معرفی می کنند.

مدلهاي رگرسیون فازي
فرض کنیدxmn و ym به ترتیب mامین متغیر غیر وابسته و متغیر وابسته در یک مدل رگرسیون فازي باشد.
در مورد مشاهده mام ،i پارامتر مربوط به iامین متغیر غیروابسته و mجمله خطاي مربوط به mامین مشاهده است و مدل رگرسیون کلاسیک به صورت زیر قابل بیان است:
=++ ⋯ ++,= 1,2, … ,

پارامتر رگرسیون iاغلب از طریق دادههاي نمونه، قابل محاسبه است. اگر i به صورت غیرقطعی تخمینزده شود، در رگرسیون فازي به شکل زیر نشان داده می شود:

=++ ⋯ +==
~
به طوري کهY خروجی فازي ،X   [X1, X 2 ,…, X n ]T بردار ورودي حقیقی و
{~ {~0,~1,….,~n مجموعه اي از اعداد فازي است که مایل به پیدا کردن آنها بر اساس تعدادي از معیارهاي مناسبت برازش هستیم و~i ها اعداد فازي مثلثی به این ترتیب هستند:

|−|
1371600-3597

1 −

(3)
0

~~ ci i i i
که تابع عضویت ، مرکز آن و نشان دهنده پراکندگی عدد فازي حول مرکز است. بر اساس اصل توسعه فازي، تابع عضویت اعداد فازي با استفاده از پارامتر فازي~i به صورت زیر قابل بیان است
(خاشعی و همکاران[6]):
|−.|

= ⎧⎨11 − | | ≠ 0 (4)
⎩ 0

مسئله پیدا کردن ~i به صورت مسئله برنامهریزي خطی توسط تاناکا و ایشی بوچی[7] به این ترتیب ارائه شده است:
Minimize = | | Subject to . + (1 − ℎ) || || ≥≤ (5)

که در آن تابع هدف، مینیمم کردن پراکندگی کلیS است که به صورت مجموع پراکندگیهاي پارامترهاي فازي مدل تعریف می شود. k تعداد مشاهدات و h مرز تابع عضویت
~Y است.

مدلهاي شبکه عصبی
مدلهاي شبکه عصبی، مجموعهاي از مدلهاي غیرخطی انعطافپذیر هستند که قادر به کشف الگوهاي موجود در دادهها هستند. در واقع این سیستمها، در خلال پردازش دادههاي تجربی، اطلاعات و یا قوانین پنهان در دادهها را به ساختار شبکه منتقل میکنند. این مدلها می توانند آینده یک رویداد را با استفاده از دادههاي تاریخی آن، پیشبینی کنند.
رابطه بین خروجی ym و وروديهاي
xm1, xm2,…xmn به صورت فرمول ریاضی زیر قابل ارائه است:
=+.(, ) +, .+
(6)
= +.=(.)

که در آن (wi,q (i  1,2,…., n;q  1,2,3.,…, Q و (wq (q  0,1,2,…., Q پارامترهاي مدل هستند که اغلب وزنهاي رابطه نامیده میشوند ،n تعداد گره هاي
n تعداد Q ، X mq g(w0,q wi,q.xmi ) ، ورودي
i1
گرههاي مخفی و f و g توابع انتقال هستند که اغلب به صورت تابع لجستیک مورد استفاده قرار می گیرند. می توان مشاهده کرد که طبق فرمول نویسی رابطه (6) شبکه عصبی را می توان معادل با یک رگرسیون چندگانه غیرخطی دانست. در عمل، شبکهاي با یک لایه مخفی که شامل تعداد کمی گرههاي مخفی است ،بدون در نظر گرفتن نوع نمونه، به خوبی توانایی پیشبینی را دارد. البته باید دقت داشت که ممکن است این موضوع به دلیل برازش بیش از حد براي یک نمونه خاص باشد، در حالی که قابلیت تعمیم براي دادههاي خارج از نمونه را ندارد.
(خاشعی و همکاران[6]).
براي بهبود عملکرد شبکه هاي عصبی مصنوعی، اغلب از تعدادي رویکردهاي داده کاوي در روند یادگیري شبکه استفاده می شود. از جمله این رویکردها، روشهاي داده کاوي پویا، چندگانه، هرس، هرس جامع و همچنین شبکههاي شامل توابع شعاعی6 است. ( هیسکین [8]).

فرمولبندي پیشنهادي
در این بخش، مراحل فرمولبندي مدل شبکه عصبی مصنوعی به صورت مدل رگرسیون غیرخطی فازي که قادر به حل مسائلی در شرایط نبود قطعیت و غیرخطی است را شرح میدهیم. این مدل، هم مزایاي شبکههاي عصبی مصنوعی و هم مزایاي رگرسیون فازي را دارد. با این ویژگی که کمبودهاي ذکر شده در این دو رویکرد را کاهش میدهد.
مراحل این روش در زیر خلاصه شدهاند:

مرحله1:
پارامترهاي معین (… ,1 =;…,0 = ) ,،
(, …,0 =) را با پارامترهاي فازي به فرم اعداد فازي
مثلثی ( … ,1 = ; …,0 = ) , و ( , …,0 = ) مطابق معادله (2) جایگزین کنید:

=+.(,+, .+
(7)
= +.=(.)

مرحله 2:
تابع عضویت پارامترهاي فازي (w~i,q  (aiq ,biq , ciq و (w~q  (d q ,eq , f q به فرم اعداد فازي مثلثی که به ترتیب در رابطه هاي (8) و (9) نشان داده شده است را تعیین کنید:

= ⎪((−−))

≤≤
⎪(−)
⎩0 ℎ


⎪ (−)
= ⎨

⎪ (−)
⎩0 ℎ

مرحله 3:
~
تابع عضویت Xmq بر اساس (w~i,q (i  0,1,2,…., n
(q  0,1,2,…., Q) و (w~q (q  0,1,2,…., Q با استفاده از اصل توسعه فازي (ما و خراسانی[9]) همانند رابطه (5) را به دست آورید:

⎧− ∑. .≤≤
= ⎪

⎨ .≤≤
⎪∑.− ∑.
⎩0 ℎ

باید توجه کرد که براي سادگی توابع انتقال (f وg)، توابع ساتلین و وزنهاي مربوط بین وروديها و لایه پنهانی، اعداد قطعی در نظر گرفته میشوند.
مرحله 4:
همانند مرحله 3، تابع عضویت ym~ در رابطه (11) داده شده است. با در نظر گرفتن رابطه (4) آن را تصحیح و به فرم رابطه (12) بازنویسی کنید:

− ∑. .≤≤.
⎪∑.− ∑.
216409-80618= ⎨ .≤≤.

⎩ ℎ

298705-149734 ≠ 0

مرحله 5:
سرانجام، براي تشکیل مسئله برنامهریزي خطی، از معیار مینیمسازي پراکندگی کل (مجموع پراکندگیهاي هر یک از پارامترهاي فازي) مطابق رابطه (5) استفاده کنید و با حل مسئله ،مقادیر بهینه متغیر هاي تصمیم (eq , d q )را به دست آورید:

=−.
.+ (1 − ℎ)(−.) ≥ , = 1,2, …,

.− (1 − ℎ)(−.) ≤ , = 1,2,… ,

مطالعه موردي
این روزها، گاز طبیعی به عنوان سوختی تمیز که مانع از افزایش تولید گازهاي گلخانهاي میشود، در میان سوختهاي فسیلی دیگر جهان (بخصوص در کشورهاي عضو پیمان کیوتو) جایگاه خاصی به دست آورده است.
رشد سریع تقاضا براي گاز سبب شده است که بازار گاز از بازار خریداران به بازار فروشندگان تبدیل شود. همین موضوع قیمت گاز را بسیار پراهمیت کرده است. بنابراین ،مطالعه و پیش بینی قیمتهاي فروش گاز بر اساس داده-هاي واقعی و اطلاعات بازار و نیز با استفاده از رویکردهاي مدلسازي و پیشبینی کارا، اجتنابناپذیر است.
در موضوع ادبیات، مطالعه هاي زیادي روي پیشبینی قیمت گاز انجام شده است. اغلب مطالعههاي اخیر نشان دادهاند که رویکرد شبکههاي عصبی مصنوعی در مقایسه با رویکردهاي اقتصادسنجی و رگرسیون خطی، به دلیل ماهبت غیرخطی و پیچیده قیمت گاز، کاراتر است.
دوریس و رویتر[10] برتري مدل شبکه عصبی مصنوعی خود رگرسیونی در مقایسه با یک مدل اقتصادي که شامل متغیر تأخیر زمانی کوتاه مدت (روزانه) در پیشبینی قیمت گاز است را نشان میدهند.
گابریل وونک پارادو و همکاران[11] دو مدل اقتصادي براي پیشبینی قیمت گاز طبیعی را با یکدیگر مقایسه کردند. مدل اول بر اساس دادههاي جمع آوري شده از »آژانس بین المللی انرژي«7 و مدل دوم بر پایه اطلاعات نفت خام جمع آوري شده ایالات متحده ساخته شده است.
نویسندگان تصریح کردند که هیچ یک از این دو مدل، کارائی قابل توجهی ندارند و ضریب همبستگی شان از 20% تجاوز نمیکند. به تازگی، در مقالههاي منتشر شده توسط نابنی و انگوین[12] از مدل شبکه عصبی مصنوعی، مدل خودرگرسیونیGARCH8، مدل سري هاي زمانی و مدل رگرسیون چندگانه براي پیشبینی قیمت ماهانه گاز در بازار ایرلند استفاده شده است. کارکرد این مدلها در چهار حالت ارزیابی شده است. این چهار حالت عبارتند از ثابت ،انطباقی (تنظیم پارامترهاي مدل با استفاده از EKF:
فیلترکالمن توسعه یافته)اصلی ،چند جزئی (استفاده از تکنیک RHWT). 9 نتایج این مطالعه نشان دهنده برتري مدل شبکه عصبی نسبت به مدل خودرگرسیون GARCH در همه حالات است.
در این مقاله، تابع قیمت LNG10 بازار ژاپن (به عنوان بزرگترین وارد کننده LNG جهان و یکی از سه بازار بزرگ جهان) براي آزمون رویکرد پیشنهادي، انتخاب شده است. غیرخطی و پیچیده بودن تابع قیمت LNG و اطمینان نداشتن از کفایت دادهها و متغیرهاي مؤثر شناسایی شده، پیشبینی قیمت LNG را تبدیل به گزینه مناسبی براي بررسی کرده است.
طبق ادبیات مربوطه (فیون[13]، دوبیس -دنیس [14]، الهگارت و همکاران [15]، ویلار و جوتز[16]، طباطبایی[17])، 15 متغیر مستقیم و غیرمستقیم (کمکی)، مؤثر بر پیش بینی قیمت LNG تشخیص داده شدهاند که در جدول (1) آمده است (همراه با اطلاعات آماري آنها). دادههاي مربوطه از سال 1998 تا فوریه 2010 به طور ماهاته از کنسرسیوم بینالمللی انرژي جمع آوري شده است. دادههاي مربوط به سالهاي 1998 تا 2007 براي یادگیري و بقیه براي آزمایش کردن انتخاب شدهاند. باید توجه کرد که دادههاي پرت، نادیده گرفته شدهاند.
براي تخمین وزنهاي مربوط به مدل شبکه عصبی مصنوعی، پنج رویکرد داده کاوي پویا11، چندگانه12 ، هرس13 ، هرس کامل14 و شبکههاي شامل توابع شعاعی15 استفاده شده است. براي به دست آوردن بهترین ساختار شبکه، از جعبه ابزار Neuro Solution نرمافزار مطلب استفاده میشود. شبکههاي مختلف شامل یک تا سه لایه پنهانی، تعداد مختلف از نرون ها در لایههاي پنهانی و توابع فعالسازي مختلف، امتحان شدند. سرانجام شبکهاي با کمترین خطاي میانگین مربعات16، براي هر رویکرد، به عنوان شبکه بهینه انتخاب شده است.
باید ذکر کرد شرایط لازم براي خاتمه مرحله یادگیري، دستیابی به مقدار 005- e1 براي کمترین خطاي میانگین مربعات، 200 براي ماکزیمم تعداد هر دوره و 010-e1 براي مینمیم مقدار شیب خطا براي هر دوره است. نتایج شاخصهاي خطاي درصد میانگین مطلق17، ریشه میانگین مربعات خطا18، کسر مطلق از واریانس19 براي پنج شبکه در جدول (2) آمده است که خطاي درصد میانگین مطلق، میانگین نسبت خطا به مقادیر واقعی را نشان میدهد و به این شکل است:
MAPE (%)  



m
i
i
i
i
y
y
y
m
1
)
(
100
1

m

i

i



قیمت: تومان


دیدگاهتان را بنویسید