نشریه تخصصی مهندسی صنایع، دوره 45، شماره 1، فروردین ماه 1390، از صفحه 83 تا 94 چارچوبی براي استفاده از دانش مشتریان در طراحی کاتالوگ هاي
الکترونیکی

نگار قنبري1 و محمدرضا غلامیان*2
1 دانش آموخته کارشناسی ارشد مهندسی فناوري اطلاعات (تجارت الکترونیکی) – دانشکده مهندسی صنایع دانشگاه علم و صنعت 2 استادیار گروه مهندسی فناوري اطلاعات (تجارت الکترونیکی)- دانشکده مهندسی صنایع دانشگاه علم و صنعت
(تاریخ دریافت 18/8/88، تاریخ دریافت روایت اصلاح شده 3/8/89، تاریخ تصویب17/1/90 )

چکیده
تحقیقات نشان داده است که در میان موضوعات مختلف مطرح در تجارت الکترونیکی، مدیریت اثربخش مشتریان در کنار استفاده از دانش آنها از مواردي است که می تواند به مزیت رقابتی منجر شود. کاوش دانش مشتریان براي کمک به مدیران براي در پیش گرفتن خط مشی هاي تبلیغاتی بهتر، با بهره گیري از سیستمی که بتواند الگوهاي رفتار مشتریان را از پایگاه داده ها استخراج کند، امکان پذیر است. خروجی چنین سیستمی را می توان در قالب خط مشی هاي تبلیغاتی در کار طراحی کاتالوگ هاي الکترونیکی به کار گرفت. در این مقاله یک چارچوب براي طراحی کاتالوگ هاي الکترونیکی بر اساس دانش مشتریان ارائه می شود. این چارچوب از الگوریتم جدیدي براي کاوش چندسطحی الگوهاي متوالی به نام DVlw استفاده می کند و در مورد یک شرکت فروشنده تجهیزات رایانه اي به کار گرفته شده است. بررسی ها نشان می دهد که دانش نهایی به دست آمده توسط آن در مقایسه با سایر چارچوب هاي معرفی شده در این زمینه کامل تر است.

واژه هاي کلیدي: کاتالوگ هاي الکترونیکی، الگوهاي متوالی، دانش مشتریان

مقدمه
فناوري اطلاعات ابزارهاي بسیاري را براي مشتریان و مشتري بیشترین کاربرد را دارند [2، 3]. از آنجایی که در شرکت ها براي کمک به مسائل تصمیم گیري فراهم کرده الگوهاي متوالی زمان نقش تعیین کننده اي دارند، می توانند است. براي مثال، مشتریان با استفاده از اینترنت به راحتی در پیش بینی خریدهاي بعدي مشتري به طور گسترده به می توانند به اطلاعات محصولات بیشماري از فروشندگان کار گرفته شود[1].
مختلف دسترسی داشنه باشند که این اطلاعات بر در این تحقیق، یک چارچوب براي طراحی کاتالوگ هاي تصمیم گیري خرید آنها تأثیر خواهد گذاشت. علاوه بر این الکترونیکی بر اساس دانش مشتریان معرفی می شود.
شرکت ها نیز می توانند با جمع آوري و تحلیل اطلاعات الگوهاي متوالی ابزاري است که این چارچوب براي مشتریان، تصمیمات بهتري را در زمینه بازاریابی در پیش استخراج دانش مشتریان از آن بهره می گیرد که در ادامه
بگیرند. شرح داده می شود.
در گذشته، محققان براي بررسی رفتار مشتریان از ساختار کلی مقاله به این ترتیب است: در بخش بعد تحلیل هاي آماري استفاده می کردند که امروزه جاي خود مروري بر ادبیات مدل ها و چارچوب ها و روش هاي را به روش هاي داده کاوي داده است. داده کاوي از داده کاوي مورد استفاده در استخراج دانش مشتري انجام فناوري هاي پرکاربرد براي کشف دانش بالقوه مشتریان از می گیرد. بخش سوم، چارچوب جدید استفاده از دانش پایگاه داده هاي کسب و کار براي کمک به تصمیم گیري مشتري در طراحی کاتالوگ هاي الکترونیکی را معرفی است [1]. از بین روش هاي مختلف داده کاوي شامل می کند. بخش چهارم مقاله به معرفی شرکت مورد مطالعه قوانین تلازمی، خوشه بندي، طبقه بندي و …، قوانین و نتایج تجربی پیاده سازي چارچوب پیشنهادي در آن تلازمی و الگوهاي متوالی در تحلیل داده هاي خرید شرکت می پردازد. بخش پنجم به بررسی دانش به دست
Email: [email protected] ، 73228067 : نویسنده مسئول : تلفن : 73225067 , فاکس *

آمده از پیاده سازي چارچوب اختصاص دارد و در نهایتجمع بندي و پیشنهادات براي تحقیقات بعدي ارائهمی شود.

مروري بر ادبیات
همان طور که اشاره شد، هدف مقاله معرفی چارچوب براي استفاده از دانش مشتري در طراحی کاتالوگ ها است، اما استفاده از دانش مشتري، خود مستلزم استخراج دانش از داده ها و بررسی روش هاي داده کاوي مناسب براي این کار است. بنابراین ادبیات موضوع را در دو محور مدیریت دانش مشتري و روش هاي داده کاوي براي استخراج دانش مشتري دنبال می کنیم.

مدیریت دانش مشتري
براي مدیریت دانش مشتري تعاریف زیادي در مقالات ارائه شده است. گیبرت و همکاران [2] مدیریت دانش مشتري را یک فرآیند استراتژیک معرفی کرده اند که در آن شرکت ها مشتریان را از دریافت کننده منفعل کالا و خدمات به قدرتمندي شرکاي دانش می رسانند و 5 دسته یادگیري مشارکتی تیمی، نوآوري دوجانبه، انجمن هاي خلاقیت، مدیریت مشترك سرمایه معنوي، تولیدکننده-مصرف کننده را براي دانش مشتري در نظر می گیرند. گیبرت و همکاران [3] هدف از مدیریت دانش مشتري را با مباحث مدیریت دانش مشتري و مدیریت دانش یکسان دانسته و این هدف را به صورت ایجاد بهبود دائم براي مشتریان تعریف کردند. سالومن و همکاران [4] ضمن تعریف سه دسته براي دانش مشتریان (دانش از/براي/درباره مشتریان)، هدف آن را گسترش توانایی هاي مرتبط با مشتري در سازمان ها دانسته اند. پاکوت [5] نیز مدیریت دانش مشتري را به صورت فرآیندي که سازمان براي مدیریت شناسایی، جذب و به کارگیري داخلی دانش مشتري به کار می گیرد و در خلال آن سازمان و مشتریان آن با یکدیگر براي ترکیب دانش فعلی براي ایجاد دانش جدید کار می کنند، تعریف کرد. لوپز و مولینا [6] مدیریت دانش مشتریان را کاربرد ابزارها و تکنیک هاي مدیریت دانش براي پشتیبانی از تبادل دانش بین سازمان و مشتریانش دانسته که به شرکت امکان گرفتن تصمیمات کسب و کار را می دهد. استفاده از دانش مشتري براي گرفتن تصمیمات کسب و کار نیز هدفی است که این مقاله آن را دنبال می کند.
علاوه بر تعاریف متعدد از مدیریت دانش مشتري، مدل ها و چارچوب هایی نیز در این زمینه ارائه شده است.
سالومن و همکاران [4] چارچوبی براي پیاده سازي CRM مبتنی بر دانش ارائه دادند که از چهار بخش استراتژي ها، فرآیندها، سیستم ها و مدیریت تغییر تشکیل شده است و در بخش سیستم هاي این چارچوب، هدف ایجاد یک مخزن دانش یکپارچه در محدوده سازمان دنبال می شود. سو و همکاران [7] مدلی مفهومی براي 1e-CKM ارائه دادند که از دانش مشتري براي نوآوري در توسعه محصول استفاده می کرد. در نظر گرفتن بخش بندي بازار و جداسازي الگوهاي مشتریان با توجه به آن از نکاتی است که در این مدل وجود دارد. لیو و چن [8] به طور خاص به استفاده از دانش مشتري در طراحی کاتالوگ هاي اینترنتی پرداخته اند و وظایف را شامل تشکیل پایگاه داده، وظایف داده کاوي، تحلیل بخش بندي، جذب دانش، بازاریابی مبتنی بر کاتالوگ و تبلیغات فروش برشمرده اند. در این مقاله، گرچه داده کاوي به عنوان مرحله اي اصلی براي استخراج دانش مشتري در نظر گرفته شده و الگوها در سه سطح خود محصول، برند محصول و دپارتمان محصول به دست آمده است، اما اشاره دقیقی به الگوریتم مورد استفاده وجود ندارد. لین و هنگ [9] نیز از روش مشابه مورد ذکرشده براي ایجاد کاتالوگ اینترنتی استفاده کردند. خروجی هر دو مقاله، الگوهایی براي طراحی کاتالوگ هاي الکترونیکی بود. چنگچن و همکاران [10] یک سیستم پشتبانی تصمیم گیري براي تبلیغات فروش شخصی سازي شده، ایجاد کردند که به دست آوردن الگوها در سه سطح تمام مشتریان/ خوشه هاي مشتریان و هر مشتري از ویژگی هاي بارز آن است.

دانش مشتري و روش هاي داده کاوي
روش هاي داده کاوي گوناگون خوشه بندي، دسته بندي، قوانین تلازمی، درخت هاي تصمیم گیري و … را می توان به دو دسته کلی توصیفی و پیش بینی کننده تقسیم کرد. لیو و چن [8] و لین و هنگ [9] در چارچوب هاي معرفی شده براي طراحی کاتالوگ هاي اینترنتی به استفاده از قوانین تلازمی و الگوهاي متوالی اشاره کرده اند. چنگچن وهمکاران [10] نیز در سیستم پشتیبانی تصمیم گیري خوداز این روش ها بهره گرفته اند. پرینز و پل [11] نیز برايپیش بینی رفتار مشتري از الگوهاي متوالی استفادهکرده اند. در همه این مقالات، هدف، استفاده از الگوهايمتوالی استخراج دانش مشتري بوده است. در برخیمقالات که به بخش بندي بازار قبل از به دست آوردنالگو ها اشاره شده است، روش خوشه بندي روش غالب براي این کار بوده است [7، 10].
از آنجایی که در مقالات، اشاره دقیقی به الگوریتم هاي مورد استفاده براي کاوش الگوها نشده است، در ادامه به الگوریتم هاي موجود براي کاوش الگوهاي متوالی و به طور خاص کاوش چندسطحی الگوها می پردازیم.
در حالت کلی روش هاي موجود براي کاوش الگوهاي متوالی را می توان به دو دسته مبتنی بر تولید و تست کاندیدا(مانند الگوریتم هاي 3SPADE2, GSP و …) و تقسیم-غلبه(مانند الگوریتم 4PrefixSpan) تقسیم کرد.
الگوریتم هاي دسته اول بر اساس الگوریتم Apriori از تکنیک تولید کاندیداها و هرس آنها بر اساس شرط حداقل پشتیبان استفاده می کنند، با این تفاوت که در روش SPADE از تبدیل پایگاه داده از فرمت افقی به فرمت عمودي استفاده شده و سپس کاوش الگوها انجام می گیرد[12]. در دسته دوم از تکنیک تقسیم فضا به حالت هاي کوچک تر و کاوش الگوها در فضاهاي کوچک تر استفاده می کنند.
براي کاوش چندسطحی الگوها، روش توالی هاي گسترش یافته5 براي الگوریتم GSP بارزترین روش است [13]. اولین تلاش ها در این زمینه توسط آگراول و سریکانت [14] و هن و فو [15] انجام گرفت. پینتو و همکاران [16] و همچنین پی و همکاران [17] از روش توالی یکتا و الگوي توسعه یافته مبتنی بر prefixSpan براي کاوش چندسطحی الگوها استفاده کردند. نهایت آنکه چنا و هوانگ [18] و هوانگ [19] از تئوري فازي براي حالت خاصی از کاوش چند سطحی الگوهاي متوالی استفاده کرده اند.

چارچوب استفاده از دانش مشتریان براي طراحی کاتالوگ هاي الکترونیکی
از آنجایی که معرفی نکردن الگوریتم مورد استفاده، از معایب مدل ها و چارچوب هاي معرفی شده تا کنون است، در این بخش در کنار معرفی چارچوب طراحی کاتالوگ هاي الکترونیکی، الگوریتم مورد استفاده براي کاوش چندسطحی الگوهاي متوالی نیز تشریح می شود.

معرفی چارچوب
با توجه به جمع بندي مدل ها و چارچوب ها در مقالات که در بخش قبل مطرح شد، چارچوب نهایی براي طراحی کاتالوگ هاي الکترونیکی بر اساس دانش مشتریان پیشنهاد می شود.(شکل 1)
در این چارچوب، پایگاه هاي داده براي دسته بندي چندسطحی محصولات و خوشه بندي مشتریان دیده می شود. دسته بندي محصولات، بر اساس پایگاه داده محصولات و نظر خبرگان در چندین سطح انجام می گیرد. براي مثال اگر با توجه به پایگاه داده محصولات در سطح اول، 5 دسته براي محصولات موجود است، در سطح دوم، بنا به نظرات خبرگان دسته هاي 1 و 3 ممکن است در درون دسته اي جدید به نام A قرار بگیرند و تا آخرین سطح در نظر گرفته شده براي محصولات، این خاصیت ادامه پیدا می کند. در نظر گرفتن این دسته بندي پویا در داده کاوي می تواند به کشف الگوهاي جالبی در رفتار خرید مشتریان منجر شود.
خوشه بندي مشتریان نیز با استفاده از ویژگی هایی که خبره حوزه تعیین می کند، انجام می شود. در نهایت با توجه به دسته بندي چندسطحی محصولات و خوشه بندي انجام شده، الگوهاي خرید در سطوح متفاوت دسته بندي محصول براي همه مشتریان، خوشه هاي مشتریان و هر مشتري به دست می آید. سپس با دخیل کردن نظرات خبره حوزه در زمینه انتخاب الگوها و تعیین استراتژي ها، الگوها براي قرار گرفتن در پایگاه دانش طراحی کاتالوگ هاي الکترونیکی نهایی می شوند.

معرفی الگوریتم جدید 6DVlw
استفاده از چارچوب معرفی شده بدون داشتن ابزاري که فرآیند استخراج دانش مشتریان را از پایگاه هاي داده امکان پذیر کند، میسر نیست. بنابراین در ادامه به معرفی الگوریتم DVlw که در این چارچوب مورد استفاده قرار می گیرد، می پردازیم. این الگوریتم جدید براي کاوش چندسطحی الگوهاي متوالی همانند الگوریتم GSP بر اساس روش تولید و تست کاندیداها عمل می کند، اماکاوش چندسطحی الگوها را به نحو کارآتري نسبت بهروش هاي معرفی شده تا به حال انجام می دهد. دلیل اینموضوع مدیریت چندسطحی بودن توالی در مرحله اي جدااز تولید کاندیدا است. در پیاده سازي الگوریتم مسئلهچندسطحی بودن، به صورت پویایی رئوس براي گرافتوالی (که نشان دهنده رخدادها هستند) در نظر گرفتهمی شود. این الگوریتم، شامل چندین تکرار است که با توالی هایی به طول یک شروع شده و در هر تکرار همه الگوهاي مکرر هم اندازه یافت می شوند. علاوه بر این، در هر تکرار، کاندیداها با استفاده از الگوهاي مکرر به دست آمده در تکرار قبل تولید می شوند. الگوریتم 1 ساختار DVlw را نشان می دهد. تابع GDV(Graph for Dynamic Vertices) همه حالت هاي ممکن را براي توالی d با توجه به سطوح تعریف شده براي آیتم ها (T) به دست می آورد. با استفاده از چنین تابعی کاوش در چندین سطح به صورت یک باره و هم چنین قبل و جدا از مرحله شمارش و تولید کاندیداها انجام می گیرد.

Algorithm 1(The DVlw algorithm) Data: a frequency threshold σ.
Result: The collection L of frequent sequences, k the maximal frequent length.
L0=0; k=1;
C1 = {{<i>}/i∈I}; //all 1-frequent sequences
T = MakeHierarchy(I)
While Ck ≠ ∅ do
For each d ∈ DB do g = GDV(d,T);
// g stands for the multilevel
graph representing of d.
CountSupport(Ck , σ ,g);
Pz = {p ∈ Pz / Support(p) > σ };
Prune Extra Parents(Ck,Pz);
Lk = {c ∈ Ck / Support(c) > σ }; Ck+1=Candidate Generation(Lk);
K=k+1;
Return L=

Lj;
متغیرها و توابع مورد استفاده در الگوریتم 1، به ترتیب در جدول (1) و (2) به نمایش گذاشته شده اند.
در مقایسه الگوریتم با روش توالی هاي گسترش یافته مورد استفاده در DVlw ،GSP عملکرد بهتري از نظر زمان اجرا در مجموعه داده هاي مختلف نشان داد و در مورد الگوهاي نهایی نیز، الگوهاي مازاد تولید شده توسط GSP [1] در خروجی الگوریتم DVlw وجود نداشت.

جدول 1: متغیرهاي الگوریتم DVlw
توضیحات متغیرها
آرایه اي از یک ساختار براي ذخیره رویدادها و برچسب هاي دسته بندي مربوط به آنها T
میزان حداقل پشتیبانی 
یک توالی از پایگاه داده (DB) d
گرافی که توالی چندسطحی را نشان می دهد g
مجموعه آیتم ها I
مجموعه کاندیداها، Ck نیز کاندیداي مرحله kام را نشان می دهد C
مجموعه الگوهاي مکرر، Lk نیز الگوهاي مرحله kام را نشان می دهد L
شمارنده مرحله k
مجموعه الگوهاي مکرر والد، Pz نیز الگوهاي مرحله zام را نشان می دهد P

جدول 2: توابع استفاده شده در الگوریتم DVlw
خروجی ورودي تابع
حات توضی T I Make
Hierarchy ()
دي تعریف شده براي آیتم هاي ی کند ساختار T را با توجه به دسته بن
I پر م g d, T GVD()
راف و توالی رخدادها یال ها را تصاتی به نام index دارد که در این تابع، رخدادها رئوس گتشکیل می دهند. هر راس مخ ر توالی نشان می دهد موقعیت آن رخداد را د Support (ck) Ck, , g Count Support()
ر یک از کاندیداهاي Ck باشد، ابد. همچنین توالی والد هر یک اضافه و پشتیبان آن والد در در صورتی که گراف g شامل هپشتبان آن کاندیدا افزایش می یاز کاندیداها به مجموعه Pz باشد، افزایش می یابد صورتیکه g شامل آن مجموعه هرس شده Pz

Ck, Pz Prune
Extra
Parents()
که پشتیبان آنها با مجموع عه Ck برابر باشد، زائد شناخته این تابع توالی هاي والدي را
پشتیبان فرزندان آنها در مجمو می کند حذف Ck+1 Lk Candidate
Generatio n()
این تابع با اتصال توالی هاي مکرر، کاندیداهاي مرحله بعد را براي دور بعدي اجراي الگوریتم فراهم می کند
اعتبارسنجی الگوریتم پیشنهادي
براي بررسی کارآیی و عملکرد الگوریتم پیشنهادي براي کاوش چندسطحی الگوهاي متوالی، الگوریتم پیشنهادي با الگوریتم پایه GSP به مقایسه گذاشته شده است. بدین منظور از دو مجموعه داده ترکیبی در دو اندازه مختلف 1000 و 10 هزار آیتمی از برنامه تولید داده گروه تحقیقاتی Quest شرکتIBM مورد استفاده قرار گرفت7. هر یک از این مجموعه داده ها ویژگی هاي خاص خود را دارند که سبب تنوع به کارگیري داده ها در مسئله می شوند. با توجه به نحوه توزیع الگوهاي مکرر در این دو مجموعه داده، مجموعه داده اول در حداقل پشتیبان هاي 0.5، 1.0، 1.5 تا 3.0 و مجموعه داده دوم در حداقل پشتیبان هاي
0.25، 0.5، 0.75 و 1 اجرا شد. همان طور که در جدول(3) مشاهده می شود، الگوریتم پیشنهادي DVlw نسبتبه الگوریتم پایه GSP در همه اجراها برتري محسوسیدارد. در هر پشتیبانی با افزایش تعداد سطوح، تفاوتعملکرد بین دو الگوریتم نیز افزایش می یابد. این موضوعبه دلیل افزایش طول توالی ها و تعداد کاندیدها درالگوریتم GSP است، در حالی که این دو مقدار در الگوریتم DVlw ثابت می ماند. چنانکه در جدول مشاهده می شود، با افزایش پشتیبان، به دلیل کاهش کلی تعداد کاندیداها، تفاوت در زمان اجراي هر دو الگوریتم کاهش می یابد، ولی الگوریتم DVlw همچنان عملکرد بهتري را نشان می دهد.

نتایج تجربی
در این بخش ابتدا به معرفی شرکت مورد مطالعه می پردازیم، سپس نحوه پیاده سازي چارچوب پیشنهادي در مورد مطالعاتی تشریح می شود.

معرفی شرکت فروشنده تجهیزات رایانه اي
این شرکت، کار طراحی، تولید و بازاریابی تجهیزات الکترونیکی و رایانه اي را انجام می دهد و در سال 1990 کار خود را با تولید فقط یک نوع “صفحه کلید” آغاز کرده است. با دستیابی به موفقیت این محصول در بازار ، شرکت گسترش افقی خود را براي دستیابی به بازار هدف بزرگ تر و تولید محصولات و تجهیزات رایانه اي بیشتر آغاز کرد. در حال حاضر، کمپانی بیش از صد نوع محصول در دسته بندي هاي مختلف مانند رایانه هاي قابل حمل (لپ تاپ)، تلویزیون LCD، نمایشگرهاي LCD، دستگاه هاي چند رسانه اي، ضبط و پخش DVD و VCD، دستگاه هاي چندرسانه اي و بیسیم، موشواره هاي نوري و … دارد.
شرکت با این تنوع محصولات به دنبال راه هایی براي گسترش بازار هدف خود با استفاده از فناوري هاي جدید نظیر فناوري اطلاعات است. در اولین گام، براي دستیابی به اطلاعات مشتریان و رفتار خرید آنها، یک وب سایت با هدف ایجاد ارتباط با مشتري، توسعه برنامه هاي وفاداري و نظارت بر توزیع کنندگان ایجاد شد. شکل (2) قسمتی از ساختار پایگاه داده این وب سایت را نشان می دهد.
ارسال پست الکترونیکی براي اعضا که شامل اطلاعات محصولات جدید بود، اولین ابزار تبلیغاتی شرکت با استفاده از اطلاعات مشتریان است. اما محتواي این پست الکترونیکی، ارتباطی با بخش بندي مشتریان و رفتار قبلی مشتري نداشته و براي همه یکسان در نظر گرفته می شود.
در ادامه سعی می شود با پیاده سازي چارچوب پیشنهادي در این شرکت، استراتژي هایی براي طراحی کاتالوگ ها براي مشتریان مختلف در نظر گرفته شود.

جدول 3: نتایج اعتبارسنجی الگوریتم DVlw
مجموعه 10هزار آیتمی مجموعه 1000 آیتمی
زمان
DVlw
(ثانیه) زمان
GSP
(ثانیه)

ح
ط
س

ح

ط

س

ت
ش
پ
ی
ن
ا
ب

ت



قیمت: تومان


دیدگاهتان را بنویسید