Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
VÁSÁRLÓI TRENDEKEN ALAPULÓ SZAKÉRTŐI RENDSZER AN EXPERT SYSTEM BASED ON CUSTOMER TRENDS
Lengyel Zoltán Debreceni Egyetem, Informatikai Kar Összefoglaló A célunk egy olyan vásárlói adatokra, vásárlási szokásokra épülő (szakértői) rendszer elkészítése volt, mely csoportosítja a vásárlói tendenciákat, és javaslatot ad, hogy mire lehet szüksége az azonos trendeket követő, de még "korábbi fázisban" lévő vásárlónak. Ez lehetőséget nyújt rejtett vásárlói potenciák kiaknázására, hiszen a tapasztalat azt mutatja, hogy sok esetben a vásárló nem is ismeri azokat a termékeket, amelyekre leginkább szüksége lenne. A rendszer adatbányász algoritmusok és egy szakértői rendszer ötvözete, mely tervezésekor azt is figyelembe vettük, hogy az egyes termékek, illetve termékcsaládok között különböző kapcsolatok állhatnak fenn. Mivel a rendszert egy hi-tech eszközöket fejlesztő, gyártó és forgalmazó vállalat igényeire szabtuk, figyelembe kellett vennünk azt is, hogy a termékek korosodhatnak, elévülhetnek, valamint újabb termékek válthatják ki.
Kulcsszavak Szakértői rendszer, adatbányászat, vásárlói trendek, marketing
Abstract We wanted to develop an expert system that uses customer data and customer habits to group them into trends in order to advice products. The system try to match the client to a trend and based on sales information it figures out what the customer most likely will need next time. This makes it possible to explore hidden sales opportunities since, based on our experiences, customers do not even know those products that they would need the most. The system is a hybrid solution of data mining algorithms and an expert system. In the design we also considered that there can be relationships between different products and product families. Since the system is designed for a company that is developing, producing and selling hi-tech tools we also had to take into account that the products can become forfeited and can be replaced by newer ones.
Keywords Expert system, data mining, customer trends, marketing
1
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
1. Probléma leírása Napjainkban a kéretlen reklám egyre nagyobb problémát jelent az élet minden területén. Ezek tömegesen az ingyenes csatornákon keresztül (például e-mailek formájában) jutnak el hozzánk, de hagyományos postaládáink is egyre gyakrabban telnek meg különféle szórólapokkal. Egyes új cégek a gyors felfutás reményében reklámoznak, hogy minél hamarabb minél nagyobb vásárlói körre tehessenek szert. Ugyanakkor nagy vásárlói körrel és széles termékválasztékkal rendelkező cégek esetében a marketing tevékenység egyik fő feladata a vásárlók megfelelő tájékoztatása az új, illetve a már meglévő termékekről. Meglehetősen nehéz megtalálni az egyensúlyt, hogy az ügyfelek tájékoztatva legyenek, de mégse érezzék feleslegesnek, netán idegesítőnek a számukra nyújtott információt. Erre a problémára kívántunk kifejleszteni egy megoldást, mely segítséget nyújt az adott ügyfelet nagy valószínűséggel érdeklő termékek kiválasztásában. Ezzel elkerülhető az ügyfelek elárasztása spam-mel, mely nem csak számukra kellemetlen, de nyereségkiesést is okozhat a cégnek, amennyiben a potenciális vevő elpártol a kéretlen reklám miatt. 2. Szakértői rendszerek Az első szakértői rendszerek fejlesztése az 1960-as években kezdődtek, míg az 1980-as években már a kereskedelmi forgalomban is megjelentek. A legkorábbi és egyben az egyik legismertebb szakértői rendszer írását támogató eszköz a Prolog, mely saját nyelvvel rendelkezik az ismeretek leírására. Egy ilyen rendszer feladata nem a szakértő helyettesítése, hanem annak munkájának megkönnyítése. Általában interaktív módon lehet vele kommunikálni, mely során a program nem csupán eredményeket közöl, hanem képes értelmezhető érvelésekkel is alátámasztani azokat. Következtetéseit az úgynevezett tudásbázis alapján hozza, mely tartalmazza az adott szakterület ismereteit, heurisztikáit. Ezek rendszerezése és a számítógép számára könnyen felhasználható formába történő átírása a tudásmérnök feladata, aki az ismeretanyag feltérképezése érdekében gyakran konzultál tárgyköri szakértőkkel.
1. ábra - Szakértői rendszer felépítése
2
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
2.1. Szabály alapú rendszerek A szabály alapú rendszerek az ismeretek leírására „ha …, akkor …” típusú kapcsolatokat definiálnak, míg a levezetés menete kétféle lehet a szabályok alkalmazásának irányától függően. Célvezéreltnek nevezzük a módszert, ha a célállapotból kiindulva igyekszünk azt visszavezetni a rendszer által ismert tényekre illetve már korábban igazolt állításokra. Ezzel szemben adatvezérelt eljárásról beszélünk, ha a kezdőállapotból kívánjuk elérni a feltételezett célállapotot. A tudásbázis egyszerű szerkezete előnyös az adatbányászati eljárásokkal való ötvözés során. Az egyes ügyfelek trendekbe sorolására adatvezérelt módszerek alkalmasak. 2.2. Leíró logikák Az 1970-es évek végén Brachmann fejlesztette ki (Brachmann, 1977). A leíró logikák egy ismeretábrázolási nyelvcsaládot alkotnak, melynek közös építőkockái a fogalmak, individuumok és szerepek. A fogalom individuumok egy halmazát jelenti, amely rendelkezhet tulajdonságokkal, melyeket a halmazba tartozó minden egyes individuum örököl. A szerep individuumok közötti bináris relációk leírására szolgálnak. Az ismeretábrázolás két szinten valósul meg: egyrészt terminológia szintjén definiáljuk a fogalmakat és a szerepeket, másrészt tények szintjén felsoroljuk az egyes fogalmakhoz tartozó individuumokat és a szerepekhez tartozó individuum párokat. Egy leíró logikai rendszer ismeretbázisában elsőrendű állításokat is megfogalmazhatunk, melynek köszönhetően komplex tárgykörök is egyszerűen megfogalmazhatóak. 3. Adatbányászat Az 1960-as évektől kezdve az információ technológia kis lépésekben ugyan, de egyre nagyobb teret hódított meg. Az 1970-es évektől kezdve folyamatos adat- és információkezelő rendszerekre irányuló kutatások eredményeképpen már az 1980-as években megjelentek a fejlett adatbázisrendszerek és ezzel párhuzamosan felmerült az igény az adatok rendszerezésére és a benne rejlő tudás feltárására. Mára már minden közép- és nagyvállalat saját informatikai rendszerrel rendelkezik, és legtöbbjük nem csak tárolja a historikus adatokat, hanem adatbányászati módszerekkel elemzi is azokat.
2. ábra - A tudás feltárásának folyamata
3
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
3. ábra - Adatbányászati rendszer felépítése
3.1. Társítási szabályok keresése Ezt az adatbányászati irányt a vásárlói szokások elemzése ihlette. Tipikus példa a vásárlói kosarak vizsgálata, amikor is kíváncsiak vagyunk, hogy milyen termékcsomagokat vásárolnak a vevők. Az így kapott eredmény felhasználható marketing célokra, vagy akár az áruházon belül a termékek elhelyezésének tervezésénél is. A felismert együtteseket társítási szabályokkal írhatjuk le, melyekhez úgynevezett megalapozottsági valamint megbízhatósági mutatókat is rendelhetünk. Megalapozottság alatt annak a valószínűségét értjük, hogy a két termék vagy termékcsoport együttesen megvásárlásra kerül, míg a társítási szabály megbízhatósága azt mutatja meg, hogy adott termék megvásárlása esetén mekkora annak valószínűsége, hogy a másik is kosárba kerül. Ahhoz, hogy csak az érdekesebb kapcsolatokkal kelljen foglalkoznunk, mindkét valószínűséghez minimális küszöbszintet szokás definiálni. A mi esetünkben a termékek közötti kapcsolatok jó része a termékek kompatibilitása miatt ismert, azonban további hasznos információhoz juthatunk a vásárlói kosarak vizsgálatával. Ugyanakkor nagy értékű, tartós árucikkekről lévén szó, nem elegendő az egyszeri vásárlások elemzése, hanem érdemes az egyes vevők összesített vásárlásait is vizsgálat alá vetni. 3.2. Osztályozás és előrejelzés Az osztályozás egy adott attribútum, úgynevezett osztályozási címke attribútum előrejelzésére alkalmas kétlépcsős folyamat. Először modellt alkotunk a meglévő adatok alapján, melyet szabályok vagy döntési diagramok segítségével fogalmazhatunk meg. Ezt a szakaszt felügyelt tanulásnak is nevezik ugyanis a megbecsülni kívánt attribútum minden, a tanuláshoz használt minta esetében ismert, azaz meg van határozva, hogy melyik osztályba tartozik. A második fázisban a mintát használjuk a címke attribútum előrejelzésére. A technika egyik legfontosabb mérőszáma a pontosság, mely megadja, hogy adott ellenőrző halmaz esetén milyen arányban felelt meg az előrejelzés a tényleges értéknek. A módszer alkalmas például egy tervezett leárazás, vagy új termék bevezetéséről szóló promóciós csomag címzettjeinek megválasztásához, hiszen osztályozás segítségével
4
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
megbecsülhetjük, hogy kik azok, akik valószínűleg vásárolni fognak a meghirdetett termékből. Ezzel költségeket lehet megtakarítani, valamint elkerülhető a vevők, számukra érdektelen információkkal való zaklatása. 3.3. Klaszterelemzés Míg az osztályozó módszerek esetében ismertek az osztályok, a klaszterezésnél ez az információ nem áll rendelkezésre. A csoportosítást ebben az esetben az egyes minták hasonlósága határozza meg, az egy csoportba tartozó minták együttesét pedig klaszternek nevezzük. Ezt a módszert, a tényleges csoportok előzetes ismeretének hiányában, szokás felügyelet nélküli tanulásnak is nevezni. A klaszterelemzés egy természetes emberi tanulási forma: a kisgyerek is ilyen módszer segítségével tanulja meg megkülönböztetni a különféle tárgyakat, élőlényeket. Az üzleti életben a klaszterelemzés különösen hasznosnak bizonyul különálló vevői csoportok felfedezésében és vásárlási minták alapján történő meghatározásában. 4. Felmerülő kérdések 4.1. Milyen kérdésekre várunk választ?
Egyik gyakori kérdés, hogy kinek küldjünk prospektusokat, termékleírásokat az újonnan piacra kerülő termékekről. Egyes cégek úgy vélik a legjobb megoldás az, ha mindenki kap róla értesítést, mondván így biztosan senki nem marad ki. Ezzel azonban pont az ellenkező hatást érik el, ugyanis a rendszeres „felesleges reklám” között elkerülheti a potenciális vásárló figyelmét a számára hasznos információ, vagy rosszabb esetben az ügyfél leiratkozik és átpártol egy másik, hasonló termékeket kínáló céghez. Ebből is érezhető, hogy a megfelelő marketing nagyban befolyásolja a cég bevételeit. Ahhoz hogy ezt a fontos kérdést megválaszolhassuk, tisztában kell lennünk a termékek közötti kapcsolatokkal, valamint figyelembe kell vennünk a vásárlói szokásokat, például hogy általában milyen vevők, mennyi idő elteltével vásárolnak az adott termékcsoportból. Egy ellentétes irányú kérdésnek tekinthető, amikor arra vagyunk kíváncsiak, hogy mely termékeket érdemes az adott ügyfél figyelmébe ajánlani. A projekt keretében egy olyan cégnek készítünk üzleti megoldást, mely palettáján több mint 1000 termék szerepel, ezért egyértelmű, hogy az üzletkötő nem nyomhat az érdeklődő kezébe egy vaskos katalógust, mondván „ezeket a termékeket ajánlanám önnek”. E kérdés megválaszolásához hasonló információkra lesz szükségünk, azaz a vásárlói szokások (más néven trendek), illetve a termékek közötti kapcsolatok ismeretére.
4.2. Mi képezi a tudásbázist?
Legfontosabb építőkockáink az értékesítési adatok. Ezekből adatbányászati eljárások segítségével vásárlói trendeket figyelhetünk meg és különíthetünk el. Ezeknek a trendeknek lehetnek szakaszai, például egy újonnan induló cég kezdetben kisszámú, olcsóbb termékeket vásárol, de ahogy idővel növekszik, egyre nagyobb és értékesebb megrendelésekre lehet tőle számítani. Így a vásárló fejlődését nyomon követve előre tudhatjuk, hogy mikor milyen termékre lesz szüksége, ezért figyelembe kell vennünk az ügyfél egyéb „leíró” adatait is. A termékek a legtöbb gyár esetében több szempont szerint is hierarchiába szervezhetőek. Ezeket a szempontokat felkutatva, megalkothatjuk a termékek egy
5
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
komplex hálóját. Ez bizonyos szintű absztrakciót tesz lehetővé, ezzel is segítve a különféle trendek feltárását és csoportosítását. Például, ugyanaz a cég kínálhat azonos funkciójú, de különböző platformra épülő termékcsaládokat, melyek között ár, teljesítmény és egyéb különbségek lehetnek. Ezeket a kapcsolatokat feltárva a trendeket is absztrakciós szinten fogalmazhatjuk meg. 4.3. Milyen szabályok alapján következtetünk?
A legfontosabb szabályainkat a trendek rögzítik. Ezek nemcsak termékek közötti kapcsolatokat, de időbeli információkat is tartalmaznak. Figyelembe lehet venni az aktuális gazdasági „hangulatot” is. Például megfigyelhető, hogy a negyedévek végéhez közeledve általában növekszik a vásárlási kedv, mely csúcspontját rendszeresen az év végéhez közeledve éri el. De ide sorolható például az időnként előforduló recesszió is, melynek hatása a gazdaság minden szintjén érezhető. Habár ez előre nem tervezhető, a jelenlegi gazdasági „hangulattal” érdemes lehet számolni. Például recesszió idején inkább a költséghatékonyságra kell fektetni a hangsúlyt a javasolt termék megválasztásakor.
5. Létező rendszerek 5.1. Google.com A jelenleg legismertebb webes keresőoldal felületén, a találati lista tetején szponzorált linkek találhatóak, melyek a keresési kulcsszavak alapján próbálnak a felhasználó számára valószínűleg érdekes hirdetéseket megjeleníteni. Ez a hagyományos reklámcsíkoknál nyilvánvalóan jóval hatékonyabb módszere a webes marketingnek.
4. ábra – A Google kereső találtai oldala szponzorált linkekkel
Az ismeretbázis felépítéséhez és folyamatos fejlesztéséhez a Google különféle mesterséges tanulási eljárásokat alkalmaz. Mivel a keresőoldal a felhasználóról az esetek többségében semmilyen információval nem rendelkezik, az ügyfelek csoportosítása nem megvalósítható. 5.2. Amazon.com Manapság már az on-line áruházak nagy részénél megfigyelhető a statisztikai alapon történő árukapcsolás, melynek egyik legismertebb példája az Amazon. Az ilyen rendszerekben a termékek közötti kapcsolatot nem kulcsszavak alapján építik fel (pl. két
6
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
könyv szerzője azonos), hanem vásárlói szokások alapján kiválasztják azokat a termékeket, melyeket az ügyfelek a leggyakrabban vásárolnak együtt.
5. ábra - Az Amazon oldalain látható vásárlói szokásokon alapuló termékajánlat
Az ehhez szükséges ismeretek összegyűjtése történhet a vásárlói kosarak elemzésével, vagy akár a korábbi megrendelések figyelembe vételével is. Tekintve azonban, hogy az online áruházak a lehető legkevesebb információval bírnak a megrendelőről, a vásárlók megfelelő csoportosítása nem lehetséges. 5.3. Millennium Consultants, Inc. A Millennium Consultants, Inc. egy amerikai cég, amely vállalja olyan adatbányászati módszereken alapuló üzleti rendszerek kiépítését, mely segít felkutatni a vásárlói trendeket és a „rejtett mintákat”. A rendszer segítségével a vállalatok már korai szakaszában felismerhetik az legújabb szokásokat, ezáltal elkerülhetik a komolyabb visszaeséseket az értékesítés területén, ugyanakkor hatalmas előnyre tehetnek szert a piacon az újabb trendek ismeretében. A cég ígérete szerint az adatbányászat eredményeként nemcsak a gyorsan változó divat, de a hosszú távú vásárlói tendenciák is napvilágra kerülnek. Magáról a technológiáról, ami nyilvánvalóan üzleti titok, nem sok mindent árulnak el, de annyi világos hogy tisztán adatbányászati módszereket használnak, melynek eredményei segítséget nyújtanak a döntéshozatalban. Bővebb információ az http://www.millenniumci.com/new/data-analysis.htm honlapon található. 5.4. Marketing stratégia tervezése Ebben a témakörben már számos különféle rendszer és esettanulmány látott napvilágot, többek között Belardo, Duchessi és Coleman (Belardo et al., 1994), Carlsson, Walden és Kokkonen (Carlsson et al., 1996) valamint Li (Li, 2000) publikáltak marketing stratégia tervező alkalmazásokat. Ezen a területen is előszeretettel ötvözik az adatbányászat eszközeit szakértői rendszerekkel. A stratégia tervezésénél azonban általános piaci tényezőket vesznek figyelembe, és így a végeredmény is egy általános stratégia lesz. Ezek a rendszerek a felsővezetők dolgát könnyítik meg a döntéshozatalban, és nem képesek javaslatot tenni egyegy speciális vevő esetében. 6. Célkitűzés Az általunk tervezett szakértői rendszer értékes javaslatokkal segíti a marketing csapatot adott reklámanyag címzettjeinek összeválogatásában, amely ugyanakkor képes kiválasztani az adott ügyfelet nagy valószínűséggel érdeklő termékek listáját egy széles vásárlói körrel rendelkező több mint 1000-féle terméket gyártó cég számára. A rendszer a mérés és
7
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
automatizálás technológiák területén jól ismert cég, a National Instruments Corp. 1 (NI) igényeire lett hangolva. Mivel az NI vásárlóinak (profit tekintetében) többsége a nagyvállalati szférából kerül ki, meglehetősen sok és részletes információval rendelkezünk a vásárlókról, mely lehetővé teszi azok részletes és megbízható csoportosítását, trendekbe sorolását. Természetesen sok kis- és középvállalat is érdeklődik az NI termékei iránt, melyeknek a trendekre illesztése néha információ hiányában problémás. Irodalomjegyzék [1]
Belardo S., Duchessi P., Coleman J. R. (1994) A strategic decision support system at Orell Fussli. Journal of Management Information Systems, 10(4), 135-157.
[2]
Brachmann, R. J. (1977) What's in a Concept: Structural Foundations for Semantic Networks. Int. Journal of Man-Machine Studies, 9, 127-152.
[3]
Carlsson C., Kokkonen O., Walden P. (1996) Effective Strategic Management with Hyperknowledge: The Woodstrat case. The Finnish Paper and Timber Journal, 78(5), 278-290.
[4]
Li S. (2000) The Development of a Hybrid Intelligent System for Developing Marketing Strategy, Decision Support Systems, 27(4), 395-409.
1
A National Instruments 1976 óta foglalkozik mérés és automatizálás technológiai eszközök fejlesztésével,
gyártásával és értékesítésével. Termékei forradalmi megoldásokat nyújtanak számos iparágban tevékenykedő megrendelőinek (pl. telekommunikáció, gépjárműipar, űrkutatás, repülőgépgyártás, szórakoztató elektronika). Bővebb információ a http://www.ni.com weboldalon található.
8