Analýza chování příchozích telefonátů na call centru Petr Soukal Doktorand oboru Statistika, VŠE Praha,
[email protected] Úvod: Příspěvek se zabývá analýzou fungování call centra a popisuje zjednodušený simulační model vytvořený na základě provedené analýzy. Navržený simulační model slouží k dynamickému generování příchozích telefonátů do call centra. Cíl: Na základě simulace sledovat změny u proměnných na výstupu, které charakterizují efektivitu call centra, identifikovat statisticky významné změny a odhadnout hlavní vztahy mezi veličinami na call centru. Simulace byla záměrně zvolena, protože v realitě není možné provádět experimenty s počtem příchozích telefonátů a počtem zaměstnanců jako proměnnými na vstupu. Na základě nasimulovaných událostí jsme odhadovali vztahy a závislosti mezi jednotlivými proměnnými. Klíčová slova: call centrum, simulace, plánování směn, délka hovoru příchozích telefonátů
1 Logický popis modelu call centra
Obrázek 1 Logický model call centra Call centra se stávají velmi významným kontaktním místem pro zákazníky společností, které si dávají přívlastek zákaznicky orientované. Jsou to oddělení, jejichž zaměstnanci
(nazývaní také agenti či operátoři) odpovídají dotazy, řeší konkrétních problémy a plní požadavky zákazníků po telefonu. Existují dva základní typy: call centra pro potenciální zákazníky pouze informačního charakteru a call centra pro stávající zákazníky řešící individuální konkrétní požadavky. Právě na tuto druhou skupinu se v následujícím článku zaměříme. 1.1 Povaha agentů Předpokládejme že v rámci call centra se vyskytují tři okruhy problémů nebo dotazů, které vyžadují různé specifické znalosti agentů. Těmto „problémům“ odpovídají na straně agentů tři tzv. znalosti (skilly). Specifickými znalostmi se rozumí znalosti v oblasti produktů a softwarových aplikací ve kterých jsou uložena data o zákaznících. Agenti mají vždy přiřazenu alespoň jednu znalost, vyskytují se agenti, kteří mají i všechny tři znalosti současně. Agent, který má více znalostí je zkušenější, bývá v rámci směny více využit, má vyšší osobní ohodnocení apod.. 1.2 Povaha směn Předpokládejme že agenti pracují celkem v 6-ti směnách tak, že pokryjí pracovní dobu od 8:00 do 22:00 hodin, každý den pondělí - neděle. Tabulka 1: rozdělení směn v call centru Směna 1 Směna 2 Směna 3 Směna 4 8:00–16:30
9:30–18:00
11:00-19:30
12:00–20:30
Směna 5 12:30- 21:00
Směna 6 13:30–22:00
Pracovní doba směn je standardně 8 hodinová s půlhodinovou přestávkou na oběd resp. s půlhodinovou přestávkou na svačinu u odpoledních směn. Směna 1 nastupuje v 8:00 a končí v 16:30, směna 2 je od 9:30 do 18:00, směna 3 od 11:00 do 19:30, směna 4 od 12:00 do 20:30, směna 5 od 12:30 do 21:00, směna 6 od 13:30 do 22:00. V rámci dne se tedy vyskytuje až 11 možných intervalů, které se mohou lišit počtem agentů, v případě že jsou agenty obsazeny všechny směny. V čase od 22:00 do 8:00 hodin následujícího dne budeme předpokládat že se v call centru nikdo nevyskytuje a není jeho pracovní doba. 1.3 Povaha počtu telefonátů V realitě se denní počet příchozích telefonátů v rámci měsíce mění v závislosti na pravidelných špičkách, jako jsou vyplácené mzdy zákazníků, rozesílání výpisů k účtům zákazníků apod.. Vyskytují se rovněž jednorázové neočekávané nárůsty telefonátů způsobené např. marketingovými akcemi společnosti. V rámci tohoto článku se zaměříme pouze na pravidelnosti v počtu příchozích telefonátů během jednoho dne. Rozdělení počtů příchozích telefonátů v intervalech během dne (intradenní) se dá považovat za stabilní. Pro analýzu povahy počtu telefonátů a struktury telefonátů byla použijeme data za období 10.12.2000 – 22.12. 2000 jedné ze společností poskytujících spotřebitelské úvěry. V následující analýze vyjdeme z předpokladu, že počet příchozích telefonátů v každém z 11-ti nepřekrývajících se intervalů, které se mohou lišit počtem agentů se bude experimentálně řídit Poissonovým rozdělením s parametrem tly, t je délka intervalu ve vteřinách, ly odpovídá počtu telefonátů za jednu vteřinu, y = 1, 2,
…11. Počet telefonátů se samozřejmě v každém z 11-ti intervalů liší, jedním z důvodů je samozřejmě nestejná délka intervalů a jednak vliv intradenní sezónnosti. Sezónnost je důvodem proč má smysl rozlišovat různou intenzitu příchodu telefonátů. Proč jsme zvolili právě Poissonovo rozdělení? Tímto rozdělením se řídí počet událostí v určité časové jednotce (např. počet poruch zařízení za 100 hodin provozu, počet leteckých havárií za určitý rok, počet zákazníků vstupujících do určité stanice obsluhy za dobu 30 minut). U Poissonova rozdělení platí, že parametr tly představuje střední hodnotu počtu příchozích telefonátů za každý ze 11-ti intervalů v rámci jednoho dne. Pravděpodobnostní funkce Poissonova rozdělení Po(tly) má následující tvar:
P( X ) = e
- tl y
tl y x x!
, t > 0, x = 0,1,2,..., l > 0, y = 1,2,...,11
= 0, jinak. Existuje vztah mezi Poissonovým a Exponenciálním rozdělením umožňující modelovat nikoliv počet příchozích telefonátů, ale dobu mezi příchody telefonátů pro každý z 11-ti intervalů zvlášť. Hustota pravděpodobnosti Exponenciálního rozdělení E(dy) má tvar: -x
1 d f ( x) = .e y , x > 0, d > 0, y = 1,2,...,11 d = 0, x<= 0. Důvodem pro identifikaci rozdělení počtu příchozích telefonátů, resp. doby mezi příchody telefonátů je generování toku náhodných entit v simulaci. Pro představu uvedeme jak vypadaly empirické parametry dy v pracovních dnech mezi 11.12.2000 – 22.12.2000 v rozdělení podle 11-ti intervalů. Tabulka 2: empirické parametry dy pro uvedené dny y 1 2 3 4 5 6 7 8 9 10 11
11.12. 12,1 8,9 8,4 9,8 9,7 8,5 12,4 32,1 57,1 225,0 163,6
12.12. 11,1 7,6 9,7 10,1 11,1 10,5 14,2 33,3 63,2 85,7 171,4
13.12. 11,9 8,7 9,4 9,9 10,5 9,7 14,7 24,8 61,0 75,0 156,5
14.12. 12,1 8,6 9,0 9,7 11,2 8,5 14,7 30,0 70,6 78,3 138,5
15.12. 12,0 8,4 8,8 9,8 10,4 9,1 13,0 28,1 58,1 85,7 163,6
18.12. 10,5 8,4 9,0 10,1 8,3 8,3 11,7 21,2 49,3 78,3 124,1
19.12. 11,7 7,7 9,1 9,0 11,3 9,8 12,6 28,8 40,9 66,7 112,5
20.12. 12,9 9,0 9,0 11,5 10,9 9,9 13,0 37,5 76,6 225,0 156,5
21.12. 12,8 9,7 9,8 11,1 13,2 10,8 15,9 28,3 64,3 78,3 80,0
22.12. průměr 11,9 11,9 9,2 8,6 10,2 9,2 11,4 10,2 11,9 10,7 10,5 9,5 19,2 13,9 33,6 29,1 54,5 57,9 150,0 94,7 300,0 141,2
Pokud určíme relativní četnosti (fy, y = 1, 2, …, 11), tj. jaké procento z celkového počtu příchozích telefonátů se v průměru vyskytuje v každém z 11-ti intervalů, můžeme použít relativní četnosti k odhadu pravděpodobností výskytu telefonátů (py, y = 1, 2, …, 11) v rámci jednoho dne. Předpokládejme, že známe resp. nějakým způsobem jsme odhadli počet příchozích telefonátů n, pak není problém odhadnout střední hodnoty exponenciálního rozdělení (a zároveň parametr definující Exponenciální rozdělení)
v každém z intervalů y = 1, 2, …, 11 podle dy = (ty ve vteřinách)/n* py, y = 1, 2, …, 11. Součinem n* py získáváme odhad počtu telefonátů v intervalu y, poté co se vydělí délka intervalu (ve vteřinách) odhadnutým počtem získáváme odhad průměrné doby mezi příchody telefonátů opět ve vteřinách. Exponenciální rozdělení generující dobu mezi příchody telefonátů má tedy dynamicky se měnící parametr d v závislosti na čase (časovém intervalu). 1.4 Povaha struktury telefonátů
Předpokládejme že během dne dochází i kde změně struktury příchozích telefonátů vyžadujících u agentů různé znalosti, jinak řečeno poměr mezi jednotlivými typy telefonátů není během dne stejný ale mění se. Na základě dat z období 10.12-20.12. 2000 určíme relativních četnosti, které použijeme jako odhady pravděpodobností výskytu příchozích telefonátů jednotlivých typů (tj. telefonátů vyžadujících u agenta znalosti 1, 2, 3) v 11-ti intervalech. Shrnutí odhadovaných pravděpodobností je uvedeno v tabulce 3. Tabulka ukazuje jak se liší struktura telefonátů během dne. Tabulka 3: Odhady pravděpodobnosti výskytu telefonátů v intervalech během dne y 0:00-8:00 1- 8:00-9:30 2 - 9:30-11:00 3 - 11:00-12:00 4 - 12:00-12:30 5 - 12:30-13:30 6 - 13:30-16:30 7 - 16:30-18:00 8 - 18:00-19:30 9 - 19:30-20:30 10 - 20:30-21:00 11 - 21:00-22:00 22:00-24:00
Celkem
znalost 1
znalost 2
znalost 3
0,000 0,231 0,296 0,318 0,282 0,296 0,330 0,389 0,379 0,328 0,278 0,286 0,000
0,000 0,652 0,613 0,600 0,634 0,603 0,590 0,535 0,621 0,672 0,722 0,714 0,000
0,000 0,116 0,091 0,082 0,084 0,101 0,080 0,076 0,000 0,000 0,000 0,000 0,000
0,316
0,601
0,083
Výrazně převyšují telefonáty vyžadující u agentů znalost 2. Struktura se mění i v rámci jednotlivých intervalů. Např. v intervalu od 16:30 do 18:00 se s pravděpodobností 0,389 objeví telefonát vyžadující znalost 1, s pravděpodobností 0,535 telefonát vyžadující znalost 2 a s pravděpodobností 0,076 telefonát vyžadující znalost 3. 1.5. Povaha telefonátů čekajících ve frontě
Samozřejmě se stává že telefonát není zodpovězen okamžitě, ale až po určité době vyzvánění, kdy čeká ve frontě. Fronta má povahu FIFO, tzn. že pokud telefonát přijde a jako první čeká ve frontě tak poté co je některý agent, který má požadovanou znalost pro tento telefonát k dispozici je směrován na volného agenta. To platí ovšem za předpokladu, že zákazník vydrží čekání ve frontě tj. neukončí svůj telefonát bez získání adekvátní informace - zavěsí. Odhadněme tedy pravděpodobnosti zavěšení, tj pravděpodobnosti podmíněné dobou čekání ve frontě na odpověď. K dispozici jsou data
z intervalů (sek.) 0-5, 5-10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-45, 45-60, 60+ za druhé pololetí roku 2000 téměř 300000 telefonátů. Tabulka 4: odhad podmíněných pravděpodobností zavěšení Interval (sek.) j 0-5 5-10 10-15 15-20 20-25 25-30 30-35 35-45 45-60 60+
nj abj pj
22496718982 12779 10503 9087 7800 6897 10922 11873 24980 5019 2448 1797 1912 1399 1469 1043 2255 2970 5453 0,022 0,030 0,035 0,040 0,044 0,047 0,049 0,054 0,061 0,071
Tabulce 4 ukazuje, že za uvedené období se podařilo do 5 vteřin čekání ve frontě odpovědět na 224967 telefonátů zákazníků, od 5 do 10 vteřin se odpovědělo na 18982 telefonátů atd. Do 5 vteřin nevydrželo čekat a zavěsilo 5019 zákazníků, v intervalu čekání od 5 do 10 zavěsilo 2448 zákazníků atd. Z dat odhadneme pravděpodobnost zavěšení, neochoty zákazníka čekat na odpověď ve frontě pokud známe přibližnou dobu, kterou bude příchozí telefonát zákazníka čekat ve frontě. Pokud očekávaná doba čekání ve frontě je např. 20 vteřin, potom pravděpodobnost zavěšení v intervalu čekání 0-20 vteřin je tedy p4=(5019+2448+1797+1912)/(224967+18982+12779+10503+5019+2448+1797+1912). Čitatel obsahuje netrpělivé zákazníky, kteří nebyly ochotni čekat do 5, od 5 do 10, od 10 do 15 a ani od 15 do 20 vteřin a jmenovatel jsou všechny telefonáty, které byly do call centra směřovány a byly zodpovězeni do 5, od 5 do 10, od 10 do 15, od 15 do 20 vteřin nebo byly zavěšeni od 0 do 20 vteřin. Při výpočtu pravděpodobnosti nemá smysl brát v úvahu telefonáty zodpovězené nad 20 vteřin stejně tak jako zavěšené nad 20 vteřin, protože očekávaná doba čekání ve frontě je pouze 20 vteřin. 1.6 Povaha délky telefonátu
Kritickým parametrem ovlivňujícím fungování call centra je délka hovoru příchozího telefonátu. Předpokládejme, že délka hovoru u příchozích telefonátů různých typů se bude lišit. Např. sdělení zůstatku na účtu trvá kratší dobu než vysvětlit zákazníkovi strukturu poplatků na jeho výpise z účtu či vysvětlit zcela nový produkt atp.. Rozdělení délky telefonátu (hovoru) je pozitivně sešikmené. Během prosince 2000 došlo k sledování délky hovorů u jednotlivých typů telefonátů vyžadujících u agentů znalosti 1-3. Celkem bylo sledováno 8376 telefonátů, 2890 vyžadujících znalost 1, 4031 znalost 2, 1455 znalost 3. Dále předpokládejme že, jediným faktorem ovlivňujícím délku telefonátu je právě a pouze typ telefonátu. Délku telefonátu (hovoru) budeme aproximovat Erlangovým rozdělením, které se používá v teorii front, kde zákazníci přichází do fronty podle Poissonova procesu a je charakterizováno dvěma parametry k,l , kde k je celé číslo. Hustota pravděpodobnosti Erlangova rozdělení Er(k,l) má tvar: f ( x) =
dF ( x ) l ( x ) k -1 = le -lx ,x ³ 0 dx (k - 1)! = 0,
jinak.
E( X ) =
k k , D( X ) = 2 . Pokud x a s2 jsou l l
výběrový průměr a výběrový rozptyl, potom maximálně věrohodné odhady k a l jsou ) êx2 ú ) êx2 ú ) x k = ê 2 ú nebo k = ê 2 ú + 1 a l = 2 . s ëê s ûú ëê s ûú Tabulka 5: Délka hovoru podle typu
rozdělení délky doby hovoru - znalost 2
0,25
0,20
0,20
0,20
0,15 0,10
doba hovoru (s)
0,15 0,10
400
385
365
345
325
305
285
doba hovoru (s)
265
245
225
205
185
165
145
85
65
doba hovoru (s)
125
0,00
45
400
385
365
345
325
305
285
265
245
225
205
185
165
85
145
125
65
105
45
0,05 25
400
385
365
345
325
305
285
265
245
225
205
185
165
145
85
65
125
0,00
45
0,00
105
0,05 25
0,05
5
0,10
četnosti
0,25 četnosti
0,30
0,25 0,15
Odhad l 0,0306 0,0274 0,0359
rozdělení délky doby hovoru - znalost 3 0,30
0,30
5
četnosti
rozdělení délky doby hovoru - znalost 1
105
2890 4031 1455 8376
Odhad k 3 3 3
rozptyl 2669,8 3022,0 2209,6
25
Znalost 1 Znalost 2 Znalost 3 Celkem
průměr (sek.) 82 83 79
5
n
Obrázek 2 empirické rozdělení délky hovoru
Na obrázku 2 jsou sloupcovým grafem znázorněny výběrové relativní četnosti délky hovoru v 5-ti vteřinových intervalech podle typů hovoru a spojnicovým grafem jsou uvedeny simulované relativní četnosti (počet generovaných pokusů n = 30 000) z Erlangova rozdělení Er(k,l), nebo-li jaké by mělo být rozdělení četností pokud bychom pravděpodobnostní rozdělení délky telefonátů generovaly právě z Erlangova rozdělení Er(k,l), s odhady parametrů k,l jsou uvedeny v tabulce 5. Erlangovo rozdělení (resp. generovaná data z Erlangova rozdělení) spolehlivě kopírují empiricky zjištěné relativní četnosti. 1.7 Povaha délky ACW
ACW (after call work) představuje dobu, kterou agenti stráví nějakou činností bezprostředně po skončení hovoru a nejsou schopny přijímat další telefonáty a tento pracovní status fiktivně prodlužuje délku hovoru. Jedná se např. o evidování stížností. Status práce se nevyskytuje u každého telefonátu, ale pouze v některých případech. Odhadněme pravděpodobnosti výskytu ACW jako poměr počtu statusů ACW ku celkovému počtu zodpovězených telefonátů opět v rozlišení podle typů telefonátů. Odhady pravděpodobností u jednotlivých typů telefonátů jsou uvedeny v tabulce 6. Např. u agenta se znalostí 1 se objeví status ACW s pravděpodobností 0,3370. Tabulka 6: shrnutí status ACW Rozsah Z toho Pst. výskytu Délka ACW Výběrový výběru ACW ACW průměr (sek.) Znalost 1 2890 973 0,3370 95,7 Znalost 2 4031 1075 0,2666 101,5 Znalost 3 1455 294 0,2020 126,3 Celkem 8376 1342 A= 15
Předpokládejme, že rozdělení ACW má exponenciální rozdělení Exp(A,d), kde E(X) = A+d. Parametr A+d odhadujeme pomocí výběrového průměru. Empiricky napozorováno A = 15sek. Pokud se status objeví trvá minimálně 15 vteřin. rozdělení délky doby ACW - znalost 2
rozdělení délky doby ACW - znalost 3
0,10
0,10
0,08
0,08
0,08
0,06
0,06
doba acw (s)
380
355
400+
330
305
280
255
230
205
180
155
80
130
105
380
355
400+
330
305
280
255
230
205
180
155
80
130
105
5
55
0,00 30
380
355
400+
330
305
280
255
230
205
180
155
80
130
105
5
55
doba acw (s)
0,00
0,04 0,02
0,02 30
0,00
0,04
5
0,02
55
0,04
30
0,06
četnosti
0,10
četnosti
četnosti
rozdělení délky doby ACW - znalost 1
doba acw (s)
Obrázek 3 empirické rozdělení délky ACW
Na obrázku 3 jsou sloupcovým grafem znázorněny výběrové relativní četnosti délky ACW v 5-ti vteřinových intervalech podle typů telefonátů a spojnicovým grafem jsou uvedeny generované „teoretické“ relativní četnosti (počet generovaných pokusů n = 30 000) z exponenciálního rozdělení Exp(A,d).
2 Metodika Na základě provedené analýzy vytvoříme model call centra v simulačním jazyce MOR/DS. V článku neuvádím konkrétní zápis programu, ten je uveden v příloze mojí disertační práce. Po naprogramování a otestování logiky model využijeme k experimentálnímu generování dat. V tabulce 7 jsou uvedeny všechny významné vystupující proměnné modelu. Název vyjadřuje identifikaci proměnné v programovacím jazyce. Index udává pro jaký „typ“ proměnnou měříme. Zd je pomocný index pro identifikaci skupiny agentů s určitou množiny znalostí. Pokud zd = 1, pak skupina ovládá pouze znalost 1, pokud zd=4 pak ovládá znalosti 1 a 2 a pokud zd = 7 pak ovládá všechny tři znalosti atd.. Tabulka 7: Vystupující proměnné Název Index Popis abtotal.skill skill= 1,2,3 # nezodpovězených telefonátů dle znalostí inbound.skill skill= 1,2,3 # příchozích telefonátů, vyžadující určitou znalost = skill ar.skill skill= 1,2,3 Poměr nezodpovězených vůči příchozím využití.zd Zd = 1,2,…7 % času, které agent stráví se zákazníkem na telefonu acd.zd Zd = 1,2,…7 # přijatých (zodpovězených) telefonátů dle znalostí asa.zd Zd = 1,2,…7 Rychlost odpovědi v sekundách podle vlastnosti zdroje
Pomocí modelu jsme prováděli experimenty podle modelových schémat a měnili jsme hodnoty vstupující proměnné, které jsou pod naší kontrolou konkrétně Ø změny počtu příchozích telefonátů Ø změny celkového počtu agentů během dne Ø změny struktury obsazenosti směn Ø změny celkového počtu agentů během dne + struktury obsazenosti směn Schémata se od sebe liší buď úrovní v celkovém počtu agentů pracujících během dne
např. schéma 1, schéma 2, schéma 5, nebo celkový počet agentů zůstává stejný, zůstává stejný i celkový počet agentů ve směně, ale mění se struktura agentů podle jejich znalostí např. schéma 1 a schéma 3 experimentuje pouze s přesunem znalostí agentů během směny. Nebo zůstává stejný celkový počet agentů na den a experimentuje se s přesunem agentů mezi směnami (počet agentů během směn se liší) a zároveň s přesunem znalostí agentů např. schéma 1 a schéma 6. Nebo celkový počet agentů během dne zůstává stejný a mění se počet agentů během směn a zároveň celkový počet agentů během dne s určitými znalostmi zůstává stejný např. schéma 2 a schéma 4. Detailní popis vlastností jednotlivých schémat je nad rámec tohoto článku. Na základě těchto schémat jsme realizovaly náhodné pokusy (runy) v systému MOR/DS. Pro zvýšení přesnosti jsme pro každé schéma provedly 4 opakování a celkově jsme tedy získaly 4*6*5 = 120 realizací náhodného pokusu. Tabulka 8: schémata a počty telefonátů Počet telefonátů ve dni (experimentálně se mění) Počet opakování 3200 3400 3600 3000 2800 # agentů Schéma 1 4 4 4 4 4 22 Schéma 2 4 4 4 4 4 23 Schéma 3 4 4 4 4 4 22 Schéma 4 4 4 4 4 4 23 Schéma 5 4 4 4 4 4 24 Schéma 6 4 4 4 4 4 22
3 Výsledky a diskuze Po generování náhodných pokusů v simulačním modelu přistoupíme k jejich analýze. V praxi má manažer call centra pod kontrolou právě počet agentů, může ovlivňovat obsazenost směn, může přiřazovat agentům různé znalosti formou ad-hoc školení atd.. Cílem této analýzy je prokázat významnost těchto změn. Počet telefonátů nelze mít plně pod kontrolou, lze pouze usuzovat na předpokládaný počet příchozích telefonátů. Změny počtu příchozích telefonátů jsme použili k identifikaci citlivosti vystupujících proměnných na tyto změny. V rámci analýzy použijeme dva statistické nástroje analýzu rozptylu a regresní analýzu. 3.1 ANOVA
Základním předpokladem je, že každý z k nezávislých výběrů znaku y pochází z normálního rozdělení, přičemž změna úrovně faktoru x může vést pouze ke změně střední hodnoty, nikoliv však ke změně rozptylu tohoto rozdělení. Proto musíme vždy posoudit porušení podmínky normality a rovnosti rozptylu v podskupinách. Normalitu posuzujeme vizuálně pomocí normálního grafu, precizněji pomocí Kolmogorovova-Smirnovova testu a pokud data předpoklad nesplňují následuje některá ze systému Boxových-Coxových transformací a teprve potom přistoupíme k vlastní analýze rozptylu. Žádná z námi uvažovaných vysvětlovaných proměnných tj. rychlost odpovědi (asa), počet nezodpovězených telefonátů (abtotal) a % využití agentů (vyuziti) nesplňuje podmínky normality a proto přistupujeme k transformacím, které data normálnímu rozdělení alespoň přiblíží.
100
50
100
80
40
80
30
60
20
40
10
20
60
40
20 0
0 ,300
0 0,0
5,0
10,0
abantotal.skill
15,0
20,0
25,0
30,0
35,0
40,0
45,0
50,0
55,0
,350 ,325
vyuziti.zd
,400 ,375
,450 ,425
,500 ,475
,550 ,525
,600 ,575
,650 ,625
0,0
,700 ,675
,725
20,0 10,0
40,0 30,0
60,0 50,0
80,0 70,0
100,0 90,0
110,0
asa.zd
Obrázek 4 histogram četností netransformovaná proměnná abantotal, vyuziti, asa
V souvislosti s modelem se nabízí celá řada otázek, které mají kritický význam pro manažera a efektivitu call centra např.: A) Je významný rozdíl v počtu nezodpovězených telefonátů podle jednotlivých typů? B) Je významný rozdíl ve využití agentů podle skupin agentů s různými znalostmi? C) Je významný rozdíl v rychlost odpovědi podle skupin agentů s různými znalostmi? D) Je významný rozdíl v počtu nezodpovězených telefonátů určitého typu podle přepočítaného celkového počtu agentů1 připravených odpovídat tento typ telefonátu během dne? E) Je významný rozdíl v rychlost odpovědi určitého typu telefonátů podle celkového počtu agentů se znalostí tohoto typu telefonátu? F) Je významný rozdíl ve využití agentů podle rychlosti odpovědi na telefonát? G) Je významný rozdíl v rychlosti odpovědi na telefonát v závislosti na schématu obsazenosti směn? ANOVA či Kruskalův-Walisův test poskytují následující odpovědi. Ad A) Z analýzy rozptylu vyplývá, že existuje statisticky významný rozdíl mezi počtem nezodpovězených telefonátů a typem telefonátu (F=335). Zákazníci volající kvůli určitým typům problémů mají tedy vyšší pravděpodobnost, že se nedovolají napoprvé a budou muset volat opakovaně než zákazníci volající kvůli jinému typu problému. Ad B) Na 5-ti procentní hladině významnosti existuje statisticky významný rozdíl mezi skupinami agentů (F=344). Tj. existuje významný rozdíl ve využití agentů mezi skupinami agentů s různými znalostmi. Využitelnost je nejvyšší u skupiny 7, kde agenti ovládají všechny tři možné typy telefonátů. Tzv. multiskilled agenti jsou nejzkušenější a současně i nejvíce využití agenti na call centru. Tato skutečnost se tedy oprávněně projevuje i v jejich osobním mzdovém ohodnocení. Ad C) F–test (F=5,38) signalizuje, že existuje statisticky významný rozdíl u rychlostí odpovědi mezi různými skupinami agentů (skupin agentů ovládajících znalosti různých typů telefonátů) a to na 5-ti procentní i nižší hladině významnosti. Multiple range test zároveň ukazuje, že rychlost odpovědi u skupiny 7 tzv. multiskilled agenti je ve srovnání se skupinou 4 statisticky významně horší. 1
Průměrným přepočítaným počtem agentů se rozumí počet agentů kteří jsou během dne v průměru k dispozici zodpovídat telefonáty daného typu. Např. 1 agent, který ovládá znalosti 1,2,3 je na denním průměru k dispozici právě 1/3 u každého typu telefonátu.
Ad D) Pokud provádíme podmíněnou analýzu, která se týká pouze telefonátů typu 1, potom analýza rozptylu tvrdí, že neexistuje statisticky významný rozdíl v počtu nezodpovězených telefonátů typu 1 mezi různými hodnotami přepočítaného celkového počtu agentů připravených odpovídat telefonáty typu 1. Závěr je důsledkem relativně malých, nevýznamných změn v přepočítaném počtu agentů připravených zodpovídat tento typ telefonátu. Analýza rozptylu prokazuje statisticky významný rozdíl u typu telefonátu 2 mezi počtem nezodpovězených telefonátů a přepočítaným počtem agentů. Pokud provádíme podmíněnou analýzu pouze telefonátů typu 3, potom neexistuje statisticky významný rozdíl mezi počtem nezodpovězených telefonátů a přepočítaným celkovým počtem agentů připravených odpovídat tento typ telefonátu. Důvodem je pravděpodobně opět nedostatečně velká změna přepočítaného počtu agentů. Počet nezodpovězených telefonátů typu 1 a 3 není citlivý na relativně malé změny v přepočítaném počtu agentů. Nutno podotknout, že přepočítaný počet agentů je umělá kategorie, která v realitě call centra nemá smysl. Počet nezodpovězených telefonátů se totiž vztahuje k typu telefonátu a nikoliv ke skupině agentů jako ostatní veličiny výstupu. Ad E) Analýza rozptylu potvrzuje statisticky významné rozdíly (F=13,8) v rychlostí odpovědi u skupiny 4 (agenti ovládající znalosti 1 a 2) mezi různým celkovým počtem agentů ve skupině 4. Analýza rozptylu potvrzuje statisticky významné rozdíly (F=8,8) v rychlostí odpovědi u skupiny 6 (agenti ovládající znalost telefonátů typu 2 a 3) v závislosti na různém celkovém počtem agentů ve skupině 6 a rovněž potvrzuje statisticky významné rozdíly (F=3,94) v rychlostí odpovědi u skupiny agentů 7 (agenti ovládající znalost telefonátů typu 1, 2, 3) v závislosti na celkovém počtu agentů ve skupině 7. Z této analýzy vyplývá, že rychlost odpovědi je statisticky významně citlivá na měnící se počet agentů u všech jejich skupin. Ad F) Analýza rozptylu na 5% hladině významnosti prokázala existenci závislosti ve využití agentů mezi různými rychlostmi odpovědi na telefonát (F=1,49). Existuje tedy významný vztah čím vyšší využití agentů tím je nižší rychlost odpovědi. Ad G) F-test (F=7,4) indikuje statisticky významný rozdíl v průměrné rychlosti odpovědi mezi jednotlivými pracovními schématy na 5% i nižší hladině významnosti. Má tedy význam provádět změny v obsazení směn. Pomocí Multiple Range testu vyšetřujeme vzájemné vztahy mezi jednotlivými schématy obsazenosti směn. Významný rozdíl je mezi schématem 1 (22 agentů) a schématem 4 (23 agentů), mezi schématem 1 (22 agentů) a schématem 5 (24 agentů), schématem 2 (23 agentů) a schématem 5 (24 agentů), schématem 3 (22 agentů) a schématem 5 (24 agentů), schématem 4 (23 agentů) a schématem 5 (24 agentů), schématem 6 (22 agentů) a schématem 5 (24 agentů). Všechny rozdíly vůči schématu 5 (24 agentů) jsou statisticky významné. Dále je vidět, že nejsou statisticky významný rozdíly mezi schématy, která zachovala celkový počet agentů stejný a měnila se pouze struktura počtu typů agentů uvnitř směn např. schémata 1, 3, 6 (22 agentů) nebo schémata 2, 4 (23 agentů). Pokud chce manažer call centra zvýšit statisticky významně výkonnost svého procesu charakterizovanou průměrnou rychlostí odpovědi, měl by provádět změny, které povedou ke zvýšení celkového počtu lidí během dne v nejexponovanějších směně, jelikož změny ve struktuře vlastností u agentů, či pouhé změny v počtu agentů v jednotlivých směnách, při zachování stejného celkového počtu agentů ve dni nevedou k významným rozdílům v rychlosti odpovědi jako charakteristice výkonu call centra.
3.2 Regresní analýza
Před vlastní analýzou by měl být ověřen předpoklad o normalitě a předpoklad o stejných rozptylech. Nepatrné odchylky od normality většinou nebrání vícerozměrné analýze a transformací dat bychom ztratili možnost snadné interpretace odhadnutých parametrů a k transformaci dat nepřistoupíme. V rámci provozu call centra je klíčové odpovědět na následující otázky: A) Jak lze kvantifikovat závislost mezi počtem nezodpovězených telefonátů (jako závislá proměnná) a počtem příchozích telefonátů a průměrného přepočítaného počtu agentů (jako vysvětlující proměnné), pokud taková závislost existuje? B) Existuje kvantifikovatelná závislost mezi rychlostí odpovědi (závislá proměnná) a počtem agentů a počtem přijatých telefonátů? C) Má smysl měnit počet agentů ve směnách a pokud ano jaký je kvantifikovatelný vliv změny na rychlost odpovědi? Ad A) Analýzu pro telefonát typu 1 ukazuje že na 5% hladině významnosti jsou odhady parametrů modelu statisticky významné a statisticky významný je i model jako celek (F=94,7). Model Abtotal=-0,428994 + 0,0439465*inbound-4,41488*avg_staff (1) (0,9596) (0,00) (0,00) popisuje 61,18% variability nezodpovězených telefonátů typu 1. Pro telefonáty typu 2 jsou na 5% hladině významnosti odhady parametrů modelu statisticky významné a statisticky významný je i model jako celek (F=179). Model Abtotal=1,10897+0,0489276*inbound-7,69536*avg_staff (2) (0,9405) (0,00) (0,00) popisuje 74,95% variability nezodpovězených telefonátů typu 2. Pro telefonáty typu 3 je na 5% hladině významnosti odhad parametru u počtu příchozích telefonátů statisticky významný, parametr u přepočítaného počtu agentů není statisticky významný. Nevýznamnost pravděpodobně způsobuje minimální variabilita hodnot znaku (existují zde pouze tři obměny). Statisticky významný je model jako celek (F=18,28). Model Abtotal=-4,43269+0,0379246*inbound-0,377051*avg_staff (3) (0,2841) (0,00) (0,5256) popisuje 22,5% variability nezodpovězených telefonátů typu 3 což je nejméně ze všech podmíněných modelů. Stejnou analýzu můžeme provést bez ohledu na typ telefonátu pro všechny typy telefonátů celkem. Potom na 5% hladině významnosti jsou odhady parametrů modelu statisticky významné a statisticky významný je i model jako celek (F=747). Model Abtotal=43,6611+0,0283486*inbound-8,04151*avg_staff (4) (0,00) (0,00) (0,00) popisuje 80,61% variability všech nezodpovězených telefonátů. Regresní analýzy poskytují výsledky v souladu s logikou modelu. Nárůst příchozích telefonátů ovlivňuje počet nezodpovězených kladně, tzn. čím více příchozích telefonátů tím více nezodpovězených telefonátů. Nárůst celkového počtu příchozích telefonátů o 100 způsobí v průměru nárůst počtu nezodpovězených telefonátů o odhadnutou hodnotu parametru*100. Průměrný přepočítaný počet agentů, kteří jsou k dispozici odpovídat telefonáty působí negativně. Čím více agentů, tím méně nezodpovězených telefonátů.
Pokud vzroste počet agentů o jednoho, dojde k poklesu nezodpovězených telefonátů o odhadnutou hodnotu parametru. U celkového modelu bez rozlišování typu telefonátů, se projevuje efekt tzv. multiskilled agentů, kteří jsou schopni zodpovídat telefonáty různých typů. (pokles o 8 vs. ostatní poklesy). Ad B) Tabulka 9: závislost asa na celkovém počtu agentů a počtem přijatých telefonátů skupina Rovnice F Adj. R2 asa = 47,8687 - 14,2545*total pocet + 0,0666184*acd 17,6 21,8% 4 (0,00) (0,00) (0,00) asa = 29,3737 - 18,944*total pocet + 0,156574*acd 6 18,8 23,1% (0,01) (0,00) (0,00) asa = -4,88245 - 7,44992*total počet + 0,0619468*acd 45,4 42,7% 7 (0,88) (0,00) (0,00) asa = 31,6714 - 10,7422*total pocet + 0,0640959*acd celkem 67,5 27,0% (0,00) (0,00) (0,00) V tabulce 9 je shrnutí analýzy, zda-li existuje kvantifikovatelná statisticky významná závislost mezi rychlostí odpovědi (závislá proměnná) celkovým počtem agentů ve skupině či celkem a počtem zodpovězených telefonátů touto skupinou agentů či celkem. Analyzované modely jsou statisticky významné na 5% i nižší hladině významnosti a zároveň i všechny odhady parametrů jsou na této hladině významnosti statisticky významné. Modely popisují od 21,8% do 42,,7% variability rychlosti odpovědi. Znaménková orientace odhadnutých parametrů je v souladu s logikou fungování call centra. Pokud narůstá počet agentů, rychlost odpovědi klesá, pokud narůstá počet přijatých (zodpovězených) telefonátů rychlost odpovědi na ně se prodlužuje. Ad C) Provedli jsme vícenásobnou regresi mezi rychlostí odpovědi a pěti vysvětlujícími proměnnými acd a sm_1, sm_2, sm_3, sm_4 které představují úhrnný počet typů agentů v 8,5 hodinových směnách od 8:00, 9:30, 11:00, 12:00. Zbývající dvě směny v modelu nejsou zahrnuty kvůli neexistenci variability v těchto směnách. Odhadnutá rovnice modelu je asa = 54,22 + 0,06*acd - 18,7*sm_1 - 12,1*sm_2 - 8,3*sm_3 - 4,2*sm_4 (5) (0,00) (0,0) (0,0) (0,0) (0,0) (0,48) Na 5% i nižší hladině významnosti existuje statisticky významná závislost mezi rychlostí odpovědi celkovým počtem přijatých telefonátů a počtem agentů ve směnách. Model popisuje 24,53% variability rychlosti odpovědi. Odhad parametru patřící proměnné sm_4 není statisticky a proto proměnnou z modelu odstraníme. Po vyloučení proměnné sm_4 získáváme rovnici asa = 55,70 + 0,058*acd - 19,28*sm_1 - 11,9*sm_2 - 9,26*sm_3 (6) (0,0) (0,0) (0,0) (0,0) (0,0) kde odhady parametrů jsou statisticky významné na 5% i nižší hladině významnosti a stejně tak F-test. Odhadnuté parametry modelu jsou opět v souladu s logikou fungování call centra. Pokud chceme zlepšit celkovou denní průměrnou rychlost odpovědi můžeme ji ovlivňovat posilováním počtu agentů v směnách 1, 2 nebo 3. Za jinak nezměněných podmínek posílení první směny o jednoho agenta sníží průměrnou denní rychlost odpovědi o 19,28 vteřiny atd..
4 Závěr V tomto článku jsme nastínili možnosti popisu procesů call center a vytvořili jejich zjednodušený logický model, kde jsme identifikovaly kritické faktory ovlivňující efektivitu call centra (odstavec 1). Na základě popsaných pravidel, identifikaci klíčových faktorů a po vytvoření modelu v simulačním jazyce jsme realizovali náhodné pokusy (odstavec 2) jejichž výsledky jsme použili jako vstup pro analýzu vztahů a souvislostí a odhadu závislostí (odstavec 3). Jako nástroje jsme použili analýzu rozptylu a s ní související statistické testy a regresní analýzu. Potvrdili jsme si intuitivně očekávané interakce mezi vstupujícími a vysvětlovanými proměnnými a odhadly očekávané stochastické vztahy mezi vystupujícími a vysvětlovanými proměnnými. Odhadnuté regresní rovnice slouží manažerovi call centra, který provádí změny v obsazenosti a struktuře směn k vytvoření představy, jaké budou mít jeho opatření očekávané dopady do chodu a efektivity call centra, pokud se podmínky generující tento model nezmění.
Literatura [1] Řehák J., Řeháková B.: Analýza kategorizovaných dat v sociologii. Praha, Academia, 1986 [2] Hebák P., Kahounová J.: Počet pravděpodobnosti v příkladech. Praha, SNTL, 1988 [3] Curry G.L., Deurmeyer B.L., Feldman R.M.: Discrete Simulation-Fundamentals and Microcomputer Support. Oakland, Holden-Day, 1989 [4] Hušek R., Lauber J.: Simulační modely. Praha, SNTL, 1987 [5] Hindls R., Kaňoková J., Novák I.: Statistické metody. Praha, VŠE, 1995 [6] Arlt J.: Moderní metody modelování ekonomických časových řad. Praha, Grada Publishing, 1999 [7] Marek L.: Statistika v SPSS časové řady. Praha, VŠE, 1995 [8] Řezanková H.: Analýza kategoriálních dat pomocí SPSS. Praha, VŠE, 1997 [9] SPSS Base 9.0 for Windows User Guide. SPSS Inc., 1998 [10] Arltová M., Matušů M., Kozák J.: Statgraphics Plus for Windowsi. Praha, VŠE, 2000 [11] Kozák J., Hindls R., Arlt J.: Úvod do analýzy ekonomických časových řad. Praha, VŠE, 1994 [12] Čermák V.: Diskrétní a spojitá rozdělení vzorce, grafy, tabulky. Praha, VŠE, 1993 [13] Cipra T.: Analýza časových řad s aplikacemi v ekonomii. Praha, SNTL, 1986 [14] Fiala P.: Vícekriteriální rozhodování. Praha, VŠE, 1996 [15] Seger J.: Statistické metody pro ekonomy průmyslu. Praha, SNTL, 1988 [16] Hebák P., Hustopecký J.: Vícerozměrné statistické metody s aplikacemi. Praha, SNTL , 1987 [17] Sborník FIS. Praha, VŠE, 2001
[18] Statistics, Mathematics Information Newsletter. http://www.daa.com.au [19] Erlang Distribution:Description and Case Study. http://www-groups.dcs.stand.ac.uk/~history/Mathematicians/Erlang.html [20] Kolmogorov-Smirnov Goodness-of-Fit test. http://www.itl.nist.gov/div898/handbook/eda/section4/eda43.htm
[21] Statsoft Glossary.http://www.statsoft.com/textbook/