FAKTORY OVLIVŇUJÍCÍ PŘÍMÉ VÝDAJE DOMÁCNOSTÍ NA ZDRAVÍ FACTORS AFFECTING THE DIRECT HOUSEHOLD EXPENDITURES ON HEALTH
Jitka Bartošová
Abstract This paper focuses on the search of factors affecting direct Czech household spending on health and the analysis of the degree of influence of individual factors on the total amount. Given the aging population can be expected as the growing trend of these expenditures. This trend can be expected, of course, not only in direct costs (for drugs and services not paid by insurance), but also indirect costs, realized through the utilization of health care and public health insurance system in general. The amount of health insurance depends on the amount of revenue; direct costs may be influenced by other factors such as age, sex and education of head of household, etc. They may also be related to consumption patterns and household behavior, such as its expenditures on alcohol cigarettes, etc. Keywords: household, regression analysis, consumer behaviour, spending, health Klíčová slova: domácnost, regresní analýza, spotřební chování, výdaje, zdraví
Úvod Výdaje na zdraví jsou velmi diskutovaným a citlivým tématem současnosti z hlediska státu i z hlediska jedince. Celkové výdaje na zdraví lze rozdělit na výdaje přímé – hrazené z rozpočtu domácností a nepřímé - hrazené ze zdravotního pojištění a veřejného systému obecně. Vzhledem ke stárnutí populace lze očekávat trvalý růst obou složek těchto výdajů, proto je důležité vědět, které faktory ovlivňují přímé, popřípadě nepřímé výdaje na zdraví a v jaké míře se na jejich velikosti podílejí. Výše zdravotního pojištění se odvíjí pouze od výše příjmů, takže v rozpočtu domácnosti představují relativně stabilní částku. Přímé výdaje však mohou být ovlivňovány mnoha dalšími faktory, jako je věk, pohlaví a vzdělání osoby v čele domácnosti, počet spotřebních jednotek v domácnosti (SJ) apod. Mohou také souviset s návyky a spotřebním chováním domácnosti, např. s jejími výdaji za alkohol, cigarety atd. Pracovní hypotézy Úkolem bude navrhnout regresní model popisující závislost výdajů na zdraví, které plynou přímo z rozpočtu domácností na financování zdraví, na příjmech a dalších vybraných faktorech. Vstupními daty k analýze jsou výběrové soubory ze Statistiky rodinných účtů, které obsahující výdaje domácností na různé typy statků (potraviny, zdravotnictví, vzdělání, doprava atd.) společně s dalšími důležitými charakteristikami, jako jsou příjmy, či počet členů
1
domácnosti, bydliště, dosažené vzdělání apod. Práce vychází z údajů za roky 2002, 2005, 2006 a 2007. Lze předpokládat, že na velikosti výdajů na zdraví se bude významně projevovat také způsob života domácností, jejich návyky a životní stereotypy. Proto by se na velikosti výdajů na zdrví mohly významně projevovat například výdaje za alkohol a cigarety. Z praxe je známo, že kuřáci a osoby spotřebovávající větší množství alkoholických nápojů odčerpávají vyšší částky na zdravotnickou péči ze zdravotního pojištění. Otázkou však je, zda tomu tak bude i v případě částky věnované na zdraví přímo z rodinného rozpočtu. Budeme se tedy zabývat mimo jiné otázkou, zda výdaje na alkohol souvisí s přímými výdaji na zdraví nebo zda je možné vysledovat tuto závislost pouze v případě veřejných výdajů na zdravotní péči. Obecně se můžeme domnívat, že výdaje na zdraví porostou současně s výší příjmů. Ale můžeme očekávat, že výdaje na zdraví bychom budou rostoucí i v závislosti na výši vzdělání osoby v čele domácnosti (vzdělanější lidé více investují do zdraví). Vyšší výdaje na zdraví budou zcela jistě u domácností důchodců (vyšší věk nese zdravotní potíže, které implikují zvýšené náklady přímé i nepřímé). Porostou tedy v souvislosti s věkem. Můžeme rovněž předpokládat, že rodiny se ženou v čele budou za zdraví vydávat více než rodiny, v jejichž čele je muž. Datová základna Datovou základnu tvoří data z výběrových šetření příjmů a výdajů domácností zvaného Statistiku rodinných účtů (SRÚ), která provádí každoročně Český statistický úřad. Tyto datové soubory obsahují informace o příjmech, výdajích a mnoha dalších sociálněekonomických, regionálních a demografických charakteristikách domácností. Pro každý rok je k dispozici kolem 3.000 údajů, celkem se jedná o 12.246 záznamů. Pro každou domácnost jsou sledovány výdaje za různé druhy zboží, jako jsou potraviny a nealkoholické nápoje, alkohol a tabák, oděvy a obuv, vzdělání, bydlení, vodu, energii a paliva, dopravu, pošty a telekomunikace atd. Z dalších charakteristik se pak zaznamenává počet členů domácnosti, počet ekonomicky aktivních členů, počet spotřebních jednotek dle OECD, věk osoby v čele domácnosti, jejich vzdělání, sociální skupina, pracovní zařazení atd. Z výběrového souboru můžeme získat informace nejen o celkových disponibilních příjmech a výdajích domácností a o příjmech přepočtených na jednoho člena domácnosti, ale také o ekvivalentních disponibilních příjmech, tj. o tzv. příjmech na spotřební jednotku, které je porovnatelné ve všech zemích EU. Při přepočtu příjmů (výdajů) na spotřební jednotku můžeme ve statistice rodinných účtů použít hodnotu definovanou podle metodiky OECD, kde • osoba v čele domácnosti je brána s koeficientem 1,0 • děti ve věku 0 až 13 let s koeficientem 0,5 • ostatní děti a osoby s koeficientem 0,7 Počet spotřebních jednotek je tedy dán součtem vah (koeficientů) přiřazených jednotlivým osobám v domácnosti. Závisí na složení domácnosti a věku dětí. Počet spotřebních jednotek dle definice OECD je v souboru uložen do proměnné sj a je dán vztahem: (1) sj 1 0,5 mladsi _ det i 0,7 ostatni _ osoby . Důležitou součástí výběrových souborů jsou i kalibrační váhy domácnosti pkoef, které slouží k přepočtu výsledků z výběru na celek. Výběrové charakteristiky polohy i variability tedy byly počítány jako vážené charakteristiky. Vzhledem k tomu že příjmy i výdaje mají přibližně lognormální rozdělení, bylo při modelování vhodné použít logaritmickou transformaci. Transformované proměnné mají 2
přibližně normální rozdělení. To ovšem znamená, že ještě před transformací bylo potřeba ze souboru vyloučit všechna pozorování s nulovými hodnotami příjmů či výdajů. Příjmy a výdaje bylo potřeba před zpracování také očištěny od vlivu inflace. Všechna data proto byla před zpracováním převedena do cen roku 2009. Hodnoty přepočítacích koeficientů jsou uvedeny v tabulce 1. Tab. 1: Koeficienty pro přepočet hodnot do cen roku 2009. Rok šetření Koeficient
2002 1,195637
2005 1,141365
2006 1,120083
2007 1,092764
2008 1,063
2009 1
Kvalitativní proměnné, jako je pohlaví, sociální skupina, vzdělání apod., byly před konstrukcí modelu převedeny na proměnné kategoriální. Úroveň a variabilita příjmů a výdajů na zdraví a na alkohol a tabákové výrobky V tabulkách 2 a 3 jsou uvedeny vážené charakteristiky polohy a variability rozdělení měsíčních příjmů domácností a jejich výdajů na zdraví a na alkohol a tabákové výrobky. Pro výpočet byly použity hodnoty očištěné od inflace. Tab. 2: Úroveň příjmů a výdajů na domácnost. Charakteristiky polohy průměr (Kč) medián (Kč) dolní kvartil (Kč horní kvartil (Kč) minimum (Kč) maximum (Kč)
příjmy 26.505,55 26.390 16.835,45 32.342,83 2.780 227.500
výdaje na zdraví 503,64 357,30 183,98 653,94 1,09 10.970
výdaje na alkohol a tabák 638,53 397,80 153,47 828,84 0,91 5215
výdaje na zdraví 547,26 469,96 108,66% 56,09%
výdaje na alkohol a tabák 737,46 675,37 115,49% 68,75%
Tab. 3: Variabilita příjmů a výdajů na domácnost. Charakteristiky variability směrodatná odchylka (Kč) kvartilová odchylka (Kč) variační koeficient poměrná kvartilová odchylka
příjmy 14.860,62 15.507,38 56,06% 31,53%
Tabulky 4 a 5 obsahují charakteristiky polohy a variability rozdělení měsíčních příjmů a výdajů přepočtené na spotřební jednotku sj . Tab. 4: Úroveň příjmů a výdajů na spotřební jednotku. Charakteristiky polohy průměr (Kč) medián (Kč) dolní kvartil (Kč horní kvartil (Kč) minimum (Kč) maximum (Kč)
příjmy 14.429,71 13700 10.533,88 16.985,68 2.780 151.900
výdaje na zdraví 294,61 195,40 106,45 368,31 0,35 6450
výdaje na alkohol a tabák 359,25 213,80 92,87 455,55 0,33 3.252
výdaje na zdraví 328,72 261,86 111,58% 55,15%
výdaje na alkohol a tabák 422,58 362,68 117,63% 66,13%
Tab. 5: Variabilita příjmů a výdajů na spotřební jednotku. Charakteristiky variability směrodatná odchylka (Kč) kvartilová odchylka (Kč) variační koeficient poměrná kvartilová odchylka
příjmy 6.995,07 6.451,8 48,47% 23,44%
3
Z výše uvedených souhrnných charakteristik je patrné, že výdaje na zdraví jsou v průměru nižší než výdaje na cigarety a alkohol. To je v souladu se skutečnostmi zjištěnými v jiných průzkumech [6]. Trochu překvapivé jsou charakteristik variability pro obě sledované skupiny výdajů. Vzhledem k vysokým hodnotám variačního koeficientu je zřejmé, že ve výdajích na zdraví jsou v jednotlivých domácnostech velké rozdíly. Při porovnání relativních údajů vidíme že jejich variabilita je vyšší než u příjmů. Nicméně toto zjištění by taktéž mělo být v souladu s realitou. Zatímco příjmy jsou v podstatě nezávislé na individuálních preferencích jednotlivých domácností, a jsou závislé spíše na celkové situaci na trhu práce, výdaje na zdraví, ale i na alkohol a cigarety budou závislé na povaze jednotlivých domácností. A vzhledem k faktu, že sledované domácnosti mohou mít velmi rozdílné preference, je možné že i variabilita jejich výdajů na spotřební statky je vysoká. Tvorba regresního modelu K tomu, abychom mohli rozhodnout, které faktory budou pro modelování závislosti statisticky významné, musíme otestovat závislost výdajů na zdraví na těchto faktorech. Na základě získaných výsledků vybereme ty proměnné, které mají statisticky významný vliv na výši výdajů na zdraví. Budeme uvažovat následující faktory: příjmy přepočtené na spotřební jednotku sj, věk osoby v čele domácnosti, pohlaví osoby v čele domácnosti, vzdělání osoby v čele domácnosti, sociální skupina osoby v čele domácnosti, počet spotřebních jednotek, výdaje na alkohol a tabákové výrobky přepočtené na spotřební jednotku sj. Všechny tyto faktory budeme na počátku považovat za proměnné s významným efektem na přímé výdaje na zdraví a pokusíme se vytvořit model se všemi uvažovanými proměnnými. Poté jej budeme podle potřeby redukovat tak, aby došlo ke zlepšení schopnosti modelu vystihnout skutečný vztah mezi proměnnými. K vystižení závislosti použijeme multiplikativní model, který lze po zlogaritmování vyjádřit vztahem: ln E a0 a1 ln I a2 x1 a3 x2 a4 x4 a5 x5 ... , (2) kde: E – výdaje na zdraví přepočítané na spotřební jednotku (sj) I – příjmy přepočítané na spotřební jednotku (sj) x1 – věk osoby v čele domácnosti x2 – pohlaví (osoba v čele domácnosti je muž) x3, x4, x5, x6, x7, x8 – sociální skupina osoby v čele domácnosti x9, x10 – vzdělání osoby v čele domácnosti Proměnné x2 – x10 jsou umělé proměnné, které v modelu zastupují původní kategoriální proměnné. V modelu jsou pak při výpočtu hodnoty odpovídající pozorování nahrazeny hodnotou jedna (například je-li v čele domácnosti muž, pak x2 = 1, je-li v čele domácnosti žena, x2 = 0). Tím dojde ke zohlednění vlivu kategoriálních proměnných v modelu. Odhady regresních koeficientů, jejich statistická významnost a významnost modelu jsou na obrázku 1, kde je zachycen výstup z programu R. Vidíme že koeficienty u proměnných výdaje na alkohol a počet spotřebních jednotek (sj) mají vyšší p-hodnoty. Nejsou tedy pro náš model významné (jsou zřejmě korelované s jinými proměnnými) a je možné je z modelu vypustit. Ostatní proměnné se jeví jako 4
významné a v modelu bychom je tedy měli ponechat. Dalším problémem je, bohužel, nízká hodnota korigovaného koeficientu determinance. V případě tohoto modelu je to pouze 0,1733. Což znamená, že model jako celek je sice díky nízké p-hodnotě u Fischerova F-testu v pořádku, nicméně jeho výstižnost je poměrně nízká (necelých 18%).
Obr.1: Odhad parametrů modelu (výstup z programu R)
V dalším kroku budeme model redukovat odebráním konstanty a proměnných alkohol_sj a sj. Výstup z programu R s odhady parametrů redukovaného modelu je na obr. 2.
Obr.2: Odhad parametrů modelu (výstup z programu R)
5
V tomto případě je korigovaný koeficient determinance na úrovni 0,97, výstižnost tohoto modelu je tedy 97%, což je velmi vysoká hodnota. Konečný model by tedy mohl vypadat následovně: ln E 0,77405 ln I 0,01493vek _ p 3,172175 pohl _ pmuz 0,15072skup2 0,11722skup3 0,32674skup4 0,40563skup5 0,10855skup6 0,57007 skup7 0,05428vzd22 0,23117vzd23
(3)
Obr.3: Graf přímých výdajů na zdraví porůzné volby parametrů(výstup z programu Derive)
Po odlogaritmování dostaneme multiplikativní model závislosti přímých výdajů na zdraví ve tvaru: E I 0,77405 1,015vek _ p 0,0419 pohl_ pmuz 1,1627 skup2 1,1244 skup3 1,3864 skup4 1,5002 skup5 1,1147 skup6 1,7684 skup7 1,0558vzd 22 1,2601vzd 23
(4)
Použité značení: ln E………… logaritmus výdajů na zdraví přepočtených na spotřební jednotku (sj) ln I ……….... logaritmus příjmů přepočtených na spotřební jednotku (sj) vek_p ……… věk osoby v čele domácnosti pohl_pmuz … osoba v čele domácnosti je muž 6
skup2 ……… skup3 ……… skup4………. skup5 ……… skup6 ……… skup7 ……… vzd22 ……… vzd23 ………
osoba v čele domácnosti je samostatné výdělečně činná osoba v čele domácnosti je „vyšší zaměstnanec“ osoba v čele domácnosti je důchodce v rodině s ekonomicky aktivním členem osoba v čele domácnosti je důchodce v rodině bez ekonomicky aktivního člena osoba v čele domácnosti je nezaměstnaná osoba v čele domácnosti patří do skupiny „ostatní“ osoba v čele domácnosti má nejvýše střední vzdělání osoba v čele domácnosti má vysokoškolské vzdělání
Závěr Pokud se podíváme na hodnoty regresních koeficientů, můžeme vysledovat závislosti mezi jednotlivými proměnnými v modelu. Můžeme například tvrdit, že domácnosti v jejichž čele je osoba s vyšším vzděláním investují do zdraví více, než domácnosti v jejichž čele stojí osoba se středním či nižším vzděláním. Nemám tím na mysli absolutní částky, ale relativní částky v poměru k příjmům. Stejně tak můžeme vysledovat že domácnosti v jejich čele stojí „vyšší zaměstnanec“ či důchodce vydávají na zdraví, v poměru ke svým příjmům, vyšší částky než ostatní skupiny. Nejvyšší přímé výdaje na zdraví má skupina „ostatní“. Ovšem nejvýraznější rozdíl ve výdajích na zdraví je jednoznačně mezi pohlavími. Podle odhadnutého modelu můžeme tvrdit, že ženy v čele domácnosti (tj. v případě, že pohlavi_muz = 0) implikují podstatně vyšší výdaje na zdraví v poměru k příjmům. Potvrdili jsme tak v úvodu stanovené hypotézy. Literatura BARTOŠOVÁ J. 2007. Modelování v ekonomii, podpůrný text k on-line kurzu, Praha: Oeconomica, 2007. 28 s., ISBN 978-80-245-1162-7. KOMÁREK, A. 2005. Úvod do statistiky, Text doplňující přednášky Statistika A a B, 2005. KOMÁREK, A. – KOMÁRKOVÁ, L. 2006. Statistická analýza závislostí, Skroptum pro přednášku Statistika B, 2006. STUCHLÝ J. 2000. Ekonometrie – učební text, FM VŠE Jindrichův Hradec, 174 s., 2000. HINDLS, R. – HRONOVÁ, S. – SEGER,J. 2004. Statistika pro Ekonomy (páté vydání), Praha: Professional Publishing, 2004, 420 s., ISBN 80-86419-59-2. Týden.cz – Za pivo a cigarety utrácíme více než za zdraví, http://www.tyden.cz/rubriky/domaci/zapivo-a-cigarety-utracime-vic-nez-za-zdravi_66700.html, online, [cit. 11.11.2009]
Adresa autora RNDr. Jitka Bartošová, Ph.D. Vysoká škola ekonomická v Praze Fakulta managementu Jarošovská 1117/II 377 01 Jindřichův Hradec
[email protected]
7