A D A T K E R E S L E T ÉS A D A T K Í N Á L A T A STA TISZTIKÁ B A N DR. S Z A L A I S Á N D O R E ta n u lm á n y b a n n éh án y elgondolást szeretnék kifejteni, am ely egy k ö zelm ú ltb an t e t t am erikai u ta m ta p a sz ta la ta i nyom án érlelődött meg ben nem . U ta m e lv e z e tett az E g y esü lt Á llam ok és K a n a d a m ajd m inden neveze tesebb tu d o m án y o s k ö zp o n tjáb a, ahol korszerű — á lta lá b a n elektronikus — gépi adatfeldolgozási te c h n ik á k n a k n ag y terjed elm ű tá rsad alm i és gazdasági ad a ta n y a g o k ra való alkalm azási lehetőségeit k u ta tjá k . N em ú ti élm ények, m ég csak nem is az u ta m során közelebbről m egism ert k u ta tá s i m ódszerek és eredm ények, m űködésben lá to tt tech n ik ai berendezések ism ertetése a célom. M indazonáltal h e ly en k én t szem élyes ta p a sz ta la ta im ró l is be kell szám olnom , hogy érth ető v é tegyem és m egindokoljam a z o k at a feltevéseket vag y k ö v e t k eztetések et, am ely ek et e ta p a sz ta la to k b ó l szűrtem le. AZ E M B E R
ÉS
A G É P
Ú J F A J T A
V I S Z O N Y A
1964 őszén egy szem eszteren á t a M assachusetts In s titu te of T echnology (M. I. T.) tá rsa d a lo m - és g azd aság tu d o m án y i k a rá n a k vendégprofesszora vol ta m . Az E g y esü lt Á llam oknak ez a legrégibb és legtekintélyesebb m űszaki egyetem e m a az elektronikus szám ítási és adatfeldolgozási te c h n ik á k tá rs a d alo m tu d o m án y i alk alm azásain ak egyik jelentős k u tató k ö z p o n tja . I t t v o lt tan szék e Norbert W ienernek, a k ib e rn e tik a m eg alapítójának; it t ta n ít és k u ta t m a is Claude Shannon, az inform ációelm élet m egalapozója, V ictor Y n g ve, a gépi fo rd ítás elm életének ism ert szakértője, Ithiel de Sola Pool, a b o nyolult tá rsa d a lm i fo ly am ato k elek tro n ik u s szám ológépi szim ulációs vizsg álatán ak egyik kezdem ényezője. Az i t t o k ta tó neves professzorok felsorolását még foly ta th a tn á m , de ta lá n ennyi is elég az М. I. T. „üzem i k lím á já n a k ” érzék elteté séhez, a m it v iszo n t v alam ely est ism erni kell az i t t következők helyes értel mezéséhez. Az М. I. T. egyik nagy, IBM 7094 típ u sú elektronikus szám ológépe „ rö v id ” , azaz legfeljebb 10— 15 m illió elemi szám olási m ű v e letet feltételező s így 20—30 m ásodpercnyi gépidő a la tt leb o n yolítható k u ta tá s i szám ítások, kísérleti szim ulációk és m ás hasonló m u n k á la to k szám ára v a n fe n n ta rtv a . E hhez a géphez az egyetem 150 tan szék én ek és in tézetén ek v a n s a já t „k o n zol” -ja. E gy-egy ilyen konzol tu la jd o n k é p p e n nem m ás, m in t egy telex-írógép,
AZ
ADATSZOLGÁLTATÁS
G É P E S ÍT É S E
19
am elynek k ö zvetlen vezetékes k ap cso lata v a n a szóban forgó IBM 7094 be m eneti „időm egosztó” (tim e sharing) berendezéséhez. H a az egyik tan széken v agy in tézetb en v a la k i leül a konzol elé, s a telex-írógépen lekopog egy szám í tá si, adatrendezési, szim ulációs v ag y egyéb szám ológépi fe la d a to t, ak k o r — az IBM -gép p illa n a tn y i foglaltság átó l függően — legfeljebb 1/2— 1 perc m úlva sorrakeríil e fe la d a t szám ológépi feldolgozása s teljes 5 m ásodpercen á t ezzel fog foglalkozni az IBM 7094 a p p a ra tú rá ja . H a ennyi idő, azaz m integy 2 és 1/2 millió elemi m ű v elet (pl. szám tan i alapm ű v elet) elvégzése elegendő a fel a d a t m egoldására, a k k o r az eredm ény azonnal kiíródik a konzol telex-író gépén. H a ennél hosszabb m u n k á ra van szükség, ak k o r az IBM 7094 időm egosztója egy ú ja b b 1/2— 1 perces várak o zási idő u tá n — m iközben m ás k o n zolok szám ára dolgozik a gép — to v á b b i 3 m ásodpercnyi g ép id ő t u ta l ki e fel a d a t szám ára, s ak k o r fo ly ta tó d ik a szám ítás. H a még ez sem elegendő, ak k o r később m á r csak 1— 1 m áso d p ercet j u t t a t tu rn u so n k é n t az időm egosztó e felad a t m egoldására éspedig azért, m e rt a 10— 15 millió elemi m ű v eletn y i fel ső h a tá r t elérő v agy éppenséggel a z t m eghaladó szám ítási feladatok m egoldá sára a szám ológépközpont egy m ásik gépe v a n fe n n ta rtv a . Mivel az M. I. T . szóban forgó IBM 7094 típ u sú szám ológépének m ág nesszalag- és m ág n esg y ű rű -m em ó riájáb an sokezer h a szn á latra kész szám ítási és egyéb program , r u tin és sz u b ru tin v a n tá ro lv a , am ely egy kis kód-könyv nyom án tetszés szerin t „ le h ív h a tó ” , te h á t a gép igénybevételéhez — különle gesebb fe la d a to k tó l e lte k in tv e — nincs is sem miféle különösebb program ozói készségre v ag y szak értelem re szükség. A kód-könyvből k io lvasható például, hogy egy AХ = В m a trix m egoldásához, ill. egy A determ ináns é rték én ek kiszám ításáh o z az „X S IM E O ” , ill. „ X D E T R M ” k ó d o t kell lekopogni a telex gépen a megfelelő n u m erik u s a d a to k közlésével e g y ü tt, s tö b b dolog ezzel azu tá n nincs is (1). É rth e tő , hogy ilyen feltételek m e lle tt egészen ú jfa jta „bizalm asság“ ala k u l ki az em ber és a szám ológép k ö z ö tt. Az em ber úgyszólván b e v o n h atja s a já t g o ndolkodásába a gépet: hipotézisek és a lte rn a tív á k hosszú so rait pró b á lg a th a tja végig r a jta anélkül, hogy g o n d o latm en etét tö b b m in t néhány p illa n a tra m eg kellene szak ítan ia. H am aro san m egszokja a z t is, hogy a szá m ológép v aló jáb an „logikai gép” , am elynek csak egyik, ta lá n nem is a leg fontosab b képessége az, hogy szám tan i m ű v eleteket tu d végezni. U gyanúgy képes a rra is, hogy tetszőleges szám jegy- v ag y b e tű so ro z ato k at tetszőleges logikai elvek szerin t egyeztessen, osztályozzon, b eh ely ettesítsen, á lta lá b a n valam ily en p ro g ram sz e rin t rendezzen. N em h iá b a h ív ják franciául „ o rd in a te u r ” -nek, azaz rendezőnek az elek tro n ik u s szám ológépet: az elrendez m in dent, am ire megfelelő u ta sítá s v an a p ro g ram jáb an . Szám ára teljesen m indegy, hogy a z t k ív án ja-e tő le az u ta s ítá s : a „ 2 x 7 ” jelsorozat felm erülése esetén írja le a „ 1 4 ”-et, vagy pedig a z t, hogy a „ d en W olf” jelsorozat felm erülése ese té n írja le a „ fa rk a s“ szót és to ld ja meg a ,,- t” tárg y rag g al. Vagy: fusson vé gig azon a m ágnesszalagon, am elyre az E g y esü lt Á llam ok összes lakosainak 1960. évi egyedi népszám lálási k é rd ő ív -a d a tai v a n n a k rákódolva és szám olja meg, hogy h á n y 2 gyerm ekes család ap a szerepel a szalagon, aki a következő' tu la jd o n sá g o k k a l rend elk ezik : a) 30 évnél fia ta la b b ; b) néger; c) ip ari m un k á s; d) legfeljebb 4 iskolai o sz tá ly t v é g z e tt; e) 50 000-nél tö b b lakost szám láló váro sb an la k ik ; f ) az utolsó évben 2400 dollárnál kevesebb jövedelem, u tá n ad ó zo tt. 2
20
DR. S Z A LAI S Á N D O R
H angsúlyozni szeretn ém : ez a m ágnesszalag-tekercs, am elyről a gép egy ily en tetszőleges ism érv-kom binációnak megfelelő, de sem m iféle m eglevő n épszám lálási k ia d v á n y b a n külön ki nem m u ta to tt speciális népességcsoport lé tsz á m á t meg tu d ja álla p íta n i, létezik. E re d eti ala k já b a n ugyan nem bocsátja kívülálló rendelkezésére a B ureau of th e Census, az E g yesült Á llam ok nép szám lálási h iv a ta la , m e rt hiszen erről b árm ely egyén a d a ta it is le lehet olvasni, a m i a s ta tisz tik a i tito k ta r tá s m egsértését jelentené. E szalag 1:1000 arányú k iv o n a ta (a népesség m inden ezredik v életlenszerűen k iv á la sz to tt és egyénileg nem azo n o síth ató ta g já n a k összes népszám lálási k érd ő ív -ad ataiv al) azonban sok k u ta tó k ö z p o n t, így tö b b ek k ö z ö tt az M IT. szám ológépének te k e rc stá rá b a n is m egvan, m e rt ezt a B u reau of th e Census viszonylag szerény költség m eg térítés (p á r ezer dollár) fejében a k u ta tá s rendelkezésére bocsátja. Az 1 :1000 a rá n y ú szalag á tfu tá si ideje egy n ag y teljesítm én y ű szám ológépen — p é ld á u l épp az IBM 7094-en — m indössze néhány perc. E n n y i idő a la tt te h á t b á rm e ly csoportképző ism érvnek (vagy persze egyszerre tö b b n e k is) előfor dulási szám a s ezzel a megfelelő népességcsoport arán y a m inden to v áb b i n élkül m eg állap íth ató . Jelenleg a B ureau of th e Census egy 5% -os ( 1 :200 a rá n y ú ) népszám lálási k iv o n at-szalag megfelelő p éldányszám ban való előállításán is dolgozik, de a sta tis z tik a i tito k védelm e érdekében ezt m ár csak m eg h a tá ro zo tt k u ta tá s i célokra fogja kikölcsönözni olyan in tézm ényeknek, ahol a h asz n ála ti idő a la tt e sk ü t t e t t sta tisz tik a i tisztviselő ellenőrzi, hogy valóban csak a m egengedett specifikáció h a tá rá ig h aszn álják ki (2). T erm észetesen egy ilyen népszám lálási k ivonat-szalag k o rán tsem csak a rra jó, hogy rövid ú to n m eg lehessen á lla p ítan i a népszám lálás k ö z z é te tt tá b lá z a to s an y a g á b a n meg nem ta lá lh a tó ism érv-kom binációknak megfelelő népességcsoportok a rá n y á t, sőt igen p ontos közelítésű abszolút létszám át is. E n n él sokkal b o n y o lu ltab b dem ográfiai k u ta tá si felad ato k m egoldását is le h ető v é teszi ez a szalag. K ö zv etlen ü l h aszn o síth ató például megfelelő szám o lógépi program ok alkalm azása esetén tetszőlegesen m eg h a tá ro z o tt népesség c so p o rto k szám szerű m egoszlásának különféle, a k á r csoportról-csoportra, a k á r az idő függvényében válto zó születési és halálozási arán y szám o k k al tö r té n ő tá v la ti k iv itetésére. N incs a k a d á ly a an n ak sem, hogy a népesség koröszsz e té te lé t k ö zv etlen ü l összehasonlítsák egy olyan m ás ország népességével (v ag y egy olyan tö rté n e ti népességével), am elyről csak a m anapság legtöbb h e ly ü tt b e v e z e tett 0,1— 4, 5— 9 stb . éves korcsoportokból eltérő csoportosí tá s b a n álln ak rendelkezésre korösszetételi tá b lá z a to k (am i például a 19. szá zad i svéd és fran cia dem ográfiai a d a to k k a l dolgozó k u ta tó k állandó bosszú ság a) (3). A S T A T I S Z T I K U S
ÉS A Z A D A T К E R E S L E T
A s ta tisz tik u s m u n k á ja nem öncélú. Nem a z é rt g y ű jti, dolgozza fel és foglalja tá b lá b a a d a ta it, hogy azok csak éppen ra k tá ro n legyenek, hanem m e rt feltételezi, hogy a tá rsa d a lo m n a k szüksége v a n vagy előbb-utóbb szük sége lehet rá ju k . Így te h á t a sta tisz tik u s valam iféle a k tu ális vag y potenciális adatkeresletet t a r t szem e lő tt, am ik o r m eghatározza, hogy m ilyen sta tisz tik a i so k aság o k at v onjon be megfigyelési körébe, m ilyen ism érvek előfordulásait vegye szám ba e sokaságok ta g ja in á l, s végül m ifa jta csoportosításban, ill.
AZ
A D A T S Z O L G Á L T A T AS G É P E S ÍT É S E
21
közelebbről: miféle adatö sszesítések et, ill. a d a tb o n tá so k a t ta rta lm a z ó tá b lá zato k b an foglalja össze m u n k á já n a k eredm ényeit. G y ak o rlatilag persze az a h elyzet, hogy a m egfigyelendő sokaságok és a szám ba veendő ismérvek m eg h atáro zása te k in te té b e n tö b b n y ire erősen meg v a n k ö tv e a sta tisz tik u s keze. T ö rv én y ek és ren d eletek írjá k elő vagy egysze rűen a dolgok term észetéb ő l adódik, hogy a fennálló viszonyok k ö zö tt az or szág népességére, v áro saira és községeire, állam igazgatási, gazdasági, k u ltu rális, egészségügyi és egyéb intézm ényeinek állagára és m űködésére v o n a tk o zólag m ilyen elem i a d a to k a t lehet és kell szám ba venni. A sta tisz tik u s ja v a s la to t te h e t az a d a tg y ű jté sn e k , ill. az ad a tsz o lg á ltatási k ötelezettségnek ilyen vagy olyan irán y ú k ibővítésére, de ez körülbelül m inden, am it m eg teh et. H a a k á r a megfelelő a d m in isz tra tív , anyagi és te c h n ik ai előfeltételek h iá n y a m ia tt, a k á r m ás okból nincs lehetőség a s ta tisz tik a i m egfigyelés m egfelelő kiterjesztésére, ak k o r ezzel a kérdés m ár el is dőlt. Sokkal sz a b ad ab b keze v an azo n b an a sta tisz tik u sn a k ab b an , hogy a be g y ű jtö tt elemi a d a ta it hányféle és m ilyen ismérv-kombinációk szerinti csoporto sításban m u tassa ki és foglalja tá b lá z a to k b a . K onkréten: hogy egy s ta tis z ti kai a d atfelv étel eredm ény tá b lá z a ta i m ilyen oszlopokat és so ro k at ta rta lm a z zanak; a z t á lta lá b a n (elég tá g h a tá ro k k ö zö tt) m aga a sta tisz tik u s d ö n ti el. M ásnak nem is igen lehet á tte k in té se az e te k in te tb e n ren d szerin t fennálló rengeteg a lte rn a tív kom binációs lehetőségről. H iszen ha csupán 10 ism érvnek m eglétéről v agy m eg nem létéről v an szó egy a d o tt sokaság ta g jain á l, ez is m ár 1024 különböző lehetséges ism érv-kom binációt jelent. Egy-egy s ta tis z ti kai felvételben azo n b an rendesen sokkal tö b b ism érvre te rje d ki az a d a tg y ű j tés, s ezek az ism érvek k o rán tsem m indig csak k é t fo k o za ttal („ v a n ” — „n in c s” , „ férfi” — „ n ő ” stb .) szerepelhetnek. H ogy csak a legegyszerűbb pél d á t em lítsü k : M agyarországon egy férfi vagy egy nő a fővárosban vagy a 19 megye b árm elyikében la k h a t, 4-féle családi állap o tú lehet, s em ellett igen d u rv a felosztás m e lle tt is 8-féle k o rcso p o rtb a, 5-féle iskolai végzettségi foko z a tb a s a keresők, ill. e lta r to tta k 13 k a te g ó riá já b a ta rto z h a t. Ez ö n m agában véve is 2 x 2 0 x 4 x 8 x 5 x 1 3 = 83 200 lehetséges (sőt egytől-egyig létező és fontos) ism érv-kom bináció, am inek sta tisz tik a i k im u ta tá sa az ország né pességére von atk o zó lag tö b b m in t négyszáz egészoldalas tá b lá z a to t igényel (tá b lá z a to n k é n t á tla g 10 adato szlo p p al és 20 a d a tso rra l szám olva). S ezek csak egészen triv iális a d a to k . A népszám lálási kérd ő ív összes kérdéseinek megfelelő v álaszk ateg ó riák teljes feldolgozása v alam en n y i kom binációs lehetőség sz e rin t tö b b százezer v agy n éh á n y millió tá b lá z a t m egszerkesztését és k isz á m ítá sá t ten n é szükségessé, s e százezernyi v a g y m illiónyi tá b láza to lási lehetőség kö zül kell k iv á la sz ta n ia a s ta tisz tik u sn a k a z t a n éhány ezret, am elyet a nép szám lálási adatfeld o lg o zásn ak és ad atk ö zlésn ek egészen kivételes terjed elm e m ellett is ténylegesen m egv aló síth at. H a m árm o st olyan összetételű a d a tk a te g ó ria irá n t m u tatk o z ik kereslet, am inek ism érv -k o m b in áció ja nem szerepel a k iv á la sz to tt néhány ezer tá b lá z a t oszlop-, ill. sor-cím eiben, b á r m inden egyes ism érv külön-külön kérdés tá rg y á t k ép ezte a népszám lálási kérdőíven, ak k o r ezt a keresletet a s ta tis z tik a i m u n k a hagyom án y o s feltételei m e lle tt v ag y csak a különféle m eglevő ro k o n tá rg y ú tá b lá z a to k ra a la p o z o tt becslésekkel, azaz a népszám lálási adat felvétel pontossági szintje alatt, v ag y pedig egyáltalán nem leh et k ie lé g íte n i; kivéve azon az áron, hogy az egész egyedi kérdőív-, ill. lyu k k á rty a -a n y a g o t
22
DR.
S ZA L A I SÁNDO R
újra feldolgozzák ezen ism érv-kom bináció szem pontjából, am ire az a d o tt tech n ik ai és an y ag i lehetőségek m ellett é rth e tő m ódon csak kivételes esetben k e rü lh e t sor. E b b ő l a szem szögből nézve lényegében szűrőberendezés m ódjára m űködik az a h agyom ányos típ u sú tá b lá z a to s a d a tk im u ta tá s, am ely csupán a sta tisz tik u s á lta l m ár az elemi a d a ta n y a g feldolgozása során eleve elh atáro zan d ó cso p o rto sítás sz e rin t s csak a lehetséges ism érv-kom binációk kis h á n y a d á n a k megfelelő ad a tc so p o rto k b a n teszi hozzáférhetővé a sta tisz tik a i a d atfe lv étel során b e g y ű jtö tt h atalm as inform áció-töm eget. A m ilyen ism érv-kom bináció, illetve am ilyen összetételű a d a tk a te g ó ria szám ára nincs eleve kijelö lt „ ly u k “ a tá b lá z a tso ro k és táb lázato szlo p o k á lta l a lk o to tt szitaszövetben, az úgyszól v á n v issz a v o n h a ta tla n u l kireked az ad atszo lg áltatásb ó l, még ha meg is v a n a megfelelő a d a tc so p o rt létrehozásához szükséges m inden elemi a d a t az eredeti (szüretien) felvételi anyag b an . N em szorul bizo n y ításra, hogy ily m ódon a nagy fáradsággal és költség gel v é g re h a jto tt a d a tg y ű jté s in fo rm áció -tartalm án ak jelentős része k iak n á z a tla n u l m arad , azaz veszendőbe m egy. A kérdés csak az, hogy kár-e é rte ? H iszen n y ilv án v aló an igen sok ism érv-kom bináció, igen sok olyan összetételű a d a tk a te g ó ria képzelhető el, am elynek k im u ta tá sáh o z m egvolnának ug y an a megfelelő inform ációk a népszám lálási kérdőívek v álaszro v ataib an s az eze k e t rep rezen táló ly u k k árty a-o szlo p o k o n , csak éppen senki sem kíváncsi az ily еп ism érv-kom binációval rendelkező népességcsoport létszám ára. Az, hogy az országban h á n y á n dolgoznak az állam i kereskedelem bolti kiskereskedelm i ág áb an , fontos a d a t, van is rá válasz, a k á r még megyei b o n tásb an is. Vagy, hogy az országban m ennyi a 3— 5 v ag y 6 és tö b b gyerm ekes c salád ap ák szá m a, szintén fontos a d a t, s term észetesen v an is rá válasz, a k á r még m egyei b o n tá sb a n is. Az azonban, hogy az állam i kiskereskedelem bolti ág áb an dol gozók k ö z ö tt országosan — v ag y m o n d ju k éppenséggel N ógrád m egyében — m en n y i a 3— 5 vagy 6 és tö b b gyerm ekes családapák szám a, az sem m iféle tá b lá z a tb a n nincs külö n k im u ta tv a , hiszen ez sen k it sem érdekelhet különö sebben. A hhoz, hogy m inden effajta speciális érdeklődést is ki lehessen elégí te n i, tén y leg százezer v ag y m illió tá b lá z a to t kellene készíteni a népszám lálási anyagból, s ebben a h ih etetlen tá b lá z a tá ra d a tb a n végleg lehetetlen volna b á r m it is m eg találn i, a m it az em ber keres. Á llju n k csak m eg itt azo n b an egy p illa n a tra ! V ajon tényleg sen k it sem érd ek elh et, hogy speciálisan az állam i kereskedelem bolti kiskereskedelm i ág á b a n dolgozók k ö z ö tt m ennyi a 3— 5 v ag y 6 és tö b b gyerm ekes családapa? E z nagyon is érdekes lehet a lk a lo m a d tá n a belkereskedelm i m inisztérium szám ára, ha — m o n d ju k — a z t kellene m eghatároznia, hogy a sokgyerm ekes családok e lta rtó in a k valam iféle kedvezm ényezése (például egy te rv b e vett. ú jfa jta családipótlék-rendszer v agy lak ásépítési tá m o g atá s bevezetése esetén) m ilyen pénzügyi m egterhelést jelen ten e a tá rc a kereteiben. Az ily esfa jta a d a t igény te h á t elképzelhető (m ég a k á r N ógrád megyei b o n tásb a n is), sőt az igaz ság az, hogy nehéz olyan ism érv-kom binációt alk o tn i például éppen a népszám lálási kérd ő ív v álaszk ateg ó riáib ó l, am inek megfelelő a d a tc so p o rtra ne m erül h etn e fel a lk a lo m a d tá n egészen jogos igény. Szerencsére — m ár am en n y ire ez szerencsének m o n d h ató ! — p illa n a t nyilag még m inisztérium i szin ten is (nem hogy m egyei tan á cso k n ál vag y egyes közületeknél, v állalato k n ál) a rá n y la g kevés az olyan döntés, am it a
“
AZ
ADATSZOLGÁLTATÁS
G É P E S ÍT É S E
23
megfelelő tén y állás összes elem einek szabatos, ad atszerű vizsg álatára alapoz nán ak , s ennek m egfelelően elég ritk a az efféle egészen speciális ad atigény, am ely et töm eges jelentkezése esetén sta tis z tik a i a p p a rá tu su n k jelenlegi an y ag i és te c h n ik a i felszerelése m ellett nem is tu d n á n k sem m iképpen kielé gíteni. A h e ly z e te t n á lu n k m a még in k á b b az jellem zi, hogy m eg szám lálh atat lan állam igazgatási, közületi, v á lla la ti stb . döntés, am elynek a d atszerű m eg alapozásához m egvannak az ad ato k a K ö zp o n ti S ta tisz tik a i H iv a ta l évköny veiben és egyéb k ia d v á n y a ib a n , nem ilyen ad a ta lap o n , hanem h iv atali „m eg ítélések ” , kebelbeli „ ta p a s z ta la to k ” és „ g y a k o rla to k ” nyom án jön létre. S m ár „ h a la d á sn a k ” n ev ezh etjü k , ha egy h iv a ta l -r- nem tu d v á n arról, hogy van az országos sta tisz tik á n a k megfelelő a d a tb o n tá sa — a rra vállalkozik, hogy a m aga m u n k a te rü le té n „ re p re z e n ta tív fe lv é te lt” h a jt végre valam ilyen döntésének előkészítése v ég ett. M ert noha megfelelő szakism eret és megfelelő szakm ai k ép z e ttsé g ű szem élyzet h íjá n az effajta felvételek m ajdnem szükség szerűen figyelm en k ív ü l h a g y já k a re p re z e n ta tív sta tisz tik a i m in tav étel, a kérdőív-szerkesztés és az adatfeldolgozás elemi szab ály ait, s ily m ódon azu tá n egészen hibás ered m én y ek et a d n a k , d e h á t legalább a z t ta n ú sítjá k , hogy növekszik és terjed a h iv a ta li döntések sta tisz tik a i a d a to k ra való alapozásának igénye. A m ikor az a fran cia k irály , ak i hosszú időn á t h iába ig y ekezett be v ezetn i országába az A m erikából b eh o zo tt b u rgonya term elését, m eg tu d ta, hogy k irály i földjein éjjel to lv a j p araszto k k iá sta k és m agukkal v itte k pár zsák ra v aló t, boldogan k iá lto tt fel: „L o p já k m á r!” V alahogy így vagy u n k ezekkel az eg y éb k én t eg y általán nem k ív án ato s, „ fek eté n ” és szakszerűtlenül v é g z e tt felvételekkel is, b á r k étség telen az, hogy sokkal hasznosabb volna, h a m in d e n ü tt, ahol sta tisz tik a i a d a to k ra v a n szükség, tu d n á k is, hogy miféle ad a to k v a n n a k meg és hogyan lelhetők fel a S ta tisz tik a i H iv a ta l k ia d v á n y a i b an .1 A legutóbbi időkig bőségesen fedezte a hazai a d a tk e re slete t a perio d ik u san k ö z z é te tt sta n d a rd sta tisz tik a i k im u ta tá so k n a k az a nagy v ála szték a , am ely et a K ö zp o n ti S ta tisz tik a i H iv a ta l a m aga sok évtizedes ta p a sz ta la ta és g y a k o rla ta alap ján a la k íto tt ki s időről időre a felm erülő ú jab b szükségletek nek m egfelelően b ő v íte tt. Sajnos nem tu d u n k olyan v izsgálatról, am ely an nak m eg állap ítására irá n y u lt volna, hogy m ek k ora az országos kereslet e ki m u ta tá so k , ill. a b e n n ü k m e g a d o tt egyes ad atcso p o rto k irá n t, azaz napi vagy évi á tla g b a n h án y szo r kerül felhaszn álásra egy-egy közölt a d a ttíp u s az ország h iv a ta la ib a n , k u ta tó in té z m é n y e ib en , meg egyéb olyan helyein, ahol sta tisz tik a i a d a to k a t fo g y asztan ak . V alam i e ffa jta „ a d a tp ia c -k u ta tá s ” eg y általán nem k e re sz tü lv ih e tetlen , s a d o tt alkalom m al hasznos is lehetne. Á m de aligha kétes, hogy egyelőre á lta lá b a n a z t m u ta tn á : s ta tisz tik a i a d a tk ín á la tu n k meg h a la d ja sta tisz tik a i a d a tk e re sle tü n k e t. E z azonban — hangsúlyozzuk — egyelőre v a n így, s b izto san nem sokáig m arad m ár így. M ár m a is v a n n a k bizo nyos te rü le te k , ahol a hagyom ányos típ u sú , azaz rögzített ad atc so p o rto sítású 1 M e g e m lítjü k , h o g y a z 1960. é v i n é p s z á m lá lá s ra v o n a tk o z ó a n ez a z ö s sz e fo g la ló -tá jé k o z ta tó k ia d v á n y is e lk é sz ü lt. (1960. é v i n é p sz á m lá lá s . A z a d a tfe lv é te l és feld o lg o zás ö sszefoglaló is m e rte té s e . K ö z p o n ti S ta tis z tik a i H iv a ta l. B u d a p e s t. 1965. 120 p .) A k ö te t ta r ta lm a z z a a z 1960. é v i n é p s z á m lá lá s e lő k é sz íté sé v e l, fe lv é te lé v e l és fe ld o lg o z á sá v a l k a p c s o la to s összes fo n to s tu d n iv a ló k a t, a fe lv é te li n y o m ta tv á n y o k a t , u ta s í tá s o k a t, a l y u k k á r ty á k a t, a fe ld o lg o z á si s e g é d le te k e t, a feld o lg o z á si tá b lá k a t , a k ia d v á n y o k a t, a n é p s z á m lá lá s sz e rv e z e ti fe lé p íté sé t, v a la m in t a z 1960. é vi és a v is s z a te k in tő a d a to k t á r g y m u ta tó it, m e ly e k b ő l m e g á lla p íth a tó , h o g y v a la m e ly k e r e s e tt a d a t a z 1960. é vi n é p sz á m lá lá s 32 k ö te té b ő l, m e ly ik k ö te tb e n , h á n y a s s z á m ú tá b lá b a n , m e ly o ld a lo n ta lá lh a tó .
24
DR.
S Z A L A I S Á ND O R
sta tisz tik a i a d a tsz o lg á lta tás nem tu d eleget ten n i a követelm ényeknek. Gon dolunk i t t például a regionális tervezésre, ahol a különféle regionalizálási a lte r n a tív á k kidolgozásához elégtelen a m in d enkor elkerü lh etetlen ü l a meglevő közigazgatási beosztáshoz igazodó te rü le ti a d a tb o n tá s. H asonló a h ely zet a városrendezés esetében, ahol kényszerűen az úgyszintén közigazgatási jellegű bel- és k ü lte rü le ti h atárm eg v o n ásh o z igazodik az a d atszo lg álta tás, h o lo tt sok esetben éppen a rra kellenének a d a to k , hogy m ilyen v á lto z á st okozna ebben v a g y ab b a n az a d a tc so p o rtb a n a h a tá ro k áthelyezése v ag y eltolása. A válasz erre term észetesen az, hogy ilyen folytonosan m ódosuló, m inden tervezési a lte rn a tív á h o z m ás-m ás te rü le ti a d atb o n tá ssa l hozzáigazodó a d a t szo lg áltatásra az országos s ta tisz tik a nem v állalk o zh atik , illetve csak ak k o r v állalk o zh atn a, ha a közigazgatási te rü le th a tá ro k ra ala p o z o tt stan d ard tá b lá zatos adatösszesítések, ill. a d a tb o n tá so k m ellett még külön-külön nyilván ta r th a tn á az ország m inden egyes a d a tk e le tk ez te tő p o n tjá ra (pl. é p ü lettö m b jére, h ázára v ag y üzem egységére) v onatkozó összes elemi a d a to k a t, s ezeket a z u tá n k ív á n a tra bárm ely p illa n a tb a n tetszőleges terü le ti vagy egyéb csopor to sítá sb a n összegezhetné. E z n y ilv án v aló an lehetetlenség a hagyományos sta tisz tik a i adatszolgáta tá s h a tá ra i k ö z ö tt, a gépi adatfeldolgozási te c h n ik á k hagyományos típ u sain ak alk alm azásáv al. Nem leh etetlen azonban, ha az összes elemi ad a to k egy olyan m ágnesszalagon v a n n a k n y ilv á n ta rtá sb a n , m in t am ily et például a B ureau of Census az 1960. évi népszám lálási anyagáról k é sz íte tt sa já t hasz n á la tá ra , m in th o g y erről egy elek tro n ik u s szám ológép igen rövid idő a la tt tetszőleges ism érv-kom binációk szerinti (te h á t a k á r tetszőlegesen m eg h atáro z o tt te rü le ti ism érvek szerinti) a d a tk im u ta tá so k a t k észíthet. Ú gy tű n ik , hogy a sta tisz tik a i ad a tsz o lg á lta tás jövőjének fejlődése ebbe az irán y b a m u ta t. Minél jo b b an növekszik az ad atk ereslet, m inél tö b b és m i nél alacsonyabb szintű állam i vagy gazdasági igazgatási egység k ív án ja m ajd egyre szélesebb körben szilárd sta tisz tik a i ad atb ázisra alapozni döntéseit, annál többféle és an n ál v álto zato sab b ism érv-kom binációk szerint összesített és b o n to tt a d a to k irá n t n y ilv án u l m ajd meg az igény. A sta tisz tik u s n a k te h á t nem csak az a d atk ere slet roham os m ennyiségi növekedésével, hanem m inőségi megváltozásával is szám olnia kell. A v á rh a tó — sőt m ár a jelenben is észlelhető — m inőségi változás elsősorban ab b an áll, hogy ez az ú jfa jta kereslet nem elégíthető ki az eddigi, a la p jáb an véve rög z íte tt a d a tcso p o rto sítású tá b lá z a tso ro za to k semmiféle bővítésével, ú jab b a d a t csoportok k im u ta tá sá v a l, az eddiginél részletesebb ad a tb o n táso k k al. Maga a h agyom ányos táb lázato lási elv, az elemi a d a to k rö g z íte tt adatcso p o rto k b an való tá b lá z a ti k im u ta tá sá n a k elve az, am i i t t tú lh a la d o ttá válik, b árh a a sta tisz tik a i adatfeldolgozás hagyom ányos m an u fak tu rális vagy legfeljebb elek tro m ech an ik u s (ly u k k árty a-g ép i) tec h n ik á ja m ellett a statisztik u sn ak egysze rű en nem v o lt — és m a sincs — m ás lehetősége, m in t, hogy k ita rtso n ezen elv m ellett. Az elem i a d a to k n a k az elektronikus szám ológépek á lta l „olvas h a tó ” m ágnesszalagokra való á tv ite le azonban m ódot n y ú jt a rra, hogy a sta tisztik u s az a d a tfe lv é tel teljes elemi a d a ta n y a g á b a n foglalt inform ációhal m a z t v agy an n ak tetszőleges részh alm azát b árm ely adatfogyasztó p illan atn y i adatszük ség letein ek megfelelő ad atc so p o rto sítá sb an hozzáférhetővé tegye. E n n ek a v á rh a tó igénynek kielégítéséhez azonban m ásfajta gépi elláto ttság ra v a n szükség, m in t am elyek m a a s ta tis z tik a rendelkezésére álln ak , s a köz
AZ
ADATSZOLGÁ LTATÁ S GÉP E S ÍT É SE
25
igazgatási d ö n tésh o zatal m ódszereinek is még igen so k at kell fejlődniük, hogy a specializált ad atig én y ek n ap o n k én ti sürgős és töm eges jelentkezése kifizetődővé tegye e z t a fa jta rö g zítetlen ad a tc so p o rto sítá sú sta tisz tik a i a d a t sz o lg á lta tá st, am ely — n o ta bene! — kiegészíteni (és nem kiszorítani) h iv a t o t t a sta n d a rd tá b lá z a t-so ro za to k b a foglalt „k lasszikus típ u sú ” sta tisz tik a i a d a tk im u ta tá s o k rendszerét. M eggyőződésünk szerin t hazai s ta tisz tik á n k nem helyezkedhetik a rra az állásp o n tra, hogy m a jd ha lesz idehaza efféle m odern típ u sú sta tisz tik a i a d a t kereslet, ak k o r b eren d ezk ed ü n k a megfelelő a d a tk ín á la tra is. Nem hisszük ugyan , hogy az ilyen állásfoglalások különösebben elterjed tek volna statisz tik u sa in k körében, de m indenesetre érdem es leszögezni, hogy a sta tisz tik a i a d a tk ín á la t és a d a tk e re sle t k ö z ö tt kölcsönhatás áll fenn, s az a d o tt tö rté n e ti hely zetb en alighanem sta tisz tik a i a d a tk ín á la tu n k korszerű fejlesztésével kell m egad n u n k a z t a lökést az állam igazgatási és főleg a gazdasági igazgatási szer vezőm unka és d ö n tésh o zatal m odern, k v a n tita tív a d a to k ra alap o zo tt m ód szereinek m inden igazgatási szinten való elterjedéséhez, am i nélkül a szocia lista terv g azd aság m ost bevezetésre kerülő „ú j m echanizm usa” nem m űköd hetik megfelelően. K ülönben is a felkészülés az i t t v á z o lt típ u sú sta tisz tik a i ad a tszo lg á lta tá sra m ár ö nm agában véve is bizonyos id ő t igényel. A szükséges technika ugyan készen rendelkezésre áll. A világpiacon — kereskedelm i forgalom ban — a nag y teljesítm én y ű (részben m ár b e é p íte tt időm egosztó-berendezéssel is el lá to tt) elek tro n ik u s szám ológépek egész sora szerezhető be, am ely ilyen típusú ad atsz o lg á lta tá s ra alk alm as, s aligha a k ad k ö z ö ttü k olyan, am elyhez ne volna k ap h a tó a ly u k k á rty a -a d a to k a t nagy sebességgel m ágnesszalagra átkódoló bem eneti berendezés, telex-csatlakozások céljára való a d a p te r, to v á b b á — am i ta lá n m indennél fo n to sab b — az a sokféle, m ágnestekercsen tá ro lt, vag y m ár m agába a gépbe „ b e é p íte tt” p rogram , am i lehetővé teszi a legváltozatosabb szükségleteknek megfelelő gépi adatfeld o lg o zást a megfelelő kód-cím ek egy szerű „ le h ív á sá v a l” . M eglevő elektronikus szám ológépeinknek nem az a leg főbb b a ju k , hogy viszonylag kis teljesítm én y ű ek, hanem az, hogy ja v arészt h ián y o zn ak h o zzáju k azok a korszerű bem eneti és kim eneti berendezések, v ala m in t kész program ok, am elyek h íján az ilyen gépek adatfeldolgozó képes sége egyszerűen nem a k n á z h a tó ki. H iáb a tu d egy elektronikus szám ológép p ár m ásodperc a la tt tö b b százezer v ag y a k á r m illió m ű v eletet elvégezni, ha elő tte napokig v agy hetekig kell a program ozásán dolgozni, m ajd fáradságo san á t kell kódolni a b etáp lálan d ó a d a ta n y a g o t olyan lyukszalagra, am ire ez a géptíp u s — és éppen csak ez az egyetlen gép típ u s — be v a n rendezve. S ism ét csak h iáb a oldja m eg a z u tá n a gép — tu d á sá n a k megfelelően — p illan ato k a la tt a rá b íz o tt szám ítási vagy adatren d ezési felad ato t, h a az eredm ény m egint csak lassan és nem k ö zv etlen ü l felhasználásra kész fo rm áb an íródik ki, s eset leg csak hosszabb idő m ú lv a ju tta th a tjá k el a m egrendelőhöz, legjobb esetben az „expressz-levél” sebességével. Az a d a tk e re slet v á rh a tó — illetv e h ely en k én t m áris m egm utatkozó — m inőségi m egváltozása azonban nem k o rláto zó dik a rra, hogy a fogyasztónak m ost m ár a s ta tisz tik a i felvétel alap v ető elemi a d a ta n y a g á b a n meglevő infor m ációhalm az legkülönfélébb részh alm azain ak tetszőleges adatcso p o rto sítású k im u ta tá sá ra lehet szüksége. A társad alo m , a gazdaság, a tec h n ik a gyors fej lődésével és az újszerű, sokszor egészen speciális sta tisz tik a i a d a tb á z ist
DR.
26
SZ A L A I S Á N D O R
igénylő t e r v - és döntés-optim alizálási, o p eráció k u tatási stb. eljárásoknak nagy a rá n y ú elterjedésével m ind g y ak o rib b á v álik az a helyzet, hogy igen rövid idő h a tá ro n belül v a n szükség olyan a d a tk im u ta tá so k ra , am elyeknek elemi adatanyaga sem áll rendelkezésre, m e rt m egfelelő tá rg y ú sta tisz tik a i adatfelvétel eddig egyszerűen nem készült. Ezen persze sem m iféle elektronikus szám ológép önm agában véve nem segíthet. Л sta tisz tik u sn a k végre kell h a jta n ia — m éghozzá sürgősen — a szóban forgó tá rg y ú a d a tfe lv é telt. Szerencsére erre a sta tisz tik u s elvileg igen jól felkészült, m e rt a re p re z en ta tív sta tisz tik a i ad a tfe lv étel korszerű m ódszerei nek latb a v e té sé v el á lta lá b a n legalább a szóban forgó sokaság igen m egbíz h a tó m in tá já ró l viszonylag rövid idő a la tt el tu d ja készíteni a felvételt. E z u tá n azonban — az eddigi tech n ik a m ellett — k ö zb eik tató d ik egy elég hosszú (teljes ará n y ú , országos felvételek esetében m indig hetekig, a népszám lálás esetében hónapokig ta rtó ) m unkaszakasz, am ikor is a k érd ő ív -ad a to k n ak ly u k k á rty á ra való á tv ite le folyik. E z költséges és id ő t rabló m u n k a, m ert hiszen még ha a kérdezőbiztos a kész kódszám ot írta is be a k a p o tt válaszok n y o m án a k é rd ő ív megfelelő kis négyzetébe, azért m inden egyes ilyen kód szám jegyet u tó b b még le kell b illen ty ű zn i a megfelelő lyu k k árty a-o szlo p b a való b ely u k asztás v é g e tt az e célra b e á llíto tt k á rty a ly u k a sz tó gépeken, a ly u k asztáso k helyességét — m egint csak m anuális billentyűzéssel — ellen őrizni kell s tb .2 E b b en a v o n a tk o zásb an nagyjelentőségű ú jítás az a ,,FO SD IC ” -n ak el n ev ezett teljesen a u to m a tik u s gépi berendezés, am elyet a B u reau of th e Census-nál lá tta m bevezetve, s am ely — lényegében egyszerű tech n ik ai elv alap-
GOOD
.
Good
0 1 2 3 4
* о О 0 О
•
I n c o m p le te
0 0 0 0 о о О 0 О О 0 0 © о О О О 0 #> о
л О- {';■ 1 ф \ * 3 3 3 Л: Л:
.
0
О 0 е о 2 0 0 0 3 0 о о •1 о 0 0 О
1 о
о о о о 0 0 © о о Q>
NO GOOD
N o t A c c e p ta b le
N ot A c c e p ta b le
0 v0 о о 1 о & о ? О О 0 3 О О О 4 О О 0
5 0
о о О 'S} о
о о О О
6 7 8 <р 9
wi 2 * л:
i 2 3 в
3
2
к
2
£
Л Ą
Ą
-V ё
7 *7
yf
7 7
0 о #о О О 0 О 0 О
0 0 0 о о о $ О О 0 ^ 0 О О О
•:> С* 0 i #: I •• .*;! 3 .
I
N ot A c c e p ta b le 5 0—©—о— о—о~ 6 0 0 0 0 0
7 <Ь о о о о 0 0 0 0 SO О О 0 о 8 0
0 I
:• л
2 A z N D K - b a n é rv é n y e s n o rm a s z e rin t eg y 9 fő n y i (5 ly u k a s z tó n és 4 ly u k a sz tá s e lle n ő rz ő g é p e n do lg o zó ) sz e m é ly z e t h a v i te lje sítm é n y e — á tla g 4 5 oszlo p o s k á rty a - k ih a s z n á lá s t, v a g y is k á r t y á n k é n t 45 ly u k a s z tá s t fe lté te le z v e — 100 000 k á r ty a . (L o c h k a rte n te c lm ik . S z e rk .: H e in z S ch ö p p en Ihau. B e rlin , 1964. 3 2 5 . p .)
A Z A D A TSZO LG ÁLTATÁS
G É P E S ÍT É S E
27
já n — lehetővé teszi, hogy az elektronikus szám ológépi adatfeldolgozás köz vetlenül azokról a k érdőívekről tö rté n jé k , am ely eket a szám lálóbiztos a m aga bejegyzéseivel b esz o lg á lta to tt. A „F O S D IC ” szó a ,,film optical sensing device for inp u t to com puters” kifejezés rö v id ítése; i t t te h á t a szám ológépek bem e n etéb en a lk alm azh ató film -optikai jelfelvevő-berendezésről v an szó. M űkö dése röviden a k ö v e tk e z ő : A szám lálóbiztos speciális puha, fekete ceruzával jegyezi be a kérdőívre a k a p o tt v álaszo k n ak megfelelő kódszám o k at, m égpedig oly m ódon, hogy be fek e títi a k érd ő ív m a rg ó já n m inden egyes kérdés m ellett m eg találh ató szám k ö röcskék v ag y p erfo rált szám jegyek közül azo k at, am elyek a válasz k ó d já n ak m egfelelnek. Csak arra kell vigyáznia, hogy az előírt helyet jól b efeketít se; eg y éb k én t az eljárás u gyanaz, m in th a a szokványos m ódon egy szám ot írna be az e lő n y o m ta to tt kód-kockába. (L ásd a 26. oldalon a B ureau of Cen sus népszám lálási szám lálóbiztosai szám ára k ia d o tt u ta sítá sb ó l v e tt rajzo t, am ely első oszlopában a helyesen v ég zett, tö b b i oszlopaiban a h ely telenül v é g z e tt bejegyzéseket szem lélteti.) Az így k itö ltö tt k érd ő ív ek et m árm o st beérkezésük u tá n a FO SD IC -berendezés speciális film felvevő gépe eg y m ásu tán teljesen a u to m a tik u sa n á tfé n y képezi egy 16 m illim éter szélességű film eg y m ásu tán következő k o ck áira. Ez a film felvevő gép a n n y ib a n „speciális” , hogy egyfelől igen gyors m űködésű b erak ó szerk ezettel v an ellátv a, am ely igen gyorsan v á lto g a tja a gép lencséje e lő tt m egjelenő k érd ő ív ek et, m ásrészt pedig m egfelelő fotocellás ap p a rá tu sa révén gondoskodik arró l, hogy a felvételnél m inden kérdőív „ reg isz tert t a r t son” , azaz e lő n y o m ta to tt szám -köröcskéinek, ill. p erfo rált szám jegyeinek sora és oszlopai m indig p o n to san u g y a n a rra a helyre essenek. A meg nem felelő m ódon k itö ltö tt k érd ő ív ek et, te h á t azo k at, am elyeken a „ b e fe k etítés” nem az elő írt m ódon tö r té n t v ag y egészen e lm arad t, a berendezés a u to m a tik u san visszaveti. Egy-egy ilyen film felvevő ó rá n k é n t sok ezer kérdőívről készít m eg felelő szám ú film kockával rendelkező szalagot. E gy tu c a t ilyen film felvevő gép párhuzam os beállításáv al s m inden egyes gépre ó rá n k é n t csupán 6000 felv ételt szám ítv a — am i megfelel a korszerű nyo m dagépek p ap írív b erak ó szerkezeti sebességének — egy 24 órás m u n k a n ap a la tt tö b b m in t 1 1/2 millió kérd ő ív lap ró l készülhet film felvétel, am i pél dául az E g y esü lt Á llam ok 1960. évi n ép szám lálásának közel 50 millió kédőívoldalt kitev ő dokum entum -töm ege m ellett is a z t jelenti, hogy a népszám lálási k érdőívek b eg y ű jtésétő l sz á m íto tt 1 hónapon belül elkészülhet a film szalag a teljes népszám lálási anyagról. A FO SD IC -berendezés h átralev ő része m árm ost egyszerűen egy olyan katódcsöves és fotocellás berendezésből áll, am elyen nagy sebességgel á tf u t ta th a tó az így k észü lt film szalag, m iközben a katódcső sugara sorról sorra „ le ta p o g a tja ” a negatív film en a z o k a t az átlátszó p o n to csk ák at, am elyek az eredeti kérdő iv ek fekete p ö tty-bejegyzéseinek megfelelő helyeken jelentkez tek . A film szalag m ö g ö tt elh ely ezett fotocellák elektrom os im pulzusokká ala k ítjá k á t az ilyen á tlá tsz ó pontocskák fellépésénél rá ju k eső fén y su g arak at, s ezek az elektrom os im pulzusok azonnal át íródnak az elektronikus szám oló gép m ágnesszalagjára. S ezzel rendelkezésre áll tetszőleges ad atcso portosítású a d a tk im u ta tá s v agy táb lázatk észítés szám ára az egész népszám lálási anyag. (4) P illa n a tn y ila g m ég az a h elyzet, hogy — am ennyire tu d n i leh et — csu p án a B ureau of Census rendelkezik ilyen FO SD IC -típusú berendezéssel.
28
DR. SZALAI SÁNDOR
N yilvánvaló, hogy ez a m ai elek tro n ik u s tech n ik a m e lle tt eg y általán nem különösen b o n y o lu ltn ak m o n d h ató kérdőívleolvasó a u to m a ta vagy ennek vavalam ily en v á lto z a ta igen h a m a r kereskedelm i forgalom ban lesz. E z pedig a n n y it jelen t, hogy a sta tisz tik a i a d a tk ín á la t k ite rje d h e t m ajd tetszőleges tá r gyú re p re z en ta tív sta tisz tik a i felvételek készen tá b lá z a to lt eredm ényeinek a felvételtől sz á m íto tt n éh án y n ap o n belüli p rezen tálására, s teljes népszám lálási tá b lá z a t-so ro z a to k n a k n éh án y hónapon belül való előállítására. Mon dani sem kell, hogy az ilyen „ n a p ra k é sz ” sta tisz tik a i ad a tsz o lg áltatás m eny nyire növelné az a d a to k operatív h a sz n o síth a tó sá g át az állam i és gazdasági igazg atásb an . S ism ét biztosra v esszü k : az erről az oldalról m egnyilvánuló ad a tk e re sle t előbb u tó b b még az a d a tk ín á la tn a k ezt a rendkívüli m é rték é t fejlődését is nyom on fogja követni! A R E P R E Z E N T A T Í V S T A T I S Z T I K A
ÉS A M Á S O D L A G O S
E L E M Z É S
Az UNESCO m ellett m űködő N em zetk özi T ársad alo m tu d o m án y i T anács 1964 szeptem berében nem zetközi k o n feren ciát re n d ez ett P árizsb an az ún. tár sadalom tudom ányi adatarchívum ok p roblém áinak m eg v itatására. A n y u g ati országokban, ahol a sta tis z tik a i h iv atalo k o n k ívül szám os egyéb, részben tu d o m án y o s, részben kom m erciális jellegű intézm ény is foglalkozik reprezen ta tív sta tis z tik a i ad atfelv ételek készítésével, m ind több helyen alak u ln ak olyan arch ív u m o k , am elyek „ h a sz n á la t u tá n ” átveszik a megfelelő ly u k k á rty a a n y a g o t és m egőrzik későbbi másodlagos elemzések céljára. Term észetesen az a d a tfe lv é te lt eredetileg v ég reh ajtó intézm ény m egszabhatja, hogy kiknek és miféle term észetű vizsgálódásokhoz b o csáth ató rendelkezésre a m egőrzött ly u k k á rty a -a n y a g , sőt eseten k én t kikérendő engedélyhez is k ö th eti az anyag h a sz n á la tá t. M indenesetre ily m ódon a szociológiai, közgazdaságtudom ányi, tö rté n e ttu d o m á n y i stb . k u ta tá s szám ára igen nagy é rté k e t jelentő a d a ta n y a g g y ű lik össze ezekben az arch ív u m o k b an . A m erikai u ta m során például láto g a tá s t te h e tte m a M assachusetts állam beli W illiam stow n egyetem m ellett m ű ködő R o p er P ublic Opinion R esearch C enter-ben, am elynek tö b b m in t 10 m il lió ly u k k á rty á t és nagyszám ú m ágn estek ercset felölelő arch ív u m áb an 1945-ig, ső t részben 1935-ig visszanyúlóan rendelkezésre áll m ásodlagos elemzés céljára tö b b ezer am erik ai és igen sok m ás országbeli legkülönbözőbb célú reprezen ta tív sta tisz tik a i ad atfelv étel anyag a. A m ásodlagos elemzés term észetesen sem m i m ást nem jelen t, m in t az elemi a d a ta n y a g n ak az eredetitől eltérő csopo rto sítású , azaz új szem pontú feldolgozását. M eglehet, hogy egy mosógép g y á ra t eredetileg az érdekelte, m ilyen típ u sú h á z ta rtá so k b a n , m ilyen gyakori sággal és m ilyen m érv ű megelégedéssel h aszn álják a sa já t m aga, ill. a k o n k u rrensei á lta l g y á r to tt gépeket. A p ia c k u ta tó cég, am ely ügyfele m egbízásából ezt a re p re z e n ta tív s ta tisz tik a i a d a tfe lv é te lt elvégezte, elsődlegesen nyilván a m osógépek g y á rtá sa és eladása szem pontjából érdekes csoportosításban dolgozta fel és elem ezte a h á z ta rtá si a d a tg y ű jté s eredm ényeit. A z adatfelvétel ly u k k á rty á i azo nban híven és c so p o rto sítatlan u l őrzik a felvételi m in táb a bev o n t h á z ta rtá s o k összes b e g y ű jtö tt elemi a d a tá t is, s nyilvánvaló, hogy egy ilyen felvétel v ag y éppenséggel egész soro zatnyi ilyen term észetű felvétel elemi a d a ta n y a g a u tó b b igen sokféle tu d o m án y o s vagy egyéb érdekű tá rs a dalm i és gazdasági vizsgálódás céljára érték elhető ki. R észben a z é rt té rtü n k ki az a d a ta rc h ív u m o k szerepére, m e rt ezen in téz m ények lé tre jö tte m aga is a sta tisz tik a i a d a tk e re slet és a d a tk ín á la t egy újabb
AZ
A D A T S Z O L G Á L T A T ÁS G É P E S ÍT É S E
29
fejlődési irá n y á ra u ta l. T a lá n gondolni lehet arra is, hogy idővel h azán k b an is k ialak ítsu k a ren d k ív ü l értékes re p re z e n ta tív sta tisz tik a i ad atfelvételi a n y a goknak ilyen, tá rg y a k és idősorok szerin t re n d e ze tt s a m ásodlagos elem zések fejlesztésére szolgáló ly u k k á rty a -a rc h ív u m á t, am elyet a z u tá n bizonyos h a tá rok k ö z ö tt hozzáférhetővé te h e tn é n k a tu d o m án yos k u ta tá s általán o s céljaira is. N em csak em iatt em lék eztü n k azonban i t t meg az ad atarch ív u m o k sajátos feladatairól, hanem a z é rt is, m e rt éppen ezeknek az intézm ényeknek im ént e m líte tt nem zetközi konferenciáján m u ta tta k be igen tanulságos a d a to k a t arró l, hogy tu la jd o n k é p p e n m ilyen terjedelm ű rep re zen ta tív sta tisz tik a i a d a t felvételező tevékenység folyik m a világszerte. Az 1963. évre v o n atk o zó a d a tg y ű jté s (a szocialista országok nélkül) ta n ú sága szerin t ezen év folyam án a sk a n d in áv országokban 1361, a B eneluxországokban 1197, a N ém et Szövetségi K ö ztársaság b an és A u sztriáb an 930, F ra n c ia o rsz á g b an , O laszországban é s Svájcban pedig 117 re p rez en ta tív sta tisz tik a i ad atfelv étel tö r té n t; a k o n tin en tális E u ró p a összes állam áb an e g y ü tt véve becslés szerin t m in teg y 5000, az E g y e sü lt Á llam okban ugy an ak k o r 3319. B á r o rszágcsoportonként elég változó m érték ű , de egészben véve m in denképpen m egdöbbentő nagyságú sta tisz tik a i ad a tk eresletre u ta ln a k ezek a szám ok. H iszen m eg kell gondolnunk, hogy e re p re zen ta tív sta tisz tik a i a d a t felvételek igen jelen ték en y h á n y a d á t k ifejezetten m egrendelésre, különböző állam i szervek, k özületek, v á lla la to k speciális adatigényeinek fedezésére vé gezték. Az e m líte tt 1964. évi párizsi konferencián Brouwer és H astings professzor b e n y ú jto ttá k je le n té sü k e t az európai és am erikai rep rez en ta tív sta tisz tik a i felvételekre v o n atk o zó 1963. évi a d a tg y ű jté s erdm ényeiről (5). A jelentés egyik-m ásik tá b lá z a to s k im u ta tá sa meglepő inform ációkkal szolgált. Így pél dául a felvételi m in ta nagyság ára, vagyis a m egkérdezett szem élyek szám ára vonatkozó k im u ta tá s szerin t ez a m in tan ag y ság a sk an d in áv országok felvé teleinél csak az esetek 10% -ában h a la d ta m eg a 2000 főt, s csak az esetek 23% -áb an t e t t ki 1001— 2000 főt. A B enelux-országok felvételeinél a m egfe lelő százalékarány 19, ill. 16% , az N SZ K -ban és A u sztriáb an 15, ill. 16% , F ran ciao rszág b an , O laszországban és Svájcban 20, ill. 32% . T e h át egyetlen olyan k im u ta to tt ország sem a k a d t, ahol a re p re z en ta tív sta tisz tik a i felvéte lek felénél vagy m ég nagyobb részénél nem elégedtek volna meg legfeljebb 1000 főt m agábanfoglaló m in táv al, h o lo tt — m in t egy m ásik tá b lá zatb ó l kide r ü lt — a felvételek többsége m in d e n ü tt országos k eresztm etszeti vag y réteg m in tá v a l tö rté n t. Az E g y esü lt Á llam okban a felvételi m in ta nagysága csak az esetek 26% -áb an h a la d ta meg a 600 f ő t; igaz, hogy o tt a felvételek túlnyom ó többsége regionális, ill. lokális k eresztm etszetű vagy réteg m in tá n a la p u lt; viszo n t az országos felvételeknél is ritk á n a lk alm azta k 2000 főt m eghaladó m in tá t. H azai, nem egyszer 5000 v agy a k á r 10 000 fős m in tá k ra kiterjedő rep re z e n ta tív sta tisz tik a i ad atfelv ételein k h ez h aso n lítv a e szám okat az eltérés első p illa n a tra m eglepő. H a jo b b an m egvizsgáljuk a k é rd ést a z t lá tju k , hogy nálu n k a z é rt v alam en n y ire m égis m ás a h elyzet. E lőször is a m i rep re z en ta tív sta tis z tik a i ad atfelv ételein k tú ln y o m ó részt nem ennyire specializált m egren delői ad atig én y ek fedezésére készülnek, hanem általán o sab b h aszn á latra, s így m élyebben b o n to tt, erősebben részletezett a d a tc so p o rto sítá so k at kell n y ú jta niuk, s ak k o r nem á r t bővebbre venni a m in tá t, b ár persze a felvételi költség
30
D R.
SZA L A I SÁNDOR
n ag y já b a n a m in tá b a b ev o n t N főnyi sokaság létszám áv al egyenes arán y b a n növekszik, m íg a felvételi eredm ények m egbízhatósága csupán j/ N m értékében fokozódik. Figyelem be kell venni a z t is, hogy rep re z en ta tív sta tisz tik a i a d a t felvétel tip ik u s tá rg y a i n álu n k m ás term észetűek, m in t a tőkés országokban. Az o tt különösen k u ltiv á lt közvélem ény- és p ia c k u ta tá sb a n sok a m indössze k é t v agy h áro m fokozatú (pl. „igen — nem — közöm bös” típ u sú ) válasz k ateg ó ria, am i viszonylag kis m in tá k n á l is könnyen eredm ényez szignifikán san k iérték elh ető a d a tc so p o rto k a t. M indezek ellenére ta lá n mégis érdem es lenne m egfontolni, vajon nem h at-e közre n á lu n k itt-o tt ném i konzerv ativ izm us, valam i beidegzett bizal m a tlan ság a „ k is ” , szám okkal szem ben ab b an , hogy olyan nagyra szabjuk m in tá in k a t. A re p re z e n ta tív s ta tisz tik a i ad atfelv ételek irán ti szükséglet m á ris érezhető és a jövőben még in k áb b v á rh a tó gyors fokozódása viszont előbbu tó b b kétség telen ü l igen szigorú „ m in ta v é te li tak aré k o sság o t” tesz m ajd szükségessé. T o v á b b á a m i m a te m a tik a ila g kiválóan felkészült m in tav ételi szak értő in k úgyis jól ism erik a kis m in ták ellenőrzésének és kiértékelésének olyan m odern te c h n ik á it, m in t a m in táb ó l véletlenszerűen kiem elt alm in ták egybevetése, v a g y például a „lo st p lo t” („elv eszett parcella” ) m ódszer, am ely lehetővé teszi a m in ta kicsinysége m ia tt üresen m a ra d t vagy tú l kevés esetet felölelő tá b lá z a tce lla tényleges érték én ek in terp o lá lását a cellában kereszte ződő tá b lá z a tso r és oszlop töb b i szignifikáns érték ad a táb ó l. M indezek a te ch n ik ák könnyen a lk alm azh ató k a korszerű elektronikus szám ológépi ad atfel dolgozás keretében. K ész program ok v a n n a k erre a célra, de ezekre itt m ár nem té rh e te k ki bővebben. V iszont a z é rt m ég röviden szólnom kell — röviden, m e rt ez különben m ár ú jab b ta n u lm á n y t igényelne — az elektronikus szám ológépeknek egy olyan s ta tisz tik a i k u ta tá s i alk alm azásáró l, am elynek jelentősége a jövő szem p o n tjáb ó l ta lá n m ég nagyobb, m in t az eddig is m e rte te tt sta tisz tik a i adatjel dolgozási alkalm azásoké. S ZÁM O LÓ G É PI
S Z I M U L Á C I Ó
A D E M O GR Á F
I A I K U TA T Á SB A N
M indazok az elek tro n ik u s adatfeldolgozási tech n ik ák , am elyekről eddig e ta n u lm á n y b a n szó esett, végső soron csak a z t a k n á z tá k ki, hogy az elektro nikus szám ológép h a so n líth a ta tla n u l gyorsabban és rugalm asabb progra m ozással tu d ja elvégezni ugyanazokat a m ű v eleteket, am elyeket elvileg a trad icio n ális ly u k k á rty á s rendező- és tabellázógépeken is el lehetne végezni, b á r ez az á lta lu n k p éld ak én t felh o zo tt feladatm egoldások esetében teljesen ab szurd idő- és m u n k a e rő -rá fo rd ítá so k a t igényelne. Az elek tro n ik u s szám ológép azonban nem egyszerűen valam i gigászi te l jesítőképességű „ s z o rte r” és „ ta b u lá to r ” , hanem egészen m ás term észetű felad ato k m egoldására is k épes: nem csak meglevő a d a to k a t tu d feldolgozni, h anem ú ja k a t is tu d p rodukálni. Bizonyos értelem ben univerzális kísérletező gépnek nevezh etn ő k , am ely a tá rsa d a lo m tu d o m án y i k u ta tá s sok ága szám ára először te tte hozzáférhetővé az experim entális kutatás olyan lehetőségeit, am ilyenek k o ráb b an csak a te rm észettu d o m án y o k b an vo ltak ism eretesek, azokban sem m in d e n ü tt, A sok tá rsa d a lo m tu d o m á n y i k u ta tá s i ág közül csak egyetlen egyről szeretnék i t t beszélni: a dem ográfiáról.
AZ
ADATSZOLGÁLTATÁS
G É P E S ÍT É S E
31
A dem ográfia helyzete a m ú ltb a n bizonyos szem pontból igen szerencsét len vo lt. E gyfelől m á r rég ó ta a szabatos szám szerű a d a to k — tu la jd o n k é p p e n : m érési a d a to k — olyan bőségével és a m a te m a tik ai elemzés olyan k ifin o m u lt eszközeivel ren d elk ezett, m in t a társad alo m tu d o m án y o k egyike sem és a term é sz e ttu d o m á n y o k közül is csak kevés. M ásfelől azonban tá rg y a — a „népm ozgalom ” , vagyis az em berek születése, család alap ítása, p á ly afu tása és halála — sajáto s jellegénél fogva m indennem ű kísérletezést eleve k iz árt, viszont olyan h a lla tla n u l kom plex, soktényezős rendszernek bizonyult, am ely nek m ozgástörvényei szám os v o n a tk o zásb an m ég a m a te m a tik a i analízis jelenlegi eszközeivel sem k ö zelíth ető k meg a n n y ira , hogy a k á r csak gyakorla tila g kielégítő pontosságú jóslásokkal lehetne élni ilyen alapon a rendszer jövőbeli á lla p o ta it illetően. Igaz, az ex p erim en tális ta p a s z ta la to k a t, am elyek a term ész ettu d o m á nyok n ak sem m inden ágában lehetségesek, bizonyos h a tá ro k k ö z ö tt pótol h a tja a különféle tén y ező k h a tá sá ra beálló term észetes változások hosszan ta r tó megfigyelése. A dem ográfia h elyzete azonban e te k in te tb e n is h átrán y o s, m ert egy em ber egész élete legfeljebb egyetlen nem zedék életének nyom onkövetésére elég, s am i az elm ú lt idők em bereit illeti, azokról csak alig néhány nem zedékre visszam enőleg van m egbízható dem ográfiai a d a t. S a dem ográfiának éppen ezen a k ettő s b a já n : az experim entális lehető ségek h ián y án és a különféle tényezők h a tá sá ra beálló népesedési változások sok nem zedéken á t való m egfigyelésének nehézségein tu d segíteni — bizo nyos h a tá ro k k ö z ö tt — az elek tro n ik u s szám ológép szimulációs célokra való felhasználása. Sok m a g y a rá z at h e ly e tt egyetlen k o n k ré t p é ld a : R égi pro b lém ája a szociálantropológiának, a gen etik án ak , s — bizonyos á tté te lb e n — a dem ográfiának, hogy a különféle tá rsa d a lm a k b a n fennálló házassági tila lm a k és preferenciák, am elyek egyfelől m egakadályozzák a különböző népességcsoportok, ill. családok bizonyos ta g ja i k ö z ö tt a házaso d ási, m ásfelől igen eltérő feltételes valószínűségeket b izto sítan a k a p á r v álasztás különböző m egengedett típ u sa i szám ára, m ilyen népességi m eg oszlásokra vezetnek, m ilyen m érték ű k everedést vagy m ob ilitást eredm ényez nek a különféle népességcsoportok k ö z ö tt, s ez a keveredés vagy m obilitás végül is valam iféle stab ilis n ép esség -stru k tú ra k ialak u lásáb a torkollik-e vagy sem. Az ilyen típ u sú problém ák — s ezekből a dem ográfia te rü letén sok a k a d ! — á lta lá b a n nem o ld h ató k m eg an a litik u s eszközökkel. A m ate m atik ai kom b in a to rik á n a k , de m ég a M arkov-láncok m anapság nagyon fe jle tt elm életének sincsenek m eg azok az eszközei, am elyekkel egy b o n yolultabb tilalom - vagy preferencia-rendszernek több nem zedéken á t való k ih a tá sa it, sta b ilitá s k rité riu m a it stb . k épletszerűen fel lehetne írni és ki lehetne szám ítani, különösen h a még olyan bonyo d alm ak is k ö zbejöhetnek, m in t a különböző nem zedékek ta g ja i k ö zti házasság, am iből csak ak k o r a d ó d h a tik u tó d , ha m in d k ét fél még nem zőképes k o rb an v an , s a k o m p lik áció k at m ég az is sú lyosbítja, hogy m in den fajta p á rv á la sz tás m ás-m ás valószínűséggel vezet gyerm ektelenségre, egy v agy tö b b u tó d létreh o zására a férj, ill. a feleség ilyen vag y olyan népes ségcsoportbeli h o v a ta rto z á sa szerint. Nos, a p rin ceto n i egyetem szám ológépén épp a közelm últban o ld o ttak
32
DR.
SZALAI
SÁNDOR
meg egy ilyen típ u sú p ro b lém át, m égpedig igen rövid idő a la tt, a következő (elvi v ázlatossággal leírt) szimulációs m ódszer alkalm azásával (6). A szám ológép m em ó riájáb a „ b e írtá k ” a kezdeti népesség m inden egyes ta g já n a k releváns a d a ta it. Bizonyos m eg h atá ro z o tt nagyságú népességm intá val dolgoztak, de a m in ta m inden egyes ta g ja külön-külön „ad a trek esszel” szerepelt a m em óriában. A g épet a z u tá n úgy p ro gram ozták, hogy m inden férfinak és nőnek eg y en k én t olvassa le az a d a ta it, m ajd a m eg ad o tt tilalom v agy p referencia-lista tételei a la p já n állap ítsa meg, hogy az illető férfi vagy nő m ilyen típ u sú p á rt nem v á la sz th a t, s m ilyen valószínűséggel v á la sz th a t ilyen vagy olyan m ás típ u sú p á rt. E p á rv álasztási valószínűségnek megfe lelően a z u tá n a gép véletlenszerű („ ra n d o m ” ) szám ok pro d u k álásáv al úgy szólván „ k ik o c k á z ta ” , hogy az első szám ú férfinak miféle feleség dukál, m ajd ism ét v életlenszerűen sorra „ le ta p o g a tta ” bizonyos szám ú nő „ a d a t rek eszét” , akad-e benne éppen ilyen feleség. H a a k a d t, ak k o r m in d já rt „hoz z á a d ta ” ehhez a férfihez, s m e g á lla p íto tta a valószínűleg v á rh a tó u tódszám ot. H a nem a k a d t m e g h a tá ro z o tt szám ú lépés u tá n megfelelő nő, ak k o r ez a férfi „ n ő tle n ” m a ra d t, s a gép r á té r t a m ásodik szám ú férfi sorsának intézésére. S így to v á b b — végig az egész nem zedéken, s am ikor az egész nem zedék sorsa eldőlt, a megfelelő szám ú „g y erm ek ” is m in d e n ü tt m eg született (meg felelő egyedi „ a d a tre k e s z t” k a p v a a gép m em óriájában), ak k o r a gép kiíró szerkezete megfelelő program a la p já n „ fe lsta tisz tik á z ta ” egy p a p írlap ra az „ősnem zedék” és első „u tó d n em zed ék e” pontos dem ográfiai a d a ta it a k ív á n t n é p c so p o rt-h o v atarto zási és egyéb jegyek alap ján . P á r perc te lt el ekkor az egész szim ulációs program m egkezdése óta. M iközben az írószerkezete kopo g o tt, a gép m á r ennek az első „ u tó d n em zed ék n ek ” megfelelő p á ro sítá sá t in tézte, a szabályok szigorú b e ta rtá sá v a l. Így k ö v e tte nem zedékről nem zedékre to v á b b — 740 év et p á r ó rányi gépidőbe sű rítv e — a dem ográfiai viszo nyok a la k u lá sá t; m inden nem zedék m inden egyes ta g já n á l szám ításba véve, hogy miféle „házaso d ási k a ra k te risz tik á h o z ” ju to tt szü lőpárjának sajátos összetétele révén. A h iv a tk o z o tt közlem ény szerin t a princetoni egyetem szám ológépi köz p o n tja 3 k ív á n a tra b árk in ek m egküldi e szim ulációs program ot, am ely csekély m ódosítással igen sok más fa jtá jú dem ográfiai fo ly am at kísérleti nyom onkövetésére, különféle p aram éterek alk alm azása m ellett beálló népesség megoszlási, m obilitási, stabilizálódási stb . k rité riu m a in ak kikísérletezésére is alkalm as. Sajnos a p rogram egyebek k ö z t egy 8000 főnyi m intanépesség a d a ta in a k 8 0 0 0 x 3 „ s z ó t” (gépi jelsoro zato t) ta rta lm a z ó m em ó ria-m atrix b an való n y ilv á n ta rtá s á t igényli, s ily m ódon csak IBM 7090-típusú vagy ehhez hasonló szám ológépekre alk alm azh ató . B izo n y ára nem szükséges s ta tisz tik u s és dem ográfus olvasóim szám ára külön kifejten em , hogy a s ta tisz tik a i a d a tszo lg á lta tás fejlődésének m ilyen lehetőségei tá ru ln a k fel, ha a tá rsa d a lm i és gazdasági tervezés szám ára ilyen típ u sú szim ulációs a d a to k a t tu d szo lg áltatni a sta tisz tik a i a p p a rá tu s külön böző intézkedések („ tila lm a k ” , „p referen ciák ” ) v á rh a tó k ih atásáró l a tá rs a dalom és a gazdaság s tru k tú rá já ra , illetve stru k tu rá lis m o bilitására és stab ili tá sá ra . 3 C o m p u te r C e n te r. P r in c e to n U n iv e rs ity . P rin c e to n , N e w J e r s e y .
AZ
AD A T S Z O L G Á L T A T ÁS
G É P E S Í T É S E
IR O D A L O M 1. M. I. T . C o m p u ta tio n C e n te r: T h e C o m p a tib le T im e -S h a rin g S y s te m . A P r o g ra m m e r’s G u id e . C am b rid g e . M a s sa c h u se tts . 1963. 2 . Taeuber, C.: N ew M e th o d s fo r D is se m in a tin g C ensus R e s u lts . P a p e rs of th e C o n feren ce o n C om p u te r M e th o d s in th e A n a ly sis o f L a rg e -S c a le S o cial S y ste m s. C am b rid g e . M a s sa c h u se tts . O c to b e r 21, 1964. 3. K e y filz , N . — M u r p h y , E . M .: H o w m u c h D e m o g ra p h ic R e tu r n c a n a S ingle P ro g ra m E x t r a c t? Uo. 4. F O S D IC I I I to a ssist in 1960 cen su s. N B S T e c h n ic a l N e w s B u lle tin 43 (1959). A z e lő z m é n y e k e t ille tő e n : F O S D IC I I re a d s m ic ro film e d lu n c h e d c a rd s. U o. 41 (1 9 5 7 ); F O S D IC — a film o p tic a l sen sin g d e v ic e fo r in p u t to c o m p u te rs . Uo. 3 8 (1 9 5 4 ). 5. B ro u w er, M .: T h e 1963 P ro d u c tio n of S a m p le S u rv e y s in C o n tin e n ta l E u ro p e . P a p e rs of th e C o n feren ce o n D a ta A rc h iv e s. P a ris . S e p te m b e r 1963. H a stin g s, P . K .: I n v e n to r y o f A m e ric a n P ro d u c tio n o f S a m p le S u rv e y D a ta in 1963. U o. 6. K u n sta d te r , P ., B u h le r, R ., S te p h a n , F . F ., W esto ff, Ch. F .: D e m o g ra p h ie V a ria b ility a n d P r e fe re n tia l M a rria g e P a tte r n s . A m e rica n J o u r n a l of P h y sic a l A n th ro p o lo g y , 1963. évi. 4. sz.
СПРОС И П Р Е Д Л О Ж Е Н И Е Д А Н Н Ы X В СТАТ И СТ И К Е Резюме Очерк содержит некоторые соображ ения автора, созревшие в нем на основе опыта, накопленного во время поездки автора в 1964 году в Соеди ненных Ш татах Америки. Автор осенью 1964 года в течение одного семестра был приглашенным профессором ф акультета общественных и экономических наук в Massa chusetts In stitu te of Technology (М. I. Т.). Здесь ему открылась возм ож ность познакомиться с парком электронны х вычислительных машин, имеющимся в распоряж ении кафедр университета, особенно с вычисли тельной машиной типа IBM 7094, которая предназначена для проведения так называемых «коротких» то есть предполагающ их по крайней мере 10— 15 миллионов элементарных расчетных операций и таким образом проводи мых за 20— 30 секунд машинного времени исследовательских расчетов, экспериментальны х симуляций и других подобных работ. Вычислитель ная машина используется кафедрами с помощью их «консоль» (пиш ущ ая машина-телекс). (В ц елях решения более «длинных», чем указанные, задач следует использовать другую машину центра вычислительных машин.) Ввиду того, что в магнитоленточной и магнитнокольцевой памяти вычислительной машины х р ан ятся многие тысячи готовых к использова нию расчетных и прочих программ, рутинов и субрутипов, которые могут быть «набраны» па основе записи шифров, использование машины не сопро вождается никакими трудностями. Автор излагает сведения о лентах, содержащих сокращ енные результаты переписи населения в размере 1:1000 и 1:200 бюро переписи населения США и о возмож ностях их п р и менения. В очерке указы вается на то, что при традиционных условиях статисти ческой работы разработка собранной огромной массы информаций по всем комбинациям критериев не является возможной. Н апример, полная р а з работка всех вопросов формуляров переписи населения но всем возмож ностям комбинации вы звала бы необходимость в составлении и исчислении ряда сотен тысяч или миллионов таблиц. Если спрос возникает на такце данные, комбинация критериев кото рых не имеется в тех нескольких ты сячах таблицах, которые были выбраны из указан ны х возможных случаев, — хотя эти критерии содерж ались в ф орм улярах, —• то при традиционных условиях статистической работы этот спрос может быть удовлетворен только путем оценки, основанной на таблицах родственного содерж ания или этот спрос вообще не может быть удовлетворен (за исключением того случая, когда весь материал вопрос ников заново разрабаты вается с точки зрения указанной комбинации критериев, что конечно может иметь место только в весьма исклю читель ном случае). 3 D em ográfia
34
DR.
S ZA LAI
SÁNDOR
Таким образом, значительная част информационного содерж ания проведенных с значительными затратами рабочей силы и расходов сборов данных остается неиспользованной. Вопрос заклю чается в том, имеется ли спрос на эти данные. В настоящее время информации, необходимые для вынесения решений в государственном управлении, на предприятиях и т. д., к ак правило, могут быть удовлетворены па основе данных, разработанны х при помощи традиционных статистических методов. Однако будущее развитие такое, что все время увеличивается потребность в обосновании официальных реше ний статистическими данными. Однако удовлетворение ожидаемого в бу дущем спроса на качественно изменившиеся данные с помощью тради ционной машинной техники не является возможным. Это может быть ре шено только с помощью регистрации элементарных данных на магнитных лентах, так к а к с них электронная вы числительная машина за очень короткое время может составить сведения данных по любым комбинациям критериев. Статистика долж на подготовиться к росту потребностей по отношению к данным, к удовлетворению спроса на данные, а даж е, по мнению автора, с помощью современного увеличения предлож ения данных она долж на способствовать распространению обоснованных на современных количест венных данных методов работы по управлению и организации хозяйства и вынесения решений. Рост спроса на данные часто означает и то, что следует проводить новые специальные обследования. Разработка собранных данных я в л я ется относительно продолжительной даж е при использовании перфокарточной техники, хотя в данных, как правило, имеется срочная необходи мость. В этом отношении новшеством большого значения является авто матическое машинное оборудование, названное FOSDIC (film optical sensing device for in p u t to com puters), которое создает возможность для того, чтобы разработка данных электронными вычислительными машинами проводилась непосредственно с формуляров. Отчитываясь о своем опыте, полученном при посещении Roper Public Opinion R esearch Center при университете W illiams tow n автор выдвигает вопрос о необходимости сохранения происходящего из выборочных обсле дований перфокарточного материала в целях проведения вторичных анализов. Согласно данным по 1963 году, в течение этого года во всех госу дарствах континентальной Европы (без социалистических стран) прово дилось около 5000, а в Соединенных Ш татах — 3319 выборочных обследо ваний. По докладу профессоров Brouwer и Hastings, представленному париж ской конференции М еждународного Совета по Общественным Н ау кам при Ю ОНЕСКО, состоявшейся в 1964 году, в исследованных странах в случае больше чем половины выборочных обследований удовлетворя лись и выборками, охватывающими меньше 1000 лиц. Сопоставляя данные доклада с венгерскими данными автор приходит к заклю чению, что несмотря на специальные условия, определяющие величину численности отечественных выборок, следовало бы посмотреть возможность применения маленьких выборок. Н аконец, заним аясь вопросом применения электронных вычислитель ных машин для симуляционных целей, автор излагает демографическое исследование, проведенное на вычислительной машине в Принстонском университете. DEMAND
FOR
АN D S U P P L Y
ОF D A T A
IN STA TISTICS
S u m m a ry Th e s tu d y p re se n ts som e ideas of th e a u th o r, developed b y him on basis of his e x p e riences g ained in th e U n ite d S ta te s of A m erica in 1964. In th e a u tu m n of 1964 th e a u th o r a cted as visitin g le c tu re r a t th e D e p a rtm e n t of E conom ies a n d Social Science of th e M assachusetts I n s titu te of T echnology for a term . H e
AZ A D A T S Z O L G Ä L T A T Ä S
GÉPE SÍT É SE
35
h a d th e o p p o rtu n ity th e re to s tu d y th e o rg an izatio n of t h e c o m p u te r c en ter of M .I.T ., especially th e tim e sh a rin g sy stem based on an IBM 7094 ty p e c o m p u te r,.d e stin e d for socalled “ b rief c o m p u ta tio n s” of a t a t m o st 10— 15 m illion elem en tary o perations. A b o u t 1.50 te le ty p e r consoles a re a tta c h e d to th is tim e sh a rin g system for q uasi-sim ultaneous use. A n am ple su p p ly of p ro g ram es, ro u tin e s a n d su b -ro u tin es is m ad e d ire c tly available in a n y needed com b in atio n for purposes of c o m p u ta tio n , m odelling, sim ulation, etc. b y th e use of a re la tiv e ly sim ple p ro g ram in g lan g u ag e (w it h a se t of com pilers fo r o th er p rogram ing languages of a m ore g e n era l c h ara cte r). T he a u th o r refers to re ce n t d evelopm ents w hich p e rm it th e sto rin g of v a s t sto k s of social science d a ta in th e m em o ry of such research com puters. H e gives a cc o u n t of th e sy ste m of producing 1 : 1000 a n d 1 : 200 ex cerp ts of un ag g reg ated p opulation census d a ta on m a g n e tic ta p e for social science research purposes — a sy ste m in itia te d re ce n tly b y th e US B ureau of Census. T he tra d itio n a l ta b le s produced b y sta tistic a l services a c t in effect as “ filte rs” m ak in g a v ailab le only c erta in h a n d s of th e in form ation c o n ta in ed in the w hole set of collected d a ta . E v en th e in fo rm atio n c o n te n t w hich passes th o se filters is “ a g g re g a te d ” according to c ertain com bined criteria. D em ands for d a ta w hich correspond to o th e r com b in atio n s — a n d th e re are no rm ally m illions of possible co m b in atio n s even from a m o d era te n u m ber of single c riteria ! — can be m et o nly b y m eans of e stim a te s based on th e available ta b le s or c a n n o t be satisfied a t all, except a t the price of re-processing th e w hole d a ta m a te ria l w hich is m o stly unfeasible in view of th e high cost and th e slow ness of tra d itio n a l ta b u la tio n m ethods. T h u s a significant p a rt of th e in fo rm a tio n c o n te n t of th e d a ta collec tio n s perform ed b y m eans of considerable m an p o w er a n d e x p e n d itu re rem ain s unused. M odern electronic d a ta processing p e rm its u n lim ite d e x p lo itatio n of th e original unaggre g ated d a ta m a te ria l sto re d on m agnetic ta p e or sim ilar m edia. T h e question arises if th e re ex ists a d em an d for su ch an e x p lo itatio n ? A t p re sen t th e tra d itio n a l tab le s p ro d u ced lay experienced sta tistic a l services seem to be sufficient for m o st g o v e rn m e n ta l or econom ic decision m ak in g organs. M uch of th e sta tistic a l m a te ria l p roduced rem ains p erh ap s even unused. T he f u tu re developm ent, how e ver, poin ts to a n increasin g n e ce ssity of official decision m ak in g based on a rra y s of d a ta w hich correspond to v e ry specific a n d ev er c hanging co m b in atio n s оГ criteria. “ S econdary a n aly sis” will becom e a p rim a ry a n d n on-ending ta s k of sta tistic a l services. T h e dem and for d a ta — w hich will be n o t only q u a n tita tiv e ly b u t q u a lita tiv e ly d iffere n t from th e pre se n t dem and — c a n n o t be m e t w ith o u t h a v in g ail th e e le m en tary d a ta all th e tim e re a d y “ on ta p e ” a n d w ith o u t h a v in g speedy access to th e m according to a n y w a n te d c o m b in a tio n s of criteria. S ta tistic a l services have to p rep are th em selv es to th is situ a tio n — th e m ore so as only a m uch increased e la stic ity of d a ta su p p ly can pro m o te m uch needed “ d a t a b a se d ” g o v ern m en tal a n d econom ic decision m aking. T h e “ d a ta h u n g e r” can even to d a y n o t be stilled w ith o u t g re atly increased sam ple su rv e y a c tiv ity . A s a ru le such su rv e y d a ta are req u ire d u rg e n tly a n d th e p u n ch in g of c ard s m akes d a ta processing a le n g th y business. In th is resp ect th e FO SD IC sy ste m (film o ptical sensing device for in p u t to co m puters) is an in n o v atio n of g re a t im p o rta n ce p e rm itt ing d a ta processing b y co m p u te rs d irectly from q uestionnaires. G iving a cc o u n t of his v isit to th e R o p er P u b lic O pinion R esearch C enter in W illiam stow n w here 10 m illion p u n c h e d cards from polls a n d su rv e y s going back till 1935 are p re served, th e a u th o r raises th e necessity of estab lish in g a n archive for sim ila r m ate ria ls, especially for pu n ch ed c ard s from sam ple surveys, p roduced in H u n g a ry . A ccording to re p o rts p re sen te d b y Professors Brouwer a n d H astings a t th e C onference on D a ta A rchives o rganized b y th e In te rn a tio n a l Social Science Council (P aris, 1964) a b o u t 5000 sam ple surveys w ere perform ed d u rin g one single y e a r in c o n tin e n ta l E u ro p e —- th e socialist c ountries n o t included — a n d m ore th a n 3300 in th e USA alone. I t is re m a rk ab le t h a t m ore th a n th e h a lf of th e su rv e y sam ples consisted of less th a n 1000 resp o n d en ts. T h e a u th o r draw s th e conclusion t h a t in spite, of som e special c onditions d e te rm in in g th e size of sam ples norm ally used in H u n g a ry , th e possibilities of a p p ly in g sm aller sam ples th a n h e re to fore should be exam ined. F in ally th e a u th o r review s th e app licatio n of c o m p u ters for sim u latio n purposes in d em ographic research, w ith special reference to such a sim ulation s tu d y p e rform ed a t P rin c eto n U niv ersity . 3