K Ö Z L E M É N Y E K
AZ
1962. ÉVI F R A N C I A O R S Z Á G I
N É P S Z Á M L Á L Á S A D A T A I N A K FELDOLG O Z Á S A E L E K T R O N I K U S G ÉPEKKEL G. Ç A L O T
B árm ily en szakon dolgozzék is egy statisztik u s, a népszám lálás m ód szerei m indig érdeklik. A gépi adatfeldolgozás kétségkívül csupán a tech n ik a eszközeként já ru l hozzá a s ta tisz tik a i k u ta tá sh o z , — a sta tisz tik u s speciális és eredeti törek v ése a feldolgozott a d a to k elem zésére és felhasználására irán y u l. M indam ellett a b b an a m érték b en , ahogyan a tec h n ik a halad és lehe tőségei szélesebb k ö rű v é v áln ak , egyre parancsolóbb követelm ényekkel lép fel. A felhasználó a b b an az irá n y b a n h aszn o sítja tec h n ik a a h alad ását, hogy tö b b e t érhessen el vele, de e h alad ás feltételei elő tt meg kell hajolnia és szám ot kell v etn ie k ényszerítő Lényeivel. A gépi adatfeldolgozás te c h n ik á já n a k m axim ális k ih asználása céljából a sta tisz tik u sn a k a sta tisz tik a i k u ta tó m u n k á t egybefüggő felad atk é n t kell felfognia: az a d a to k gyűjtése, gépi ú to n tö rté n ő feldolgozása és tu la jd o n képpeni sta tisz tik a i elemzése e lv á la sz th a ta tla n egym ástól. E g y a d a tfe l v étel v ag y összeírás előkészítésénél e g y a rá n t szem e lő tt kell ta r ta n i a kérdőív ro v a ta it, a gépi feldolgozás eszközeit és az elérendő eredm ényeket. Csak ha m á r ezt a h áro m elem et összefüggéseikben ta n u lm á n y o z tu k és különféle, egym ásnak sokszor ellentm ondó k ö v etelm én y eik et összeegyeztettük, ak k o r k ö v etk e z h e t a tényleges m egvalósítás. E llenkező esetben a m űvelet egyik stá d iu m á b a n e lk ö v e te tt v alam ily en tév ed és v ag y m ulasztás végképpen jó v á te h e te tle n n é válik , v ag y csak fáradságos m u n k a á rá n küszöbölhető ki. E m egjegyzések jelen tő ség ét k iv á ltk é p p e n az elektronikus berendezé seknek a ly u k k á rty a g ép ek et köv ető h a sz n á la ta hangsúlyozza. Á ltalu k re n d k ív ü l gyors és az elemzés te k in te té b e n új lehetőséget n y ú jtó feldolgozás v á lik lehetővé, azonban — éppen m e rt a u to m a tik u sa k — m erev szabályok alk a lm a z ását teszik szükségessé. A szám oló-szem élyzet vag y gépkezelők irá n ti szükséglet csökkenő irá n y z a to t m u ta t, v iszont a m u n k a m egterve zésével és pro g ram o zásáv al foglalkozó, teljesen sz a k o síto tt szem élyzet létszám a jelentősen m egnövekszik. A köv etk ező k b en ism ertetésre k erülő m ódszereket az 1962. évi francia népszám lálás 1/20-os re p re z e n ta tív feldolgozásánál h a szn á ltu k . A teljes kö rű adatfeldolgozás, am ely az 1964-es év elején kezdődik, ugyanezen elvek a lap ján fog m egvalósulni. C ikkünk végén v izsg álat tá rg y á v á tesszü k azokat a ta n u lsá g o k a t, am ely ek et az eredm ényekből m ár m ost is lev o n h a tu n k .
476 I.
А 7.
KÖZLEM ÉN V К К
E L E K T R O N I К US
РR O G R A M O Z Á S
A L A P E L V E I
E le k tro n ik u s gépen tö rté n ő feldolgozásnál k é t nagy v álasztás nyílik a felhasználó szám ára. A rugalm as vagy „mérték u tá n i” programozás, am ely ren d k ív ü l v á lto zato s sta tisz tik a i tá b lá k készítésére alk alm as. E b b e n az esetben m inden egyes táb lá h o z külön feldolgozási p ro g ram szükséges, hasonlóan a tá b lá z ó gép k ap cso ló táb láján ak dugaszolásához. E n n e k a m ódszernek az a célja, hogy közvetlen ü l k a p ju k meg a k ív á n t tá b lá t, ab ban a végleges és kidolgozott alak jáb an , ahogyan m ajd közlésre kerül. A z autom atikus programozás, am ely olyan tá b lá k készítésére alkalm as, am elyek bizonyos á ltalán o s alaki és szerkezeti feltételek n ek teszn ek eleget. T eh át a tá b lá t m inim ális szám ú ism érv h atáro zza m eg és a feldolgozási prog ra m o t m aga a szám ológép készíti el ezen ism érvek alapján. M indkét m ódszernek m eg v an n ak a m aga előnyei és h á trá n y a i. Az első m ódszer nagyszám ú program ozó-szem élyzetet feltételez és elég hosszú idő ta r ta m o t követel m eg; egy p ro g ram m egírásához szám os p ró b ára v a n szük ség, hogy k ifo g ástalan m űködéséről m eggyőződhessünk. T o v áb b á a m unka teljes, a legapróbb részletekre is k iterjed ő előkészítését követeli meg, m ég m ielő tt ism ernénk a szám szerű eredm ényeket. V iszont nagy előnye, hogy sokféle eredm ény feldolgozását teszi lehetővé. A m in t a tá b la kikerül a szám ológépből, m áris fényképezhető és n y o m ta th a tó . Ezzel szem ben az a u to m a tik u s program ozás m ódszere sokkal m erevebb, m inden egyes tá b la bizonyos k ö v etelm én y ek n ek kell, hogy eleget tegyen, am elyeket m ajd a to v áb b iak b an v izsg álu n k részletesen. A hhoz, hogy az eredm ények nyerését ru g a lm a sa b b á te g y ü k , e g y a rá n t szükséges, hogy a kód o lást a feldolgozás követelm ényeihez alkalm azzuk, v ala m in t az, hogy előre lássuk a m u n k a fo ly a m a t m ásodik szakaszát. Az első szakaszban egy „ n y e rs ” tá b lá t k a p u n k , am elynek a la k já t az a u to m a tik u s program ozás h a tá rozza meg. E z t a tá b lá t a z u tá n visszavisszük a gépbe, hogy m eg k ap ju k a k idolgozott, „végleges tá b lá t ” . E z a m ódszer m in d a m ellett tö b b szem pont ból is előnyös. A program ozó szem ély zetet illetően olcsó. A tá b lá k elkészíté sének id ő ta rta m a viszonylag rövid. E g y é b k én t nem m inden feldolgozott a d a to t szán u n k arra, hogy közzétegyük, hanem v a n n a k olyanok is, am elyek ből tan u lm á n y o z á si célból készül tá b la ; a nyers tá b lá k ala k já b a n k a p o tt eredm ények k özvetlenül a sta tisz tik u so k rendelkezésére állnak. V égül pedig az sem csekély előny, hogy m egvan a lehetőség a rra , hogy a nyers eredm é nyekbe való b e te k in té s ú tjá n rendelh essü k meg a végleges tá b lá t, ab ban az a la k já b a n , ahogyan m ajd közlésre kerül. A népszám lálás az első olyan nag y szab ású m unka, am ely et az In s titu t N atio n al de la S ta tistiq u e et des E tu d e s E conom iques (N em zeti S ta tisz tik ai és G azd aság tu d o m án y i In tézet) elek tro n ik u s adatfeldolgozó berendezése v ég zett. R em éljük, hogy ez a ta n u lm á n y is rövidesen idejét m ú lttá válik. 1. A
mágnesszalag
A m ágnesszalagra állandó hosszúságú és v á lto z a tla n szerkezetű zónák b an k erülnek a különféle s ta tis z tik a i egységekre vonatkozó ad a to k . M inden zóna egy-egy ly u k k á rty á v a l azonos: bizonyos szám ú, egy v a g y tö b b jelből álló ism érvből áll. Az ism érvek a k á rty a oszlopainak felelnek m eg: így pl. a
К Ö ZLEM ÉN Y EK
477
társad alm i-g azd aság i k ateg ó ria (T K ) k é t je le t foglal m ag áb a n : a T K tizede sét (T K T ) v ag y a T K első szám jeg y ét és a T K egyesét (T K E ) vag y a T K m ásod ik szám jegyét. A n épszám lálás m ág nesszalagjai kizárólag szám jegyeket ta rta lm a z n a k , vagyis 0 —9, m inden m ás k ód k izárásáv al. Még lia bizonyos sta tisz tik a i egységeknél n éh án y ism érv tá rg y ta la n n á is válik, ak k o r is szükséges erre egy k ó d o t előirányozni a szalagon (m in t pl. a társad alm i-szak m ai ro v a tb a n a tiz e n ö t évesnél fia ta la b b gyerm ekek szám ára). A k á rty á k megfelelő pozí cióin nincs ly u k asztás, mégis a szalagon okvetlenül kell k ó dnak lennie. A sta tisz tik a i egységek osztályozási sorren d je az egész feldolgozás folya m án állandó m arad a szalagon: a népszám lálási feldolgozás egyik elve ugyanis éppen az, hogy ne kelljen rendezéshez folyam odni (egyes különleges esetek kivételével). E z az osztályozás te rü le ti sorrendben tö rté n ik : megye, járás, község. íg y te h á t a m ágnesszalag azonos term észetű , te rü le ti fokozatok szerint re n d ez e tt sta tisz tik a i egységek so ro z a tá t foglalja m agában. 2. A f e l d o l g o z á s A feldolgozás a lk alm áv al a m ágnesszalag leolvasása kétféle m űvelethez v e z e th e t: — a tá b lá ra rögzítendő s ta tisz tik a i egységek k iválasztása, — a tá b lá t alkotó, kom binációs ism érvek szerint k iv á la sz to tt sta tisz tikai egységek összesítése. a) A „hovatartozandóság” ismérve A te rv e z e tt tá b lá r a k erülő s ta tisz tik a i egységeket egy vag y tö b b — egym ással az „ É S ” és „V A G Y ” logikai o p eráto ro k á lta l összefüggő — „h o v a ta rto z a n d ó sá g i” ism érv h a tá ro z z a meg. A „ h o v a ta rto z a n d ó sá g ” ism érvei k é t k a te g ó riára oszlanak: — Területi ismérvek E zek egyazon te rü le t v alam en n y i egyénénél ugyanazok: így pl. a hely ség kateg ó riája (a helység term észete és n ag y ság a: falusi, 5000-nél kevesebb lakosú városi, stb .), a m ezőgazdasági k ö rz e t (F ranciaország te rü le te 500 m ezőgazdasági k ö rz e tre oszlik), stb . E zek az ism érvek, am elyek egy helység m inden sta tisz tik a i egységénél ugyanazok, nincsenek m inden egyes s ta tisz tik a i egység zó n ájáb an elhelyezve, de — a speciális te rü le ti beosztáso k révén — a község fő té n y e z ő jé t képezik. Ez az egyetlen k iv étel azon fen t e m líte tt szabály alól, am ely szerint a m ágnes szalag zónái egyazon te rm é sz e tű ek és v á lto z a tla n szerkezetűek. — N e m területi ismérvek A te rü le ti és nem te rü le ti h o v a ta rto z a n d ó ság ism érvei k ö z ö tt nincs semm i különbség. C supán a szám ológép vég ezte válo g atás fo ly am a ta külön böző. b) A z összesítés ismérvei A m ágnesszalag leolvasása folyam án a szám ológép rögzíti egy sta tisz tik a i egység á th a la d á s á t, h a ez a szóbanforgó táb lá h o z ta rto z ik . H a pl. egy szám n ál (T K T ) a nem és a T K kom binálódik, ak k o r a szá mológép 20 m em ória-rekeszt k észíl elő, n em en k én t 10-et. H a a szám ológép
478
K Ö Z L E M É N Y E K
egy férfi (S = 1) m ezőgazdasági m u n k á sra v onatkozó zó n át olvas le (T K T = 1), ak k o r a cím et ta rta lm a z ó (S = 1, T K T = 1) tárolórekesz egyet rögzít, ha az egyén eleget tesz a tá b la h o v atarto zan d ó ság i ism érveinek. Ellenkező esetben nem kerül a tábla-m ezőre, és egy tá ro ló b a n sem m arad nyom a an n ak , hogy á tfu to tt. A tá b la sor- és oszlop-ism érvek á lta l m e g h atá ro z o tt rekeszeiben össze síteni leh et a k á r egy sta tisz tik a i egységenkénti állandó szám ot, a k á r pedig egy olyan m ennyiséget, am ely a sta tisz tik a i egység z ó n ájáb an szerepel (pl. a gyerm ekek szám a a h á z ta rtá s b a n , a szobák szám a a lak ásb an stb.). E g y azon tá b la tíz összesített ism érv et is foglalhat m agában. c) A kódszalag A tároló rekeszek előkészítését speciális a u to m a tik u s m ágnesszalag beolvasása b iz to sítja : a kódszalagé, am ely v alam ennyi összesítési ism érv m in den lehetséges té te lé t m ag áb an foglalja. H a a nem és a T K első szám jegye kom binálódik, ak k o r a kódszalag jelzi, hogy a nem nek k é t té te le van (S = 1, 2) és hogy a T K első szám jegyének 10 té te le v an (T K T = 0, 1 ,.........., 9). Azon tárolórekeszek szám a, am elyek fe la d a ta a táb la-m ező re kerülő egységek befogadása, ennek a k é t szám n ak szorzata, vagyis 20 rekesz. Az IBM 7070 elek tro n ik u s berendezés, am elyen a népszám lálás 1/20-os szú ró p ró b áján ak feldolgozását végezte az IN S E E , olyan tá ro ló v a l rendelke zik, am ely 5000, egyébként 10 szám jegyű szám ot képes tá ro ln i, vagyis 5000 szavas táro ló k ap acitású . E n n ek a tá ro ló n ak a pro g ram o t is m agában kell foglalnia, és ez m in teg y 2000—3000 szót foglal el. M inthogy pedig m inden táb larek esz egy-eg'y szónak felel meg, m in teg y 2000—3000 szó áll rendelkezésre a tá b la elkészítéséhez. E gyazon tá b lá b a n m axim álisan 8 ism érv k o m b in áló d h at; soronként 4 és oszloponként is 4. Az egy m en et folyam án készült tá b lá k különböző tá b la m ezőket fo g lalh atn ak m agukba, am elyeket különféle te rü le ti fokozatokon k a p tu n k (n ém elyiket a já rá si fokozaton, m áso k at a m egyei fokozaton, vagy az egész F ran ciao rszág ra k iterjed ő fokozaton). Egyazon egyén ugyanazon m enet folyam án a tá b la b árm ely a d atáh o z ta rto z h a t. A nyers tá b lá k au to m a tik u sa n n y ú jtjá k a kom binációs ism érvek szerinti összefoglalásokat (to v áb b i tá ro ló k igénybevétele nélkül). Másfelől, egyéb összefoglalások is a u to m atik u san készülnek a nyers táb la k é sz íté s szakaszában. 3. A
nyers
és
végleges
táblák
M inden feldolgozási m en et végén a 7070-es szám ológép táro ló in a k ta r ta lm a m ágnesszalagra íródik. E z t a szalagot aztán bevisszük az IBM 1401 szám ológépbe, am elynek n y o m ta tó egysége leporello-papiron percenként 600 sorsebességgel készíti a tá b lá k a t. A tá b lá k a d a ta i ly u k k á rty á k ra is ly u k a sz th a to k , és ö sszeg k árty ák k én t ism ét feldolgozhatok ly u k k á rty a gépeken. A m ágnesszalagokat, am ely ek a nyers tá b lá k a d a ta it foglalják m agukba, kivesszük és bevisszük az 1401-es szám ológépbe, hogy elkészüljenek a vég leges tá b lá k . E m ű v elet folyam án különféle tá b la-cso p o rto sításo k a t és szá m ítá so k a t leh et végezni:
479
K Ö Z L E M É N Y E К
— bizonyos sorok v ag y oszlopok hozzáadása, kihagyása vag y áth e ly e zése, részösszegek nyerése, a tá b la „szellősebbé” té te le ” ; — k é t v agy tö b b azonos alak ú tá b la algebrai összeadása; — egy tá b la te lje s szövegének egy osztó sorral vagy oszloppal való fel osztása (százalékszám ítás); — egy tá b la rekeszeinek felosztása, egy ugyanolyan alak ú tá b la meg felelő rekeszei szám ára. II.
A Z A U T О M A T I K U S
P RO G R A M OZÁS
К Ö T Ö T T S É G E I
E dolgozat rövid bevezetőjéből kiderül, hogy m aga az a u to m atik u s m ódszerrel v ég zett feldolgozás is n éh án y k ö töttséggel já r. E bben a fejezet ben 7 p o n tb a n foglaljuk össze azo k at a k ényszerítő k ö rülm ényeket, am elyek nek különös fo ntosságot tu la jd o n ítu n k . 1. E g y a z o n s z a l a g természet ű ek
st at iszt ik a i
egységei
иgуa n a z o n
M árpedig, a m in t ezt az előzőkben lá ttu k , a népszám lálásban elszigetelt egységek különböző term észetű ek , különféle szintű fo k o zato k at foglalnak m agu k b a : — lakások szerint, házak szerint c so p o rto síto tt szem élyek, — ugyanazon lakásb an lakó, egy háztartást képező és családmagot alkotó egyének. K ülönösen fontos a tö b b sta tisz tik a i egységre vonatkozó ad a to k kom bi n álása; h á z ta rtá s u k v agy család m ag ju k ism érvei szerint le írt egyének, a ház ism érvei szerint le írt lakások. E z é rt készü lt k é t m ágnesszalag: — az egyik, ahol a sta tis z tik a i egység az egyén: S Z L —L I-szalag, — a m ásik, ahol a sta tisz tik a i egység a lak ás: L I —H L-szalag. a) A z S Z L —L I-szalag E zen a szalagon szerepelnek az egyénre és azon különböző egységekre v onatkozó a d ato k , am elyekhez az egyén ta rto z ik :
Az S Z L —L I-szalag — az egyénin kív ü l — a lakás-, h á z ta rtá s - és csoport sta tisz tik a elkészítését is lehető v é teszi. b) A z L I —H L-szalag E rre a szalagra kerü ln ek a lak ásra és a h ázra vonatkozó a d ato k . A lak ás ism érvei közé soroljuk a családfő és a h á z ta rtá s ism érveit is. íg y te h á t az L I —H L -szalag lehetővé teszi a h á z ta rtá so k , v ala m in t a h ázak s ta tisz tik á já n a k elkészítését.
480 2. A s z a l a g o t e g ys z e r é s m i n d e n k оr r a r e n d e z i k a t e r ü l e t i ismérvek s ze rint E n n e k az e ljárásn ak az az előnye, hogy k o rlátozza a m ágnesszalagok készítését: a te rü le ti ism érvek csak egyszer szerepelnek, m inden helység sta tisz tik a i egységeinek élén; főként pedig m egkönnyíti a feldolgozást, am ik o r ugyanazon fokozat v alam en n y i te rü le ti zó n ájá ra v o n atk o zó an kell a tá b lá t elkészíteni (regionális, m egyei, já rá si tá b lá k a t stb.). U gyanis, lia m inden egyes m egyénél egy-egy 100-rekeszes tá b lá t kell készíteni, ak k o r a h a sz n á lt táro ló rek eszek szám a csak 100 lesz, m ivel ezek m inden m egye végén a u to m a tik u sa n tö rlő d n e k : egy 100-rekeszes m egyei tá b la elkészítése nem t a r t to v á b b , m in t egy 100-rekeszes országos táb lá é. Ez az eljárás különösen előnyös, ha kis te rü le ti egységekről kell tá b lá t készí teni (járási v agy községi teljesk ö rű adatfeldolgozási tá b lá k a t). 3. M ind e n
jelet
0 és 9
k ö zött
kell
kódolni
A szalag v alam en n y i lehetséges jele kizárólag num erikus, a 0 a lyukasz tás h iá n y á n a k ( + ) felel m eg a ly u k k á rty á k o n . M árpedig — a k e ttő s ly u k a sz tá so k a t nem szám ítv a — egy ly u k k á rty a oszlopa 13-féle k ó d o t k a p h a t : 0 —9, X , Z (felül lyukasztások) v ag y + . T e k in te tb e kell te h á t venni az X , Z v a g y A kód nu m erik u s kóddá való á ta la k ítá s á t. Ez az á ta la k ítá s egy to v á b b i jel h ozzáadásával is végbem ehet (pl. X 10-zé, Z 11-gyé és -f- 12-vé alak u l, v a g y pedig egy num erikus kód fel használásával, ha ezeket m ég nem h a sz n á ltu k fel teljes szám ban. 4. A ókd szal ag m i n d e n i s m é r v e g y e d ü l i l e h e t s é g e s t é t e l e i t f o g l a l j a m a gá b a n F o n to s, hogy az á ltalán o s m ágnesszalag, am elyen a sta tisz tik a i egysé gek szerepelnek, csakis a kódszalagra ír t k ó d o k at ta rta lm a z z a . U gyanis ha egy egyén a feldolgozáskor z a v a rtk e ltő kód o t m u ta tn a , ak k o r ezt az egyént a táro ló egyetlen rekeszébe sem leh etn e felvenni, és a szám ológép félbeszakí ta n á a feldolgozást. M árpedig, ly u k a sz tá s- és kódolásbeli h ib ák fo ly tán ilyen z a v a rtk e ltő kódok is ly u k a sz th a to k a k á rty á k o n . íg y te h á t elengedhetetlen k ö v etel m ény, hogy a szám ológépen ellenőrizzük a k á rty a k ó d o k teljes érvényességét és a lehetetlen k ó d o k at lehetséges k ó dokká v á lto ztassu k . A leh e te tle n kódszám ok a u to m a tik u s k ija v ítá sa fontos ily m ódon a közlés érdekében tö rté n ő jelen tő s m an u ális m u n k á la to k n a k v e h e tjü k elejét és m eggyőződhetünk a tá b lá k szám szaki egyezéseiről, am ely e t az elm életileg ro k o n értelm ű h o v a ta rto z a n d ó ság i ism érvek h a tá ro z n a k meg. 5. A kód s za l a g e g y m á st ó l f ü g g e t l e n n e k tekint k é t k o m b i n á c i ó s i s m é r v e t é s e g y e n l ő sz á m ú t á r o l ó r e k e s z t k é s z í t elő a l e h e t s é g e s s z á m ú t é t e l e k s z o r z a t a sz á m á r a G y ak ran előfordul, hogy a h o v a ta rto z a n d ó ság i ism érvek k o rláto zzák az összesítés lehetséges té te le in e k sz á m á t: ha pl. a dolgozók életk o r szerint v a n n a k felosztva, ak k o r a lehetséges életk o rok 15—99 évig terjed n e k .
481 U gyanígy, pl. k é t ism érv v alam en n y i kom bin ációja nem lehetséges, m ivel az ism érvek nem függetlenek eg y m ástó l: a társad alm i-g azd aság i kateg ó ria 30 té te lb ő l áll, és a foglalkozási viszony 10 té te l. M árpedig a T K és a foglalko zási viszony lehetséges kom bin áció in ak szám a csupán 136. K ülön gondoskodás nélkül a szám ológép a té te le k szám ának szorzatá v al egyenlő szám ú táro ló rek eszt készítene elő, vagyis a fenti példa szerint 30 X 10 = 300 té te lt. A bból a célból, hogy a szükségtelen tárolórekesz p a z a rlá st elk erü ljü k — am i a nyers tá b lá n üres v o nalak és oszlopok fo rm ájá b a n m u ta tk o z n é k — az alábbi eljáráshoz foly am odunk: a) H a a té te le k sz á m á t a h o v a ta rto z a n d ó ság ism érvének tén y e csök k en ti, ak k o r csupán a kódszalagon — nem pedig az a d a to k a t ta rta lm a z ó álta lá n o s m ágnesszalagon — olyan speciális kódot irán y o zu n k elő, am ely kevesebb té te lt ta rta lm a z , m in t az alapkód. b) H a a té te le k sz á m á t az a té n y csökkenti, hogy k é t összesítés-ism érv nincs összefüggésben egym ással, ak k o r „sz u p e r-k ó d o k at” képezünk. íg y a T K és foglalkozási viszony 136 lehetséges té te lé n e k kom b in áció ját olybá te k in tjü k , m in t egy h áro m jelből, vagyis a T K -foglalkozási viszonyból álló egyetlen kód 136 té te lé t, am elynek k é t első szám jegye a T K -t, a harm ad ik pedig a foglalkozási v iszo n y t képviseli. A szuper-kódok alk alm azása különösen értékes ab b a n az esetben, ha a h á z ta rtá s o k különböző k ap cso latú szem élyek szám a szerint v a n n a k leírva: a szem élyek szám a x é le ttá rs jelen léte x a gyerm ekek szám a x felm enő roko nok szám a x szülők szám a x b a rá to k , teljes ellátáson levők, albérlők szám a. Szuper-kód híján 200 000 k o m b in áció t kellene előirányozni, pedig valam ennyi francia h á z ta rtá s 99 százalék án ak leírásához 100 kom bináció elégséges. 6.
A ny e r s vonatkozó t e h e t s é g e s
t á b l á k s t á d i u máb a n az eg y összesítés ezen is m é r v t é t e l e i n e k ö s s z e s s é g e sz e r i n t
i s m é r v re k é s zü l
A nyers tá b lá k szin tjén le h e te tle n bizonyos té te le k ném ely ism érv ét cso p o rto síta n i. H og y h a pl. az é le tk o rt v alam ely m ás egyéni ism érvvel a k a rju k kom binálni és ha csupán k é t szám jegyű életk o r szerepel a m ágnesszalagon, ak k o r az é le tk o rn a k csupán k é t b o n tá sa alk a lm a zh ató : — év en k én ti b o n tá s 100 té te lre , 00 —99 — év en k én ti b o n tá s 10 tételre, az éle tk o r első szám jegye szerint. K étségtelen, hogy a végleges tá b la szin tjén m inden tetsz és szerinti cso p o rto s ítá s t el lehet végezni. M in dazonáltal, nehogy h asz ta la n p azaro lju k a táro ló rek eszek et, az „ ö sszev o n t” és a „ ta g o lt” kódokhoz folyam odunk. íg y az „ö sszev o n t” életk o r-k ó d n ak , am ely a részletes é letk o rtó l külön álló és független kódol a lk o t, csupán h árom té te le le h et: 1: 20 éven aluli: 2: 2 0 —64 évig: 3: 65 éves és ezen felül. 7. A z a z o n o s tá bl á zat b a n elő f o r d u l ó s z ü k s é g s z e r ű e n k o m b i n á l ó d h a t n a k
i s m é rve k
A m ikor a nem, életkor, családi á lla p o t és településkategória (falusi — városi) azonos tá b lá n fordul elő, ezek többszörösen v a n n a k kom binálva. H a nem k ív á n ju k a családi á lla p o t k o m binációját a telep ü lésk ateg ó riáv al
482
K Ö Z L E M É N Y E K
m inden nem nél és életkornál, ak k o r k é t különböző tá b la tervezése v álik szükségessé: nem , életkor, családi á llap o t és nem , életkor, telep ü lés-k ateg ó ria; ezt a k é t nyers tá b lá t a z tá n esetleg egyetlen végleges tá b lá v á lehet egyesíteni. * Az előző fejezetb en rá m u ta ttu n k azoknak a m ű veleteknek term észetére, am ely ek et a feldolgozás m ódszere nélkülözhetetlenül szükségessé tesz: — a kódolás teljes ellenőrzése, ab b a n az értelem ben, hogy m inden ism érv le h e te tle n té te le it m egszüntessük, s hogy az ism érvek közti bizonyos összeeg y ezteth etetlen ség ek et kiküszöböljük ; — az összevont és tagolt kódok megteremtése, abból a célból, hogy a leg m egfelelőbb b o n tá s szerin t k eresztezzük az ism érveket a nyers tá b lá k stá d iu m ában ; — a lyukkártyáik kódolásának átalakítása, azon célból, hogy a feldolgo zási szalagon k izárólag n um erikus k ó d o k at k ap ju n k . E zek et г m ű v eletek et a szám ológép az általán o s szalag elkészítésekor au to m a tik u sa n végzi. E gy id ejű leg a k á rty á k b a n levő nyers a d a to k alap ján egyéb olyan m ű v e le te k e t is végzünk, am elyeket szám ológép nélkül nem lehe t e t t volna m egvalósítani. Összefoglalás A feldolgozás m ódszerének álta lá n o s leírása megszövegezésénél néhány m egjegyzést te h e tü n k a rra v o n atk o zó an , hogy a sta tisz tik a i feldolgozás te k in te té b e n az elektronikához fo ly am o d tu n k . E zek a m egjegyzések kétség kívül az a lk a lm a z o tt a u to m a tik u s program ozás m ódszeréhez fűződnek. M indazonáltal úgy véljük, hogy ezek a m egjegyzések általán o s érvényűek, függetlenül az elfogadott tech n ik ai eljárástól. 1. A z e l e k t r o n i k a á l t a l m e g k ö v e t e l t m i n ő s é g i kívánalmak A nyers a d a to k a t illetően az e lek tro n ik a úgyszólván tö k életes m inőséget kö v etel meg. L á ttu k , m ilyen szükséges m inden egyes ism érv kódolásának ellenőrzése. M inden egyes leh etetlen kód olyan, m in t hom okszem egy bonyo lu lt gépezetben, te h á t helye nincs. Szerencsére ebben a te k in te tb e n m aga az elek tro n ik a szo lg áltatja az orvoslási m ódot, ám elég jelentős m u n k a árán, m ivelhogy m inden egyes előforduló esethez külön-kü lön ja v ítá si szabályra v a n szükség. A v o ltak ép p en i program ozás te k in te té b e n az elek tro n ik a még m agasabb m inőségi k ö v etelm ényekkel lép fel. Az ilyen kock ázat m egelőzésének kétség telen ü l legjobb m ódja az, ha az elek tro n ik u s program ozó és a sta tisztik u s állan d ó an m egbeszéli a dolgokat, s m in d k e ttő félúton elébe m egy egym ás nak . K ö v etkezésképpen felteh ető , hogy a d em ográfusnak vagy közgazdász nak á lta lá b a n tis z tá b a n kell lennie az elek tronikus p ro b lém ák k al, m égpedig m agas szinten.
483
K Ö Z L E M É N Y E K
2. A s z á m o l ó g é p e n költsége
végzett
feldolgozás
műveleteinek
Az elek tro n ik u s berendezések igen d rág a gépek, és m agas tech n ik ai szakkép zettség ű szem élyzetet igényelnek. E g y éb k én t, m ik én t lá ttu k , alk al m azásu k az a d a to k teljes előkészítését, v a la m in t a m unkam ódszerek leg aprólékosabb k idolgozását követeli meg. M indezen okokból az elektronikus gépek alkalm azása nagy ítélőképességet és a gazdaságosság előzetes ta n u l m ány o zását k ö v eteli m eg; — a gazdaságosság v izsg álata viszont csak ak kor lehetséges, ha a m u n k a m ár jóelőre m egfelelően meg v an h atáro zv a, és — a rá fo rd íta n d ó időre is te k in te tte l — csakis ak k o r érdem es elvégezni, ha m ár eleve úgy lá tju k , hogy k ív án ato s az elek tro n ik ához folyam odnunk. A szá mológép nem játék szer, am ely et az ele k tro n ik a lehetőségeiért lelkesedő sta tisztik u sn a k rendelkezésére b o c sá ta n a k , h an em d rág a szerszám , am ely bizonyos fe la d a to k ra inkább alkalm as, m in t m ásokra. 3. A z e l e k t r o n i k u s ú t o n elő ny ös e n statisztikai feldolgozások
végezhető
Jelenlegi ta p a s z ta la ta in k szerin t ú gy tű n ik , hogy az elek tro n ik a alk al m azása o tt előnyös, ahol nagy terje d e lm ű , nagyszám ú sta tisz tik a i feldolgo zásokról v an szó. Az előzőekben le írt m ű v eletek elvégzésével járó költségek ezáltal gyorsan té rü ln e k meg. A zok a feldolgozások, am elyekről szó v an , elsősorban az á ltalán o s össze írások : nép- és lakás-szám lálás, m ezőgazdasági, ipari, kereskedelm i stb. összeírások. Am i a re p re z en ta tív a d a tfe lv é tele k e t illeti, am elyeket időszakon k én t azonos m ódszerek szerint v a ló síta n a k meg, ezek is kétség telen ü l elő nyösen dolgozhatók fel elek tro n ik u s szám ológéppel. U gyanez vonatk o zik a folyó sta tisz tik a i feldolgozásra is, p éld áu l a népm ozgalm i sta tisz tik a a d a ta i n ak feldolgozására. A m i a tu la jd o n k é p p e n i szám ítási m u n k á la to k a t illeti (népesség előre szám ítások, stb.), ahol az a d a to k elég szűkösek, de a b o n yolult szám ítások esetleg tö b b v a riá n s t ta rta lm a z n a k , valószínű, hogy érdem es az elektroni kához folyam odni. M indam ellett, m ég i t t is biztos, hogy bizonyos m u n k ála to k gazdaság o sab b an végezhetők el kis irodai szám ológépen, m in t valam ely h a ta lm a s elek tro n ik u s berendezésen. Z árad ék u l szeretn én k h angsúlyozni egy p o n to t: az elektronika nem hozza m ag áv al azt, hogy a régebbi, kevésbé tö k éle tes tec h n ik a i berendezé sekre m á r nincs szükség. A sta tis z tik a te ré n való alkalm azása csak az eszkö zök átérték eléséh ez vezet. Óriási elm életi lehetőségei ellenére az elektronika sem csodaszere a feldolgozásnak, sőt igen tá v o l áll e ttő l. Még az is m eglehet, hogy bizonyos esetekben egy m an u ális feldolgozás könyvelőgéppel vag y még egyszerűbben, p ap írral-ceru záv al ö sszeh aso n líth atatlan u l előnyösebb.
484
K Ö Z L E M É N Y E K
РА ЗРА БО Т КА ДА Н Н Ы Х Ф Р А Н Ц У З К О Й ПЕРЕ ПИСИ Н А С Е Л Е Н И Я 1962 ГОДА С П Р И М Е Н Е Н И Е М 3 Л Е К Т Р О Н Н Ы X В Ы Ч И С Л И Т Е Л Ь Н Ы X M A III И Н Резюме Статья занимается теми способами, которые были использованы в ходе разработки ф ранцузкой переписи населения с’применением электронн Б х вычислительных машин (IBM № 7070 и № 1401). П ервая часть касается общих принципов автоматического программи рования в отношении статистической разработки: представление магнит ной ленты, определение статистической таблицы на основе ее признаков принадлежности и сводки, составление окончательных таблиц для публи кации, объединяя данные, содержащиеся в одной или в нескольких таб лицах. В торая часть анализирует импликации автоматического программи рования и проведение в ж изнь метода: создание двух разработочных магнитных лент, у одной из которых индивидуум, у другой квартира является статистической единицей, провекра данных в цельях устранения ошибок шифровки и перфорации, устранение несопоставимости между признаками. В заклю чительной части статьи даётся критический анализ приме нения электронной техники в статистической разработке. Спецификация по качеству, требуемая электронной техникой и расходы на операции разработки с применением машин IBM делают необходимым изучение применяемых способов д ля разработки статистических данных. Впрочем, использование электронной техники предполагает всесторонные и под робные знания о разрабативаем ы х данных и требует хорош ие, глубокие знан ия со стороны статистики в области проблем электроники.
I’ К О С Е S S I X G
О Г Т H E F R E X Г, Н С E X S U S E I. К С T R O N I C С О М 1> Г Т E R S
О I-'
1962
U Y
S u m m a ry T h e article is d evo ted to the tec h niqu es used in processing th e F r e n c h census of 1962 w ith th e aid of electronic m a c h i n e r y (c o m p uters IBM 7070 a n d 1401). The first p a r t covers th e general principles of a u to m a ti c p ro g ra m m in g w ith regard to sta tistic a l processing: the insertion of th e m agne tic tap e , th e definition of a sta tistic a l table b y its c ritatria of reference a n d aggregation, processing w ith re g ard to th e pub lication , of definitive table s, in which th e inform ation c o n ta in ed in one or several tab les is combined. in the second p a r t the im plicatio ns of m a t h e m a ti c p r o g ram m in g a n d the p u t t i n g in to operatio n of th e m e th o d are e x a m in e d : th e p ro d u c in g of tw o m agn e tic tape s of w hich in one the individu a l, in the o th e r the dwelling is use d as sta tistic a l u n i t, th e checkin g of the d a ta to elim ina te coding a n d p u n c h ing errors a n d the efforts to rem ove c ertain in co m p atib iliets betw een criteria. To conclude, th e article subjects to a critical analysis the con trib u tio n m ad e by electronic m achines to statistical processing. The q u a lita tiv e specifications required by electronic m ethod s a n d th e costs of th e processing operation s on c o m p ute rs render it necessary to s t u d y th e best m e th o d s for using the sta tistic a l d a ta . Besides: the resortin g lo electronic m e th o d s which presupposes t h e pre lim ina ry a n d complete detailed knowledge of th e d a ta to be processed, lays the claim of a general a n d th o rou gh proficiency in e le ctro nics on th e s ta tist.