Organisasi File Multi Key y (Index) ( )
Pengertian Organisasi berkas yang memperbolehkan record d diakses di k oleh l h lebih l bih dari d i satu t key k field disebut organisasi berkas dengan banyak key. Ada banyak teknik yang dipakai untuk organisasi berkas dengan banyak key ini. Hampir semua pendekatan bergantung pada pembentukan indeks yang dapat memberi akses langsung dengan nilai key.
Sistem Berkas
1
Ada banyak cara untuk mengorganisasi berkas semacam ini, yaitu dengan cara: (1) Inversion Yaitu dengan cara yang mirip dengan organisasi relative yang satu tabel index-nya berisi key field yang terurut dan sebuah pointer yang menunjuk ke alamat di mana data disimpan. B d Bedanya, k karena di sini i i dibutuhkan dib t hk b banyak k kunci, k i maka k di tabel t b l tersebut disimpan pula kunci-kunci atribut lainnya yang dibutuhkan. (2) Multi-list Yaitu dengan cara yang hampir sama dengan cara pertama, yaitu dibuat tabel index yang terurut key field-nya dan penunjuk ke nomor record (pertama) datanya, hanya di setiap record ditambahkan pointer (penunjuk) ke record-record record record berikutnya sesuai urutan key field yang ditentukannya. Tentu penunjuk itu akan berubah datanya bila akses dilakukan dengan key field lainnya.
Sistem Berkas
2
APLIKASI BERKAS DENGAN BANYAK KEY Banyak sistem informasi interaktif memerlukan dukungan dari berkas banyak key. Contoh: Sebuah sistem perbankan yang mempunyai beberapa pemakai (user), seperti kasir, pegawai kredit, manajer cabang, pegawai bank, nasabah, dll. Semuanya memerlukan akses data yang sama dengan format record:
Sistem Berkas
3
Satu pendekatan yang dapat mendukung semua jenis akses adalah dimilikinya banyak berkas yang berbeda. Setiap berkas di organisasi untuk melayani satu jenis keperluan. Maka untuk contoh sistem perbankan di atas harus ada: File account yang organisasinya indeks sekuensial dengan nilai key: ID untuk melayani kasir, pegawai bank & nasabah. File account yang organisasinya sekuensial dengan record di urut menurut: OVERDRAW LIMIT untuk melayani pegawai kredit.
File account yang organisasinya relatif dengan nilai key: SOCNO untuk melayani pegawai kredit. File account yang organisasinya sekuensial dengan record di urut menurut: GROUP-CODE untuk melayani manajer cabang.
File account yang organisasinya relatif dengan nilai key: NAME, SOCNO dan TYPE untuk melayani nasabah
Sistem Berkas
4
Jadi kita mempunyai 5 file, semuanya mempunyai record yang sama. Kelima file itu hanya berbeda dalam organisasi dan cara aksesnya. Pengulangan data dari beberapa file bukan merupakan cara yang baik untuk mengakses record dengan berbagai cara. Dan cara ini memerlukan ruang (space) yang b besar di storage t d dan k kesulitan lit pada d waktu kt peng-update-an d t record secara serentak. Untuk mengatasi masalah di atas, maka digunakan organisasi berkas banyak key yang umumnya diimplementasikan dengan pembentukan banyak indeks untuk memberikan akses yang berbeda terhadap record data. Mungkin juga cara ini memakai banyak link-list terhadap record. Dan sebuah indeks dapat dibentuk dengan beberapa cara, misal sebagai tabel binary search tree atau B-tree.
ORGANISASI INVERTER FILE Satu pendekatan dasar untuk memberikan hubungan antara sebuah indeks dan data record dari file adalah inversi. Sebuah key pada indeks inversi mempunyai semua nilai key dimana masing-masing nilai key mempunyai penunjuk ke record yang bersangkutan. File yang demikian disebut inverted file Indeks inversi yang sederhana dibentuk sebagai file. sebuah tabel. Contoh:
Sistem Berkas
5
Contoh: Inversi file ACCOUNT terhadap SOCNO menghasilkan indeks inversi.
Indeks inversi tersebut telah di sortir menurut SOCNO. Penambahan record file menyebabkan indeks inversi juga harus diubah. Sebuah indeks inversi dapat dibuat bersama sebuah relatif file atau sebuah indeks sekuensial. Sebuah indeks inversi dengan key SOCNO untuk sebuah relatif file dengan nilai key ID akan memberikan sebuah file yang dapat diakses langsung oleh sebuah ID atau SOCNO.
Sistem Berkas
6
Jika sebuah key dipakai untuk menentukan struktur storage dari file disebut primary key, sedangkan key yang lainya disebut secondary key. File yang mempunyai indeks inversi untuk setiap data field disebut completely inverted. File yang bukan completely inverted tapi paling sedikit mempunyai satu indeks inversi disebut partialy inverted file. file Sebuah variasi dari struktur indeks inversi adalah pemakaian secondary key dan primary key dari indirect addressing. Pendekatan ini membiarkan file yang direorganisasi dan restructure secara fisik tanpa menyebabkan indeks file. Pada contoh di atas, nilai SOCNO adalah unik. Setiap SOCNO dalam d l i d k inversi indeks i i mempunyaii record. d Indeks inversi dapat juga dipakai dengan key yang bukan unik.
Satu hal yang baik dari inversi file adalah beberapa pertanyaan dibawah ini dapat dijawab tanpa akses data file, cukup dengan indeks inversinya. Apakah ada indeks untuk SOCNO = ‘414556233’ ? Berapa banyak account dengan GROUP-CODE = ‘EA001’ ? Berapa banyak account dengan BRANCH = ‘NE’ ? Apakah BRANCH = ‘NE’ mempunyai TYPE = ‘001’ ?
Sistem Berkas
7
ORGANISASI MULTI-LIST FILE Suatu pendekatan lain yang memberikan hubungan antara sebuah indeks dan data record dari sebuah file disebut organisasi multi-list file. Seperti sebuah inverted file, sebuah multi multi-list list file mempunyai sebuah indeks untuk setiap secondary key. Organisasi multi-list file berbeda dengan inverted file, dimana dalam indeks inversi untuk sebuah nilai key mempunyai sebuah penunjuk untuk sebuah data record dengan nilai key, sedangkan dalam indeks multi-list untuk sebuah nilai key mempunyai hanya sebuah penunjuk untuk data record pertama dengan nilai key. key Data record mempunyai sebuah penunjuk untuk data record selanjutnya dengan nilai key dan seterusnya. Maka terdapat sebuah linked-list dari data record untuk setiap nilai dari secondary key.
Sistem Berkas
8
Gambar 6 dan 7, menunjukkan indeks multi-list untuk secondary key GROUP-CODE dan OVERDRAW LIMIT, sedangkan gambar 8 menunjukkan data file. Setiap data record mempunyai penunjuk untuk mengakses record selanjutnya.
Nilai key harus di urut, struktur indeks adalah tabel dengan indirect addressing dan mempunyai hubungan data record yang disusun menurut ID secara ascending
Sistem Berkas
9
Informasi tentang banyak record dalam link-list juga berguna untuk mendapatkan cara yang terbaik dalam pengaksesan. Contoh: Ada 2 cara akses yang potensial dalam menjawab pertanyaan: Daftar nilai ID untuk account dengan GROUP GROUP-CODE CODE ='EA001' EA001 dan OVERDRAW-LIMIT = 100 ? Data file dapat dicari secara sekuensial, indeks GROUPCODE atau dengan memakai OVERDRAW-LIMIT
Struktur File Index Terdiri dari main file dan file-file index (file berindex majemuk). Tidak ada rantai overflow. Tidak dikenal konsep atribut kunci (tidak ada keterurutan berdasarkan atribut kunci). Pengubahan data langsung dilakukan terhadap main file. Format record dapat berupa name-value pair atau dapat berupa structured record.
Sistem Berkas
10
Index bersifat multiple index, dinamis, record anchored. Entri index terdiri dari atribut dan TID. Entri index terurut berdasarkan nilai atributnya. Next record diakses berdasarkan keterurutan entri pada i d index-nya. Tiap index dapat bersifat multilevel. TID pada index berisi alamat block dan posisi record. Exhaustive vs partial index.
Struktur File Index : BTree BTree = Balanced Tree Perubahan pada main file berimplikasi terhadap index-nya. index nya Struktur index menggunakan BTree. Blok – blok BTree harus dijaga agar memuat setengah dari fan out ratio-nya (effective fan out antara y/2 – y). Order Capacity = d Kapasitas minimum = d, dan maximum = 2d Khusus untuk root, kapasitas minimum = 1
Sistem Berkas
11
Algoritma Penyisipan BTree Cari posisi yang sesuai bagi record baru, mulai dari root BTree. Jika tersedia space, sisipkan record baru sesuai urutan, jika tidak terjadi, overflow. Jika terjadi overflow : Split menjadi 2 node Pilih node tengah untuk naik ke level berikutnya Set pointer dari parent node ke child node
Algoritma Penghapusan BTree Menghapus node pada leaf dan tidak melanggar kapasitas minimum, maka record langsung dihapus tanpa mengubah struktur BTree. Menghapus node pada root dan tidak melanggar kapasitas minimum, maka ganti dengan 1 record dari leaf node kanan terkecil. Menghapus node (leaf dan root), dan melanggar kapasitas minimum maka perbaiki dengan redistribusi record. minimum, record Apabila redistribusi record mengakibatkan pelanggaran kapasitas minimum pada node lain, maka lakukan coalescing node.
Sistem Berkas
12
Contoh BTree • Contoh BTree dengan order capacity d = 2
Contoh Penyisipan BTree • Penyisipan data 60, tidak terjadi penambahan node karena tidak terjadi overflow dan (tidak) melanggar kapasitas maksimum.
Sistem Berkas
13
Contoh Penyisipan BTree • Penyisipan data 70, terjadi penambahan node karena terjadi overflow dan melanggar kapasitas maksimum.
Contoh Penyisipan BTree • Split menjadi 2 node karena terjadinya overflow
Sistem Berkas
14
Contoh Penyisipan BTree • Hasil akhir dari penambahan data 70
Contoh Penghapusan BTree • Penghapusan data node 63, tidak terjadi pelanggaran kapasitas minimum.
Sistem Berkas
15
Contoh Penghapusan BTree • Penghapusan data node 51, ganti dengan 1 record dari leaf node terkecil, tidak terjadi pelanggaran kapasitas minimum.
Contoh Penghapusan BTree • Penghapusan data node 7, terjadi pelanggaran kapasitas minimum, perbaiki dengan redistribusi record.
Sistem Berkas
16
Contoh Penghapusan BTree • Penghapusan data node 53, terjadi pelanggaran kapasitas minimum, perbaiki dengan redistribusi record. Tetapi mengakibatkan pelanggaran kapasitas minimum pada node lain.
Contoh Penghapusan BTree • Karena mengakibatkan pelanggaran kapasitas minimum pada node lain, maka lakukan coalescing node. 54
^
^
^
69
^
^
^
^ 60 ^ 66 ^ 68 ^
Sistem Berkas
^
^ 70 ^ 71 ^ 76 ^
^
17
Contoh Penghapusan BTree • Hasil akhir dari coalescing node.
Sistem Berkas
18