Normalisasi Didi Supriyadi, S.T., M.Kom Pertemuan ke-6
Normalisasi • Normalisasi adalah proses pembentukan struktur basis data sehingga sebagian besar ambiguity bisa dihilangkan. • Proses normalisasi merupakan proses pengelompokan data elemen menjadi tabel yang menunjukkan entity dan relasinya (Kristanto, H., 1994). • Normalisasi data merupakan suatu proses untuk mendapatkan struktur tabel atau relasi yang efisien dan bebas dari anomali, dan mengacu pada cara data item dikelompokkan ke dalam struktur record.
• The goal of a relational database design is to generate a set of relation scheme that allow us to store informastion easily. One approach is to design scheme that are in an appropriate normal form (silberschatz, H., 1991) • Normalisasi adalah suatu teknik untuk mengorganisasi data ke dalam tabel-tabel untuk memenuhi kebutuhan pemakai didalam suatu organisasi.
Tujuan Normalisasi • Untuk menghilangkan kerangkapan data • Untuk mengurangi kompleksitas • Untuk mempermudah pemodifikasian data
Proses Normalisasi • Data diuraikan dalam bentuk tabel, selanjutnya dianalisis berdasarkan persyaratan tertentu ke beberapa tingkat. • Apabila tabel yang diuji belum memenuhi persyaratan tertentu,maka tabel tersebut perlu dipecah menjadi beberapa tabel yanglebih sederhana sampai memenuhi bentuk yang optimal.
Kriteria Tabel efisien Sebuah tabel dikatakan baik (efisien) atau normal jika memenuhi 3 kriteria sbb: 1.
2. 3.
Jika ada dekomposisi (penguraian) tabel, maka dekomposisinya harus dijamin aman (Lossless-Join Decomposition). Artinya, setelah tabel tersebut diuraikan / didekomposisi menjadi tabeltabel baru, tabel-tabel baru tersebut bisa menghasilkan tabel semula dengan sama persis. Terpeliharanya ketergantungan fungsional pada saat perubahan data (Dependency Preservation). Tidak melanggar Boyce-Code Normal Form (BCNF) (-akan dijelaskan kemudian-)
Tahapan Normalisasi • Bentuk Tidak Normal Menghilangkan perulangan group • Bentuk Normal Pertama (1NF) Menghilangkan ketergantungan sebagian • Bentuk Normal Kedua (2NF) Menghilangkan ketergantungan transitif • Bentuk Normal Ketiga (3NF) Menghilangkan anomali-anomali hasil dari ketergantungan fungsional • Bentuk Normal Boyce-Codd (BCNF) Menghilangkan Ketergantungan Multivalue
• Bentuk Normal Keempat (4NF) Menghilangkan anomali-anomali yang tersisa
• Bentuk Normal Kelima
Ketergantungan Fungsional • Definisi Atribut Y pada relasi R dikatakan tergantung fungsional pada atribut X (R.X ---> R.Y), jika dan hanya jika setiap nilai X pada relasi R mempunyai tepat satu nilai Y pada R. R= Relasi / Tabel Y,X = Atribut didalam Tabel R.
Contoh Ketergantungan • Tabel PEMASOK-BARANG No_Pem
Nama_Pem
P01
Imam_x
P02
Yazix
P03
Hana
• Ketergantungan fungsional dari tabel PEMASOK-BARANG adalah : • No_Pem ---> Nama_Pem
Ketergantungan Fungsional Penuh Atribut Y pada relasi R dikatakan tergantung fungsional penuh pada atribut X pada relasi R, jika Y tidak tergantung pada subset dari X ( bila X adalah key gabungan). Suatu atribut Y mempunyai dependensi sepenuhnya terhadap atribut X jika • Y mempunyai dependensi terhadap X • Y tidak mempunyai dependensi terhadap bagian dari X
• KIRIM-BARANG( No_pem, Na_pem, No_bar, Jumlah) No_pem
Na_pem
No_bar
Jumlah
P01
Bahana
B01
1000
P01
Bahana
B02
1400
P01
Bahana
B03
2000
P02
Sinar Mulia
B03
1000
P03
Harapan
B02
2000
• Ketergantungan fungsional : • No-pem --> Na-pem • No-bar, No-pem --> Jumlah (Tergantung penuh thd keynya)
Ketergantungan Transitif • Atribut Z pada relasi R dikatakan tergantung transitif pada atribut X , jika atribut Y tergantung pada atribut X pada relasi R dan atribut Z tergantung pada atribut Y pada relasi R. (X Y, Y Z , maka X Z )
Pengertian Dependensi Transitif • Suatu atribut Z mempunyai dependensi transitif terhadap X jika: – Y memiliki dependensi terhadap X dan – Z memiliki dependensi terhadap Y
X → Z X→Y→Z
Contoh Dependensi Transitif Kuliah
Ruang
Tempat
Waktu
Jaringan Komputer
Merapi
Gedung Utara
Senin, 08.00-09.50
Pengantar Basis Data
Merbabu Gedung Utara
Selasa, 08.00-09.50
Matematika I
Rama
Gedung Selatan
Rabu, 10.00-11.50
Sistem Pakar
Sinta
Gedung Selatan
Kamis, 08.00-09.50
Kecerdasan Buatan
Merapi
Gedung Utara
Selasa, 10.00-11.50
Kuliah → { Ruang, Waktu }
Ruang → Tempat
Kuliah → Ruang → Tempat
Contoh Lain Dependensi Transitif Id_Pelanggan
Nama
Salesman
Area
A-001
Andi
Farkan
Jateng
A-002
Kurnia Jati
Dian
Jabar
B-001
Fika Dewi
Joned
Jatim
B-002
Gani Wirawan
Farkan
Jateng
C-001
Cici Kusuma
Joned
Jatim
Id_Pelanggan
Nama
Salesman
Area
Contoh Lain Dependensi Transitif No_Pesan
No_Urut
Kode_Item
Nama_Item
Jumlah
06008
1
P1
Pensil
5
06008
2
P2
Buku Tulis
10
06008
3
P3
Penggaris
6
06008
4
P4
Penghapus
4
06009
1
P3
Penggaris
1
06009
2
P5
Pulpen
10
06009
3
P6
Spidol
5
06010
1
P1
Pensil
4
06010
2
P2
Buku Tulis
10
No_Pesan
No_Urut
Kode_Item
Nama_Item
Jumlah
Problem pada Dependensi Transitif Id_Pelanggan
Nama
Salesman
Area
A-001
Andi
Farkan
Jateng
A-002
Kurnia Jati
Dian
Jabar
B-001
Fika Dewi
Joned
Jatim
B-002
Gani Wirawan
Farkan
Jateng
C-001
Cici Kusuma
Joned
Jatim
Anomali penyisipan: Seorang salesman baru yang bertugas di Jateng tidak dapat dimasukkan dalam tabel sampai salesman tersebut mendapatkan seorang pelanggan Anomali penghapusan:
Jika pelanggan A-002 dihapus, informasi bahwa Dian menangani daerah Jabar ikut hilang Anomali peremajaan: Jika katakanlah Farkan mendapat penugasan baru untuk menangani daerah Kalimantan, maka sejumlah baris harus diremajakan agar data tetap konsisten
• Tahap Normalisasi dimulai dari tahap paling ringan (1NF) hingga paling ketat (5NF) • Biasanya hanya sampai pada tingkat 3NF atau BCNF karena sudah cukup memadai untuk menghasilkan tabel-tabel yang berkualitas baik.
Jika kriteria ketiga (BCNF) tidak dapat terpenuhi, maka paling tidak tabel tersebut tidak melanggar Bentuk Normal tahap ketiga (3rd Normal Form / 3NF).
Tabel Universal Tabel Universal (Universal / Star Table) sebuah tabel yang merangkum semua kelompok data yang saling berhubungan, bukan merupakan tabel yang baik. Misalnya:
Tabel Universal
Bentuk-bentuk Normal 1. Bentuk Normal Tahap Pertama (1st Normal Form / 1NF) 2. Bentuk Normal Tahap Kedua (2nd Normal Form / 2NF) 3. Bentuk Normal Tahap (3rd Normal Form / 3NF) 4. Boyce-Code Normal Form (BCNF) 5. Bentuk Normal Tahap (4th Normal Form / 4NF) 6. Bentuk Normal Tahap (5th Normal Form / 5NF)
Bentuk Normal Tahap Pertama (1st Normal Form / 1NF) • Bentuk normal 1NF terpenuhi jika sebuah tabel tidak memiliki atribut bernilai banyak (multivalued attribute), atribut composite atau kombinasinya dalam domain data yang sama. • Setiap atribut dalam tabel tersebut harus bernilai atomic (tidak dapat dibagi-bagi lagi)
Contoh 1 Misal data mahasiswa sbb:
Atau:
Tabel-tabel di atas tidak memenuhi syarat 1NF
Contoh 1 Didekomposisi menjadi:
Tabel Mahasiswa
Tabel Hobi
Contoh 2 (composite) JadwalKuliah Kodekul
NamaKul
Dosen
Kelas
Jadwal
Dimana nilai pada atribut jadwal berisi gabungan antara Hari dan Jam. Jika asumsi hari dan jam memegang peranan penting dalam sistem basis data, maka atribut Jadwal perlu dipisah sehingga menjadi JadwalHari dan JadwalJam sbb:
JadwalKuliah Kodekul
NamaKul
Dosen
Kelas
JadwalHari
JadwalJam
Bentuk Normal Tahap Kedua (2nd Normal Form) • Bentuk normal 2NF terpenuhi dalam sebuah tabel jika telah memenuhi bentuk 1NF, dan semua atribut selain primary key, secara utuh memiliki Functional Dependency pada primary key • Sebuah tabel tidak memenuhi 2NF, jika ada atribut yang ketergantungannya (Functional Dependency) hanya bersifat parsial saja (hanya tergantung pada sebagian dari primary key) • Jika terdapat atribut yang tidak memiliki ketergantungan terhadap primary key, maka atribut tersebut harus dipindah atau dihilangkan
Contoh Tabel berikut memenuhi 1NF tapi tidak termasuk 2NF: Mhs_nrp
mhs_nama
mhs_alamat
mk_nama
mk_sks
nihuruf
Tidak memenuhi 2NF, karena {Mhs_nrp, mk_kode} yang dianggap sebagai primary key sedangkan: {Mhs_nrp, mk_kode} {Mhs_nrp, mk_kode} {Mhs_nrp, mk_kode} {Mhs_nrp, mk_kode} {Mhs_nrp, mk_kode}
mk_kode
mhs_nama mhs_alamat mk_nama mk_sks nihuruf
Tabel di atas perlu didekomposisi menjadi beberapa tabel yang memenuhi syarat 2NF
Contoh Functional dependencynya sbb: {Mhs_nrp, mk_kode} nihuruf (fd1) Mhs_nrp {mhs_nama, mhs_alamat} (fd2) Mk_kode {mk_nama, mk_sks} (fd3)
fd1 fd2 fd3
(mhs_nrp, mk_kode, nihuruf) Tabel Nilai (Mhs_nrp, mhs_nama, mhs_alamat) Tabel Mahasiswa (mk_kode, mk_nama, mk_sks) Tabel MataKuliah
Bentuk Normal Tahap Ketiga (3rd Normal Form /3NF) • Bentuk normal 3NF terpenuhi jika telah memenuhi bentuk 2NF, dan jika tidak ada atribut non primary key yang memiliki ketergantungan terhadap atribut non primary key yang lainnya. • Untuk setiap Functional Dependency dengan notasi X A, maka: • X harus menjadi superkey pada tabel tsb. • Atau A merupakan bagian dari primary key pada tabel tsb.
Contoh Tabel berikut memenuhi 2NF, tapi tidak memenuhi 3NF: Mahasiswa Nrp
Nama
Alm_Jalan
Alm_Kota
Alm_Provinsi Alm_Kodepos
karena masih terdapat atribut non primary key (yakni alm_kota dan alm_Provinsi) yang memiliki ketergantungan terhadap atribut non primary key yang lain (yakni alm_kodepos):
alm_kodepos {alm_Provinsi, alm_kota} Sehingga tabel tersebut perlu didekomposisi menjadi:
Mahasiswa (Nrp, nama, alm_jalan, alm_kodepos) Kodepos (alm_kodepos, alm_provinsi, alm_kota)
Boyce-Code Normal Form (BCNF) • Bentuk BCNF terpenuhi dalam sebuah tabel, jika untuk setiap functional dependency terhadap setiap atribut atau gabungan atribut dalam bentuk: X Y maka X adalah super key • tabel tersebut harus di-dekomposisi berdasarkan functional dependency yang ada, sehingga X menjadi super key dari tabel-tabel hasil dekomposisi • Setiap tabel dalam BCNF merupakan 3NF. Akan tetapi setiap 3NF belum tentu termasuk BCNF . Perbedaannya, untuk functional dependency X A, BCNF tidak membolehkan A sebagai bagian dari primary key.
Bentuk Normal Tahap Keempat (4th Normal Form /4NF) • Bentuk normal 4NF terpenuhi dalam sebuah tabel jika telah memenuhi bentuk BCNF, dan tabel tersebut tidak boleh memiliki lebih dari sebuah multivalued atribute • Untuk setiap multivalued dependencies (MVD) juga harus merupakan functional dependencies
Contoh Misal, tabel berikut tidak memenuhi 4NF:
Setiap employee dapat bekerja di lebih dari project dan dapat memiliki lebih dari satu skill. Untuk kasus seperti ini tabel tersebut harus di-dekomposisi menjadi: (Employee, Project) (Employee, Skill)
Bentuk Normal Tahap Keempat (5th Normal Form /5NF) • Bentuk normal 5NF terpenuhi jika tidak dapat memiliki sebuah lossless decomposition menjadi tabel-tabel yg lebih kecil. • Jika 4 bentuk normal sebelumnya dibentuk berdasarkan functional dependency, 5NF dibentuk berdasarkan konsep join dependence. Yakni apabila sebuah tabel telah di-dekomposisi menjadi tabeltabel lebih kecil, harus bisa digabungkan lagi (join) untuk membentuk tabel semula
nim
nama
Kursus kursus
tgl
kursus
tgl
kursus
tgl
SQL
2-5-2002
003
Anton
UNIX
2-3-2002
OFFICE
2-4-2002
006
Dina
OFFICE
2-4-2002
SQL
2-5-2002
008
Budi
SQL
2-5-2002
• Buatlah tabel normalisasi 1NF nya!
nim
Nama
nim
kursus
kursus
Tgl
003
Anton
003
UNIX
UNIX
2-3-2002
006
Dina
003
OFFICE
OFFICE
2-4-2002
008
Budi
003
SQL
SQL
2-5-2002
006
OFFICE
006
SQL
008
SQL