STK 572 Manajemen Data Statistik
Tim Dosen: Dr. Farit Muhammad Affendi Dr. Agus M Soleh 2016
Menyiapkan Data untuk Statistik Dr. Agus M Soleh
[email protected]
2
Sumber Data Asal • Tipe File: – Text File – Spreadsheet – Database relasional – Dll
• Umumnya data disiapkan dalam bentuk database relasional • Database sudah di-”normalisasi”? 3
Normalisasi Database
Normalisasi • Normalisasi adalah proses pembentukan struktur basis data sehingga sebagian besar ambiguity bisa dihilangkan. • Digunakan untuk memastikan bahwa database yang dibuat berkualitas baik • Tahap Normalisasi dimulai dari tahap paling ringan (1NF) hingga paling ketat (5NF) • Biasanya hanya sampai pada tingkat 3NF atau BCNF karena sudah cukup memadai untuk menghasilkan tabel-tabel yang berkualitas baik. 5
Normalisasi Sebuah tabel dikatakan baik (efisien) atau normal jika memenuhi 3 kriteria sbb: 1.
2. 3.
Jika ada dekomposisi (penguraian) tabel, maka dekomposisinya harus dijamin aman (Lossless-Join Decomposition). Artinya, setelah tabel tersebut diuraikan / didekomposisi menjadi tabel-tabel baru, tabel-tabel baru tersebut bisa menghasilkan tabel semula dengan sama persis. Terpeliharanya ketergantungan fungsional pada saat perubahan data (Dependency Preservation). Tidak melanggar Boyce-Code Normal Form (BCNF) (-akan dijelaskan kemudian-) 6
Tabel Universal
7
Bentuk-bentuk Normal 1. Bentuk Normal Tahap Pertama (1st Normal Form / 1NF) 2. Bentuk Normal Tahap Kedua (2nd Normal Form / 2NF) 3. Bentuk Normal Tahap (3rd Normal Form / 3NF) 4. Boyce-Code Normal Form (BCNF) 5. Bentuk Normal Tahap (4th Normal Form / 4NF) 6. Bentuk Normal Tahap (5th Normal Form / 5NF)
8
Bentuk Normal Tahap Pertama (1st Normal Form / 1NF) • Bentuk normal 1NF terpenuhi jika sebuah tabel tidak memiliki atribut bernilai banyak (multivalued attribute), atribut composite atau kombinasinya dalam domain data yang sama. • Setiap atribut dalam tabel tersebut harus bernilai atomic (tidak dapat dibagi-bagi lagi)
9
Contoh 1 (multi value atribut*)
Misal data mahasiswa sbb:
NRP
Nama
Hobi
12020001
Heri Susanto
Sepakbola, Membaca Komik, Berenang
12020013
Siti Zulaiha
Memasak, membuat program komputer
12020018
Heri Susanto
Membuat program Komputer
12020015
Dini Susanti
Menjahit, Membuat Roti
NRP
Atau:
Nama
Hobi1
12020001
Heri Susanto
Sepakbola
12020013
Siti Zulaiha Memasak
12020018
Heri Susanto
Membuat Program Komputer
12020015
Dini Susanti
Menjahit
Hobi2
Membaca Komik
Hobi3
Berenang
Membuat Program Komputer
Membuat Roti
Tabel-tabel di atas tidak memenuhi syarat 1NF 10
*Multi value atribut adalah atribut yang memiliki lebih dari satu nilai
Tabel yang memenuhi 1NF NRP
Nama
Hobi
12020001
Heri Susanto
Sepakbola
12020001
Heri Susanto
Membaca Komik
12020001
Heri Susanto
Berenang
12020013
Siti Zulaiha
Memasak
12020013
Siti Zulaiha
Membuat program Komputer
12020018
Heri Susanto
Membuat Program Komputer
12020015
Dini Susanti
Menjahit
12020015
Dini Susanti
Membuat Roti
11
Bentuk Normal Tahap Kedua (2nd Normal Form)
• Bentuk normal 2NF terpenuhi dalam sebuah tabel jika telah memenuhi bentuk 1NF, dan semua atribut selain primary key, secara utuh memiliki Functional Dependency pada primary key • Sebuah tabel tidak memenuhi 2NF, jika ada atribut yang ketergantungannya (Functional Dependency) hanya bersifat parsial saja (hanya tergantung pada sebagian dari primary key) • Jika terdapat atribut yang tidak memiliki ketergantungan terhadap primary key, maka atribut tersebut harus dipindah atau dihilangkan
12
Functional Dependency • Notasi: A B • A dan B adalah atribut dari sebuah tabel. Berarti secara fungsional A menentukan B atau B tergantung pada A, jika dan hanya jika ada 2 baris data dengan nilai A yang sama, maka nilai B juga sama
Notasi: A B atau A x B Adalah kebalikan dari notasi sebelumnya.
13
Functional Dependency Contoh tabel nilai
14
Functional Dependency Functional Dependency dari tabel nilai
Nrp namaMhs Karena untuk setiap nilai nrp yang sama, maka nilai namaMhs juga sama.
{Namakul, nrp} NiHuruf Karena attribut Nihuruf tergantung pada Namakul dan nrp secara bersama-sama. Dalam arti lain untuk Namakul dan nrp yang sama, maka NiHuruf juga sama, karena Namakul dan nrp merupakan key (bersifat unik). NRP NamaKul Nrp NiHuruf
15
Contoh Tabel berikut memenuhi 1NF tapi tidak termasuk 2NF: Mhs_nrp
mhs_nama
mhs_alamat
mk_nama
mk_sks
nihuruf
Tidak memenuhi 2NF, karena {Mhs_nrp, mk_kode} yang dianggap sebagai primary key sedangkan: {Mhs_nrp, mk_kode} {Mhs_nrp, mk_kode} {Mhs_nrp, mk_kode} {Mhs_nrp, mk_kode} {Mhs_nrp, mk_kode}
mk_kode
mhs_nama mhs_alamat mk_nama mk_sks nihuruf
Tabel di atas perlu didekomposisi menjadi beberapa tabel yang memenuhi syarat 2NF 16
Contoh Functional dependencynya sbb: {Mhs_nrp, mk_kode} nihuruf Mhs_nrp {mhs_nama, mhs_alamat} Mk_kode {mk_nama, mk_sks}
fd1 fd2 fd3
(fd1) (fd2) (fd3)
(mhs_nrp, mk_kode, nihuruf) Tabel Nilai (Mhs_nrp, mhs_nama, mhs_alamat) Tabel Mahasiswa (mk_kode, mk_nama, mk_sks) Tabel MataKuliah
17
Bentuk Normal Tahap Ketiga (3rd Normal Form /3NF) • Bentuk normal 3NF terpenuhi – jika telah memenuhi bentuk 2NF, dan – jika tidak ada atribut yang bukan kunci memiliki ketergantungan transitif (tidak secara langsung) pada primary key.
18
Contoh
Tabel berikut memenuhi 2NF, tapi tidak memenuhi 3NF: No Pesanan
No Urut
Kode item
Nama item
5001
001
P1
Pensil
5001
002
P2
Buku Tulis
5002
001
P1
Pensil
5003
001
P2
Buku Tulis
{No Pesanan, No Urut} Kode Item {No Pesanan, No Urut} Nama item Kode Item Nama item (Nama item tergantung pada kode item, Kode item bukan primary key dari tabel ini) Nama item bergantung pada No pesanan dan no urut secara tidak langsung, karena ia bergantung pada kode item
Dengan kata lain ada atribut bukan primary key yang bergantung pada atribut yang bukan primary key
Solusi: nama dihilangkan dari tabel di atas dan dibuat tabel sendiri bersamaan dengan kode item
19
Tabel berikut telah memenuhi 3NF
Tabel Pesanan
No Pesanan
No Urut
Kode item
Primary Key: No Pesanan + No Urut
5001
001
P1
5001
002
P2
5002
001
P1
5003
001
P2
Tabel Barang
Kode item
Nama item
Primary Key: Kode item
P1
Pensil
P2
Buku Tulis
Solusi: nama dihilangkan dari tabel di atas dan dibuat tabel sendiri bersamaan dengan kode item
20
Boyce-Code Normal Form (BCNF) • Bentuk BCNF terpenuhi dalam sebuah tabel, jika untuk setiap functional dependency terhadap setiap atribut atau gabungan atribut dalam bentuk: X Y maka X adalah super key • tabel tersebut harus di-dekomposisi berdasarkan functional dependency yang ada, sehingga X menjadi super key dari tabel-tabel hasil dekomposisi • Setiap tabel dalam BCNF merupakan 3NF. Akan tetapi setiap 3NF belum tentu termasuk BCNF . BCNF merupakan perbaikan bagi 3NF yang anomali.
21
Contoh BCNF Siswa
Kursus
Tutor
Anwar
Bahasa Perancis
Pierre
Anwar
Bahasa Inggris
Richard
Budi
Bahasa Perancis
Pierre
Cecep
Bahasa Inggris
Suzanne
Tabel tersebut tidak melanggar 3NF Seorang siswa dapat mengambil sejumlah kursus Tutor hanya mengajar pada sebuah kursus, satu kursus bisa diajar oleh banyak tutor Kunci kandidat: Siswa + Kursus Kursus + Tutor
Solusi: dekomposisi tabel
SISWA TUTOR KURSUS Hubungan ketergantungan Jika baris Cecep dihapus, Informasi suzanne sebagai tutor bahasa inggris akan hilang 22
Memenuhi BCNF Siswa
Tutor
Anwar
Pierre
Anwar
Richard
Budi
Pierre
Cecep
Suzanne
Tutor
Kursus
Pierre
Bahasa Perancis
Richard
Bahasa Inggris
Pierre
Bahasa Perancis
Suzanne Bahasa Inggris
Solusi: dekomposisi tabel
23
Bentuk Normal Tahap Keempat (4th Normal Form /4NF)
• 4NF terpenuhi jika
– telah memenuhi bentuk BCNF, – Tidak mengandung dua atribut atau lebih yang bernilai banyak
24
Contoh Misal, tabel berikut tidak memenuhi 4NF: Nama Pegawai
Proyek
Skill
Jim
11, 6
Komunikasi, pemrogram mahir, negosiasi
Mary
5, 11
Analisis, Desain
Setiap pegawai dapat bekerja di lebih dari satu proyek dan dapat memiliki lebih dari satu skill. Untuk kasus seperti ini tabel tersebut harus di-dekomposisi menjadi: (Nama Pegawai, Proyek) (Nama Pegawai, Skill)
25
Bentuk Normal Tahap Keempat (5th Normal Form /5NF)
• Suatu tabel dikatakan tidak memenuhi 5NF jika ia atributnya saling bergantung dengan atribut lain • Bentuk normal 5NF terpenuhi jika data yang ada padanya tidak dapat didekomposisi lagi menjadi tabel yang lebih kecil • Jika 4 bentuk normal sebelumnya dibentuk berdasarkan functional dependency, 5NF dibentuk berdasarkan konsep join dependence. Yakni apabila sebuah tabel telah di-dekomposisi menjadi tabeltabel lebih kecil, harus bisa digabungkan lagi (join) untuk membentuk tabel semula 26
Contoh Dealer
Distributor
Kendaraan
PT Sumber Jaya
Nissan
Truk Nissan
PT Sumber Jaya
Toyota
Toyota Kijang
PT Sumber Jaya
Toyota
Truk Dyna
PT Asterindo
Nissan
Sedan Nissan
•Pecah menjadi 3 tabel: •Deal_dist(Dealer, Distributor) •Dist_kend(Distributor,Kendaraan) •Deal_kend(Dealer, kendaraan) •Jika digabung menjadi satu akan kembali menjadi tabel diatas
Tidak memenuhi 5NF
memenuhi 5NF
27
Tahap Perencanaan • ER Diagram Menjamin Sampai 3NF
Selesai