Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
PENGELOMPOKAN ZAT GIZI MAKANAN MENGGUNAKAN ANALISIS DISKRIMINAN H.A. Parhusip, Jantini T. Natangku Center of Applied Science and Mathematics Fakultas Sains dan Matematika Universitas Kristen Satya Wacana, Salatiga http://www.uksw.edu
Abstrak Paper ini menjelaskan tentang penggelompokkan jenis makanan berdasarkan zat gizi yang terkandung di dalamnya. Pengelompokkan jenis makanan terbagi atas banyaknya zat gizi mikro (karbohidrat dan kalsium) dan zat gizi makro (protein dan lemak). Metode yang digunakan adalah metode Analisis Diskriminan. Data yang diambil dari Daftar Komposisi Bahan Makanan (DKBM) Indonesia, yang meliputi dari 50 jenis makanan dan 4 variabel jenis gizi yang dikandung. 4 jenis gizi tersebut adalah Protein, dan Lemak, Karbohidrat, Kalsium. Metode ini akan membagi 4 variabel menjadi 2 grup yaitu zat gizi mikro dan zat gizi makro pada makanan. Hasil dari analisis data tersebut akan menunjukkan jenis makanan tersebut termasuk jenis makanan yang mengandung banyak zat gizi mikro atau lebih banyak mengandung zat gizi makro. Kata Kunci: Zat gizi makro, zat gizi mikro, analisis diskriminan .
1. Pendahuluan Zat gizi pada makanan dapat dibagi menjadi 2 bagian berdasarkan jumlah yang terkandung didalamnya, yaitu zat gizi mikro merupakan zat gizi yang dibutuhkan tubuh dalam jumlah kecil atau sedikit dan zat gizi makro merupakan zat gizi yang dibutuhkan tubuh dalam jumlah besar(web 1) . Pada identifikasi jenis makanan berdasarkan gizi yang dikandung ini, telah didentifikasi masing – masing 2 jenis gizi yang merupakan zat gizi mikro dan makro. Zat gizi mikro yang telah diidentifikasi yaitu karbohidrat dan kalsium, sedangkan zat gizi makro yaitu protein dan lemak. Akan tetapi dapat dijumpai bahwa jenis makanan yang didaftar tidak dikelompokkan dengan mudah berdasarkan kedua jenis gizi tersebut. Terlebih lagi jika makanan bersifat lokal maka identifikasi makanan tersebut sangat sulit dilakukan (Ireland, 2000). Demikian pula berdasarkan Daftar Makanan Indonesia pada literatur, pengelompokkan masih
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
berdasarkan jenis makanan yang tentunya masih dilakukan secara manual. Makalah ini memberikan cara melakukan klasifikasi dengan analisa diskriminan. Makalah ini menggunakan data yang bersumber dari Daftar Komposisi Bahan Makanan (DKBM) Indonesia yang ditunjukkan pada Tabel 1. Tabel 1. Data Kandungan Gizi pada Jenis - jenis Makanan
No
Kandungan
Nama Makanan Protein
Lemak
Karbohidrat
Kalsium
11.30
1422.00
1
Bandeng Presto
17.10
20.30
2
Cumi - cumi Goreng
40.60
10.10
0.00
62.00
3
Empek Tangiri
7.20
1.20
33.40
164.00
4
Gurame Asam Manis
12.70
10.10
12.70
283.00
5
Ikan Mas Goreng
18.10
0.00
0.00
20.00
6
Mujair Goreng
46.90
23.90
0.00
346.00
7
Botok Lamtoro
11.70
9.70
13.00
771.00
8
Buncis Rebus
2.20
0.20
6.40
107.00
9
Keredok
2.20
3.30
114.10
174.00
10
Gado - gado
6.10
3.20
21.00
301.00
11
Ketoprak
7.90
7.70
13.00
153.00
12
Pecel
11.14
12.53
31.72
267.00
13
Sayur Asem
0.70
0.60
5.00
40.00
14
Sayur Daging Sapi
21.70
0.00
0.00
21.30
15
Sayur Lodeh
1.90
0.00
0.00
35.40
16
Soup
1.40
0.00
0.00
20.80
17
Sayur Tahu Toge
3.40
0.00
0.00
47.90
18
Sayur Tempe
9.30
0.00
0.00
98.70
19
Semur Jengkol
1.80
2.40
12.10
0.02
20
Semur Telur
5.00
0.00
0.00
60.80
21
Soto Banjar
4.70
6.70
5.10
147.00
22
Soto Betawi
2.50
8.80
11.50
222.00
23
Soto Kudus
2.60
2.30
1.80
237.00
24
Soto Pekalongan
3.00
6.80
5.10
322.00
25
Toge Goreng
3.20
2.10
14.00
168.00
26
Tumis Bayam
2.00
0.00
0.00
191.90
27
Tumis Kangkung
2.50
0.00
0.00
69.60
28
Cerelac
9.00
15.50
68.90
443.33
29
Sosis daging
14.50
42.30
2.30
28.00
30
Kelepon
3.70
3.70
41.80
232.00
31
Kue Bika Ambon
2.10
1.20
44.40
45.00
32
Bawal Goreng
19.00
1.70
0.00
20.00
33
Cumi - cumi
16.10
0.70
0.00
32.00
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
34
Kue Wijen
18.20
38.40
36.80
251.00
35
Udang Goreng
21.00
0.20
0.10
136.00
36
Kepiting Asam Manis
13.80
3.80
14.10
210.00
37
Lapis Legit
6.60
15.70
55.50
16.00
38
Ledre Pisang
4.80
5.10
84.90
59.00
39
Mendhut
3.11
1.19
16.35
16.00
40
Pisang Goreng
1.40
3.80
23.10
7.20
41
Gambas Oyong
0.80
0.20
4.10
19.00
42
Tumis Kacang Panjang
2.70
0.30
7.80
49.00
43
Satru Ponorogo
13.90
2.10
76.40
116.00
44
Taoge Kacang Kedele
9.00
2.60
6.40
50.00
45
Widaran
1.30
10.70
80.70
49.00
46
Wingko Babat
3.20
15.10
51.40
47.00
47
Yangko
3.00
1.10
58.10
184.00
48
Donat
9.40
10.40
56.50
0.00
49
Enting Gepuk
13.30
29.20
52.00
76.00
50
Bakpau
12.20
2.60
42.60
21.00
Makalah ini disusun sebagai berikut. Pada Bab II ditunjukkan analisa diskriman sebagai metode yang digunakan dalam melakukan pengelompokkan. Prosedur yang dilakukan dijelaskan secara bertahap pada Bab III. Selanjutnya sebagai hasil analisis ditunjukkan pada Bab IV. Adapun kesimpulan dinyatakan pada bagian akhir makalah ini. 2. Analisis Diskriminan Pada dasarnya analisa diskriminan dipergunakan untuk mengetahui peubah-peubah penciri yang membedakan kelompok individu yang ada, selain itu juga dapat dipergunakan sebagai kriteria pengelompokan yang dilakukan berdasarkan perhitungan statistik
terhadap
kelompok
yang
terlebih
dahulu
diketahui
secara
jelas
pengelompokannya. Apabila dua atau lebih grup ( n1 , n2 ,..., nm ) telah diukur dalam beberapa peubah X 1 , X 2 ,..., X m maka dapat dibangun fungsi linear tertentu, dimana fungsi itu merupakan fungsi pembeda terbaik bagi kelompok – kelompok grup yang diteliti. Analisis diskriminan adalah teknik statistika untuk mengelompokkan grup - grup ke dalam kelompok-kelompok yang saling bebas berdasarkan sekelompok variabel bebas. Proses klasifikasi grup – grup tersebut merupakan salah satu analisis statistika
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
yang diperlukan, jika ada beberapa kelompok grup kemudian ingin diketahui apakah kelompok-kelompok tersebut memang berbeda secara statistika. Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Kombinasi linier dari variabel- variabel ini akan membentuk suatu fungsi diskriminan. Apabila dimensi data sangat besar, maka analisis diskriminan daapat dilakukan dengan melakukan pengelompokan data terlebih dahulu (clustering) ( Thomas dan Dean,-). Pada makalah ini data akan dipisahkan menjadi 2 grup dan misalkan ruang sampel adalah suatu populasi P. Sebutlah grup 1 sebagai zat gizi makro dan 2 sebagai grup zat gizi mikro dengan ketentuan bahwa kalsium dan karbohidrat termasuk kelompok zat gizi mikro sedangkan protein dan lemak termasuk kelompok zat gizi makro. Sedangkan data pada Tabel 1 terdiri dari 4 sampel, protein, lemak karbohidrat dan kalsium. Pada makalah ini akan ditekankan pada pengklasifikasian data multivariat dalam 2 kelompok grup dengan nilai kovariansi sama yaitu ∑1 = ∑2 = ∑. Sebutlah f1 ( x) menyatakan fungsi densitas untuk 1 dan
f 2 ( x) untuk 2 . Fungsi densitas masing-
masing adalah i= 1, 2 .
(1)
Misalkan data di setiap sampel dalam variabel (2) Sedangkan nilai rata-rata
dan kovariansi
untuk masing – masing sampel
dan
yaitu berturut-turut
.
(3a)
Pada pengelompokkan masing- masing individu data, dapat terjadi salah penempatan (misclassification) yang dapat berpengaruh terhadap biaya yang digunakan. Biaya suatu anggota grup
salah ditempatkan sebagai anggota grup
sebutlah c(1|2).
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
Sebutlah pula c(2|1) merupakan biaya suatu anggota grup anggota grup
salah ditempatkan sebagai
. Kita perlu mempunyai sifat rata-rata sebagai harapan biaya salah
terklasifikasi (expected cost misclassification (ECM)) yang sekecil mungkin.
Yang
dimaksud biaya disini dapat juga berupa energi atau usaha yang digunakan dalam pengelompokan. Dalam aplikasi seringkali sangat sulit untuk terukur. Karena batas antar grup dapat bias (tidak tegas), maka kita perlu melakukan klasifikasi dengan mempunyai probabilitas prior tiap grup terlebih dahulu. Sebutlah dan grup
berturut-turut menyatakan probailitas prior grup ke-1 dan grup ke-2. Jika domain adalah R1 dan domain grup
adalah R2 maka berlaku (Johnson dan
Wichern,2007, hal.500)
R1 :
f1 ( x) c(1 | 2) p2 dan R2 : f 2 ( x) c(2 | 1) p1
Seber menjelaskan formulasi (3b)
f1 ( x) c(1 | 2) p2 . f 2 ( x) c(2 | 1) p1
(3b)
secara lebih detail [4] yang diperoleh dengan
memperhatikan total nilai harapan ECM yang diminimalkan. Salah satu kejadi khusus dengan ECM yaitu untuk c(1|2) = c(2|1) atau rasio keduanya sama dengan 1 yang artinya biaya untuk salah penempatan pada grup 1 dan grup 2 sama. Maka dapat diperoleh persamaan (3b) menjadi R1 :
f1 ( x) p2 ; R2 : f 2 ( x) p1
f1 ( x) p2 . f 2 ( x) p1
(3c)
Karena diasumsikan kedua grup tersebut mempunyai matriks kovariansi grup ∑ yang sama, maka matriks kovariansi sampel S1 dan S2 berasal dari 1 kelompok grup, maka dapat diperoleh kovariansi kelompok tersebut melalui persamaan berikut : (4) Dengan mensubtitusi nilai
untuk
,
untuk
dari persamaan (3a) pada
persamaan (4) maka dapat diperoleh aturan klasifikasi. Suatu sampel x 0 dalam grup
1 jika dipenuhi
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
(5)
Diasumsikan bahwa nilai Karena nilai
= 1, diperoleh nilai
.
sehingga persamaan (5) menjadi .
(6)
x 0 (sampel) masuk dalam grup 1
Jika persamaan (6) terpenuhi, maka
sedangkan jika tidak terpenuhi maka x 0 (sampel) masuk dalam grup 2 . Pada literatur tidak ditunjukkan bagaimana x 0 diambil. Pada makalah ini x 0 merupakan vektor yang tiap komponennya merupakan rata-rata dari komponen dalam grup yang sama. Contoh 1: Untuk data Bandeng presto pada Tabel 1, maka 2]. Jadi setiap jenis makanan pada Tabel 1 perlu ditentukan vektor x 0 yang disubstitusikan pada persamaan (6). Formulasi
yang telah disebutkan
mensyaratkan bahwa data
haruslah
berdistribusi normal. Oleh karena itu data perlu diuji dan hal ini ditunjukkan pada Teorema 1 (Parhusip.dkk, 2010) Teorema 1. Jika X= [ X 1 ,...,X p ] berdistribusi N p ( , ) dengan > 0 maka 1. x ' 1 x terdistribusi
X p2 ( )
distribusi dengan derajat kebebasan sebesar p. N p ( , ) 2. menyatakan distribusi
ellipsoida x : ( x ) ' 1 ( x ) X p 2 ( )
X p2 ( ) menyatakan chi-square
, dengan
dengan
untuk X 2p ( )
probabilitas menyatakan
batas
(1- ) atas
prosentase ke 100x dari distribusi X 2p . Oleh karena itu sebagai uji normalitas berdasarkan data sampel yaitu :
x ' S 1x X 2p ( )
(7)
dengan X p2 ( ) menyatakan distribusi chi-squre. Jika persamaan (7) tersebut tidak dipenuhi maka data dianggap tidak berdistribusi normal. Kita akan menyatakan banyaknya data berdistribusi normal dalam prosentase. Jika sebagian besar data
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
memenuhi persamaan (7) maka kita dapat menyimpulkan data secara keseluruhan berdistribusi normal. Perlu diperhatikan bahwa formula yang digunakan bebas dimensi. Sehingga setiap data yang digunakan dalam analisa haruslah bebas dimensi. Kita dapat melakukan hal itu dengan membagi setiap data tiap kolom dengan maksimum tiap kolom. 3. Metode Penelitian 1. Data yang digunakan Data yang digunakan pada kasus ini di ambil dari data Daftar Komposisi Bahan Makanan (DKBM) Indonesia (Tabel 1). Data dipilih sebanyak 50 jenis makanan dan 4 variabel yang masing – masing mewakili jenis zat gizi yang ada. 2. Data dinyatakan tanpa dimensi dengan membagi tiap kolom dengan maksimum tiap kolom. 3. Data perlu diuji apakah berdistribusi normal. Jika berdistribusi normal maka analisa diskriminan dapat dilakukan. 4. Data yang berdistribusi normal tersebut kemudian dipisahkan menjadi 2 kelompok grup yaitu makro (protein dan lemak) dan mikro (karbohidrat dan kalsium). Analisa dengan prosedur tersebut dilakukan dengan menggunakan bantuan program MATLAB 6.5. 4.
Hasil dan Pe mbahasan Agar analisis diskriminan dapat dilakukan, maka normalitas data terlebih dahulu
diuji. Hal itu dilakukan menggunakan bantuan program Matlab 6.5. Kita menggunakan
0.05 dan derajat kebebasan p=4 berdasarkan Tabel X p2 ( ) diperoleh X p2 ( ) = 9.49 yang digunakan sebagai batas pada persamaan (7). Hasil uji kenormalan tersebut dapat terlihat dalam Gambar 1 dengan garis putus-putus menyatakan nilai batas X p2 ( ) = 9.49. Diatas garis batas, maka data tidak berdistribusi normal. Akan tetapi
hanya
sebagian kecil data yang tidak berdistribusi normal (6%). Oleh karena itu
dapat
disimpulkan data secara keseluruhan berdistribusi normal.
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
Gambar 1. Uji normalitas data (Data di atas garis horizontal merupakan data yang tidak berdistribusi normal)
Selanjutnya dengan menggunakan persamaan (3-6) kita dapat melakukan analisa diskriminan. Untuk menggunakan persamaan (6) maka matriks kovariansi gabungan haruslah
punya
invers
(tidak
singular).
Diperoleh
bahwa
. Dapat diselidiki bahwa matriks ini punya invers (determinan tidak nol) sehingga persamaan (6) dapat digunakan. Dengan membuat pemrograman MATLAB, kita dapat menseleksi bahwa daftar makanan yang makro pada Tabel 1 adalah makanan pada daftar No berikut [1; 40
3;
4;
7;
9;
10;
12;
22;
24;
25;
28;
30;
31;
36;
37;
38;
43; 45; 46; 47; 48; 49; 50]. Hasil pengelompokkan ini dapat didaftar pada Excel untuk mendapatkan tampilan
visual yang lebih mudah dibaca yang ditunjukkan pada Gambar 2. Untuk histogram yang cukup kecil (dekat di 0) dapat dikatakan bahwa jenis makanan tersebut tidak dapa t berbeda secara signifikan dalam salah satu kelompok.
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
Gambar 2. Hasil klasifikasi data Tabel1 dalam kelo mpok makro (Protein dan lemak) yang berada di atas 0 dan kelo mpok gizi mikro (berada di bawah 0). Nilai pada garis vertikal adalah nilai yang diperoleh pada ruas kiri persamaan (6)
Kita dapat menggunakan Gambar 2 sebagai referensi. Misalkan bandeng presto lebih dikenal oleh awam yang memuat kandungan protein dan lemak dibandingkan karbohidrat dan kalsiumnya. Sedangkan cumi-cumi goreng lebih memuat karbohidrat dan klasiumnya dibandingkan protein dan lemaknya, dan seterusnya. Hasil ini perlu diteliti lebih lanjut dengan para ahli ilmu pangan. Pengelompokan yang hanya memuat 2 grup tentu masih dapat dikembangkan untuk lebih dari 2 grup. Selain itu, pada Gambar 2 dapat dipilih hasil pengelompokan yang signifikan (tanpa diuji lebih lanjut) untuk masing- masing kelompok. Hal ini ditunjukkan pada Tabel 2. Tabel 2. Daftar hasil pengelo mpokan jenis makanan yang digolongkan menjad i 2 grup
Daftar makanan dengan zat Daftar
makanan
dengan
zat
makro lebih banyak (protein mikro lebih banyak (karbohidrat dan le mak)
dan kalsium)
Badeng presto, Botok Lamtoro, Cumi, ikan mas goreng, mujahir karedok, Cerelak, ledre pisang, goreng, sayur daging sapi, soup, Satru
ponorogo,
widaran, semur telur, sayur lodeh.
wingko babat, yangko, donat, bakpao
Seminar Nasional Statistika Universitas Diponegoro, Semarang, 21 Mei 2011
5.
Kesimpulan Makalah ini berisi tentang pengelompokan jenis makanan berdasarkan zat gizi yang
dikandungnya. Dengan menggunakan daftar makanan yang diberikan oleh data yang digunakan, daftar tersebut dapat dikelompokkan dalam 2 grup. Terdapat 50 jenis makanan dengan berbagai variasi dikelompokkan dalam 2 macam zat gizi yaitu makro (Protein dan Lemak) dan zat mikro (karbohidrat dan kalsium). Daftar Pustaka [1] Johnson,R.A and Wichern, D.W., Applied Multivariate Statistical Analysis, 6th ed. Prentice Hall, 2007. ISBN 0-13-187715-1. [2] Ireland, J.D and Moller, A. ,Review of International Food Classification and Description, Journal of Food Composition and Analysis, 2000, 13, 529-538. [3] Parhusip, H. A., Evi, K., dan Dyah K., Uji Normalitas dan Fungsi Linear Kepadatan Penduduk Salatiga tahun 2008, Prosiding Seminar Nasional dan Pendidikan Sains FSM ISSN: 2087-0922, Vol.1 No.1 Juni 2010, hal. 643-654. [4] Seber, G.A. F, Multivariate Observations, Wiley Series in Probability and Mathematical Statistics, 1984. [5] Thomas , B. M. and Dean, N., Variable Selection and Updating In Model-Based Discriminant Analysis for High-Dimensional Data,Pustaka Internet Web
tubuh/.
1:
http://dahlanforum.wordpress.com/2009/04/24/zat- zat- gizi- yang-dibutuhkan-