BAB 2
LANDASAN TEORI
2.1 Clustering
Pada dasarnya clustering terhadap data adalah suatu proses untuk mengelompokkan sekumpulan data tanpa suatu atribut kelas yang telah didefinisikan sebelumnya, berdasarkan pada prinsip konseptual clustering yaitu memaksimalkan dan juga meminimalkan kemiripan intra kelas. Misalnya, sekumpulan obyek-obyek komoditi pertama-tama dapat di clustering menjadi sebuah himpunan kelas-kelas dan lalu menjadi sebuah himpunan aturan-aturan yang dapat diturunkan berdasarkan suatu klasifikasi tertentu.
Proses untuk mengelompokkan secara fisik atau abstrak obyek-obyek ke dalam bentuk kelas-kelas atau obyek-obyek yang serupa, disebut dengan clustering atau unsupervised classification. Melakukan analisa dengan clustering, akan sangat membantu untuk membentuk partisi-partisi yang berguna terhadap sejumlah besar himpunan obyek dengan didasarkan pada prinsip "divide and conquer" yang mendekomposisikan suatu sistem skala besar, menjadi komponen-komponen yang lebih kecil, untuk menyederhanakan proses desain dan implementasi. Perbedaan utama antara Clustering Analysis dan klasifikasi adalah bahwa Clustering Analysis digunakan untuk memprediksi kelas dalam format bilangan real dan pada format katagorikal atau Boolean.
2.2 Data Clustering
Data Clustering merupakan salah satu metode data miningyang bersifat tanpa arahan (unsupervised). Ada dua jenis data clustering yang sering dipergunakan dalam proses pengelompokan data yaitu hierarchical dataclustering dan non-hierarchical dataclustering. K-Means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Metode ini mempartisi data ke dalam cluster/kelompok sehingga
Universitas Sumatera Utara
data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. Adapun tujuan dari data clustering ini adalah untuk meminimalisasikan objective function yang diset dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan memaksimalisasikan variasi antar cluster. Data clustering menggunakan metode K-Means ini secara umum dilakukan dengan algoritma dasar sebagai berikut: 1. Tentukan jumlah cluster 2. Alokasikan data ke dalam cluster secara random 3. Hitung centroid (rata-rata) dari data yang ada di masing-masing cluster 4. Alokasikan masing-masing data ke centroid (rata-rata) terdekat 5. Kembali ke Step 3, apabila masih ada data yang berpindah cluster atau apabila perubahan nilai centroid, ada yang di atas nilai threshold yang ditentukan atau apabila perubahan nilai pada objective function yang digunakan di atas nilai threshold yang ditentukan.
2.2.1
Perkembangan Penerapan K-Means
Beberapa alternatif penerapan K-Means dengan beberapa pengembangan teori-teori penghitungan terkait telah diusulkan. Hal ini termasuk pemilihan: 1. Distance space untuk menghitung jarak di antara suatu data dan centroid. 2. Metode pengalokasian data kembali ke dalam setiap cluster. 3. Objective function yang digunakan.
Universitas Sumatera Utara
2.2.1.1 Distance Space Untuk Menghitung Jarak Antara Data dan Centroid
Beberapa distance space telah diimplementasikan dalam menghitung jarak (distance) antara data dan centroid termasuk di antaranya L1 (Manhattan/City Block) distance space, L2 (Euclidean) distance space, dan Lp (Minkowski) distance space. Jarak antara dua titik x1 dan x2 pada Manhattan/City Block distance space dihitung dengan menggunakan rumus sebagai berikut:
……… (1)
dimana: p : Dimensi data | . | : Nilai absolut Sedangkan untuk L2 (Euclidean) distance space, jarak antara dua titik dihitung menggunakan rumus sebagai berikut:
--------- (2)
dimana: p : Dimensi data
Lp (Minkowski) distance space yang merupakan generalisasi dari beberapa distance space yang ada seperti L1 (Manhattan/City Block) dan L2 (Euclidean), juga telah diimplementasikan. Tetapi secara umum distance space yang sering digunakan adalah Manhattan dan Euclidean. Euclidean sering digunakan karena penghitungan jarak dalam distance space ini merupakan jarak terpendek yang bisa didapatkan antara dua titik
yang diperhitungkan,
sedangkan
Manhattan
sering
digunakan
karena
kemampuannya dalam mendeteksi keadaan khusus seperti keberadaaan outliers dengan lebih baik.
Universitas Sumatera Utara
2.2.1.2 Metode Pengalokasian Ulang Data ke Dalam Masing-Masing Cluster
Secara mendasar, ada dua cara pengalokasian data kembali ke dalam masing-masing cluster pada saat proses iterasi clustering. Kedua cara tersebut adalah pengalokasian dengan cara tegas (hard), dimana data item secara tegas dinyatakan sebagai anggota cluster yang satu dan tidak menjadi anggota cluster lainnya, dan dengan cara fuzzy, dimana masing-masing data item diberikan nilai kemungkinan untuk bisa bergabung ke setiap cluster yang ada. Kedua cara pengalokasian tersebut diakomodasikan pada dua metode Hard K-Means dan Fuzzy K-Means. Perbedaan di antara kedua metode ini terletak pada asumsi yang dipakai sebagai dasar pengalokasian. Hard K-Means adalah pengalokasian kembali data ke dalam masing-masing cluster dalam metode Hard KMeans didasarkan pada perbandingan jarak antara data dengan centroid setiap cluster yang ada. Data dialokasikan ulang secara tegas ke cluster yang mempunyai centroid terdekat dengan data tersebut. Pengalokasian ini dapat dirumuskan sebagai berikut:
dimana:
1 𝑎𝑖𝑘 = � 𝑑 =min{D(xk,Vt)}.....................(3) 0
aik: Keanggotaan data ke-k ke cluster ke-i vi: Nilai centroid cluster ke-i
Metode Fuzzy K-Means atau lebih sering disebut sebagai Fuzzy C-Means, mengalokasikan kembali data ke dalam masing-masing cluster dengan memanfaatkan teori Fuzzy. Teori ini mengeneralisasikan metode pengalokasian yang bersifat tegas (hard) seperti yang digunakan pada metode Hard K-Means. Dalam metode Fuzzy KMeans dipergunakan variabel membership function, ik u , yang merujuk pada seberapa besar kemungkinan suatu data bisa menjadi anggota ke dalam suatu cluster. Pada Fuzzy K-Means yang diusulkan oleh Bezdek, diperkenalkan juga suatu variabel m yang merupakan weighting exponent dari membership function. Variabel ini dapat mengubah besaran pengaruh dari membership function, ik u , dalam proses clustering menggunakan metode Fuzzy K-Means. m mempunyai wilayah nilai m>1. Sampai sekarang ini tidak ada ketentuan yang jelas berapa besar nilai m yang optimal dalam melakukan proses optimasi suatu permasalahan clustering. Nilai m yang umumnya digunakan adalah 2.
Universitas Sumatera Utara
Membership function untuk suatu data ke suatu cluster tertentu dihitung menggunakan rumus sebagai berikut:
………………… (4)
dimana: uik: Membership function data ke-k ke cluster ke-i vi: Nilai centroid cluster ke-i m : Weighting Exponent Membership function, ik u , mempunyai wilayah nilai ≤0 ik u ≤1. Data item yang mempunyai tingkat kemungkinan yang lebih tinggi ke suatu kelompok akan mempunyai nilai membership function ke kelompok tersebut yang mendekati angka 1 dan ke kelompok yang lain mendekati angka 0.
2.2.1.3 Objective Function Yang Digunakan
Objective function yang digunakan khususnya untuk Hard K-Means dan Fuzzy KMeans ditentukan berdasarkan pada pendekatan yang digunakan dalam poin 2.1. dan poin 2.2. Untuk metode Hard K-Means, objective function yang digunakan adalah sebagai berikut:
………………….. (5) dimana: N : Jumlah data c : Jumlah cluster
uik: Keanggotaan data ke-k ke cluster ke-i vi: Nilai centroid cluster ke-i a mempunyai nilai 0 atau 1. Apabila suatu data merupakan anggota suatu kelompok maka nilai ik a =1 dan sebaliknya. Untuk metode Fuzzy K-Means, objective function yang digunakan adalah sebagai berikut:
Universitas Sumatera Utara
…………… (6) dimana: N : Jumlah data
c: Jumlah cluster m : Weighting exponent
uik: Membership function data ke-k ke cluster ke-i vi: Nilai centroid cluster ke-i Di sini uikbisa mengambil nilai mulai dari 0 sampai 1.
2.3 Beberapa Permasalahan yang Terkait Dengan K-Means
Beberapa permasalahan yang sering muncul pada saat menggunakan metode K-Means untuk melakukan pengelompokan data adalah: 1. Ditemukannya beberapa model clustering yang berbeda 2. Pemilihan jumlah cluster yang paling tepat 3. Kegagalan untuk converge 4. Pendeteksian outliers 5. Bentuk masing-masing cluster 6. Masalah overlapping
Keenam permasalahan ini adalah beberapa hal yang perlu diperhatikan pada saat menggunakan K-Means dalam mengelompokkan data. Permasalahan 1 umumnya disebabkan oleh perbedaan proses inisialisasi anggota masing-masing cluster. Proses initialisasi yang sering digunakan adalah proses inisialisasi secara random. Dalam suatu
studi
perbandingan,
proses
inisialisasi
secara
random
mempunyai
kecenderungan untuk memberikan hasil yang lebih baik dan independent, walaupun dari segi kecepatan untuk converge lebih lambat.
Permasalahan 2 merupakan masalah laten dalam metode K-Means. Beberapa pendekatan telah digunakan dalam menentukan jumlah cluster yang paling tepat untuk suatu dataset yang dianalisa termasuk di antaranya Partition Entropy (PE) dan GAP
Universitas Sumatera Utara
Statistics. Satu hal yang patut diperhatikan mengenai metode-metode ini adalah pendekatan yang digunakan dalam mengembangkan metode-metode tersebut tidak sama dengan pendekatan yang digunakan oleh K-Means dalam mempartisi data item ke masing-masing cluster. Permasalahan kegagalan untuk converge, secara teori memungkinkan untuk terjadi dalam kedua metode K-Means. Kemungkinan ini akan semakin besar terjadi untuk metode Hard K-Means, karena setiap data di dalam dataset dialokasikan secara tegas (hard) untuk menjadi bagian dari suatu cluster tertentu. Perpindahan suatu data ke suatu cluster tertentu dapat mengubah karakteristik model clustering yang dapat menyebabkan data yang telah dipindahkan tersebut lebih sesuai untuk berada di cluster semula sebelum data tersebut dipindahkan dan demikian juga dengan keadaan sebaliknya. Kejadian seperti ini tentu akan mengakibatkan pemodelan tidak akan berhenti dan kegagalan untuk converge akan terjadi. Untuk Fuzzy K-Means walaupun ada, kemungkinan permasalahan ini untuk terjadi sangatlah kecil, karena setiap data diperlengkapi dengan membership function (Fuzzy K-Means) untuk menjadi anggota cluster yang ditemukan.
Permasalahan 4 merupakan permasalahan umum yang terjadi hampir di setiap metode yang melakukan pemodelan terhadap data. Khusus untuk metode K-Means hal ini memang menjadi permasalahan yang cukup menentukan. Beberapa hal yang perlu diperhatikan dalam melakukan pendeteksian outliers dalam proses pengelompokan data termasuk bagaimana menentukan apakah suatu data item merupakan outliers dari suatu cluster tertentu dan apakah data dalam jumlah kecil yang membentuk suatu cluster tersendiri dapat dianggap sebagai outliers. Proses ini memerlukan suatu pendekatan khusus yang berbeda dengan proses pendeteksian outliers di dalam suatu dataset yang hanya terdiri dari satu populasi yang homogen.
Universitas Sumatera Utara
Permasalahan kelima adalah menyangkut bentuk cluster yang ditemukan. Tidak seperti metode data clustering lainnya termasuk Mixture Modelling, K-Means umumnya tidak mengindahkan bentuk dari masing-masing cluster yang mendasari model yang terbentuk, walaupun secara alamiah masing-masing cluster umumnya berbentuk bundar. Untuk dataset yang diperkirakan mempunyai bentuk yang tidak biasa, beberapa pendekatan perlu untuk diterapkan.
Masalah overlapping sebagai permasalahan terakhir sering sekali diabaikan karena umumnya masalah ini sulit terdeteksi. Hal ini terjadi untuk metode Hard K-Means dan Fuzzy K-Means, karena secara teori metode ini tidak diperlengkapi feature untuk mendeteksi apakah di dalam suatu cluster ada cluster lain yang kemungkinan tersembunyi.
K-Means merupakan metode data clustering yang digolongkan sebagai metode pengklasifikasian yang bersifat unsupervised (tanpa arahan). Pengkategorian metodemetode pengklasifikasian data antara supervised dan unsupervised classification didasarkan pada adanya dataset yang data itemnya sudah sejak awal mempunyai label kelas dan dataset yang data itemnya tidak mempunyai label kelas. Untuk data yang sudah mempunyai label kelas, metode pengklasifikasian yang digunakan merupakan metode supervised classification dan untuk data yang belum mempunyai label kelas, metode pengklasifikasian yang digunakan adalah metode unsupervised classification.
Selain masalah optimasi pengelompokan data ke masing-masing cluster, data clustering juga diasosiasikan dengan permasalahan penentuan jumlah cluster yang paling tepat untuk data yang dianalisa. Untuk kedua jenis K-Means, baik Hard KMeans dan Fuzzy K-Means, yang telah dijelaskan di atas, penentuan jumlah cluster untuk dataset yang dianalisa umumnya dilakukan secara supervised atau ditentukan dari awal oleh pengguna, walaupun dalam penerapannya ada beberapa metode yang sering dipasangkan dengan metode K-Means. Karena secara teori metode penentuan jumlah cluster ini tidak sama dengan metode pengelompokan yang dilakukan oleh KMeans, kevalidan jumlah cluster yang dihasilkan umumnya masih dipertanyakan.
Universitas Sumatera Utara
Melihat keadaan dimana pengguna umumnya sering menentukan jumlah cluster sendiri secara terpisah, baik itu dengan menggunakan metode tertentu atau berdasarkan pengalaman, di sini kedua metode K-Means ini dapat disebut sebagai metode semi-supervised classification, karena metode ini mengalokasikan data item ke masing-masing cluster secara unsupervised dan menentukan jumlah cluster yang paling sesuai dengan data yang dianalisa secara supervised.
2.4 K-Means untuk Data yang Mempunyai Bentuk Khusus
Beberapa dataset yang mempunyai bentuk tertentu memerlukan suatu metode pemecahan khusus yang disesuaikan dengan keadaan data tersebut. Gambar 2.2. mengilustrasikan suatu dataset yang mempunyai bentuk khusus yang kalau dimodel dengan metode K-Means, baik Hard K-Means dan Fuzzy K-Means akan memberikan hasil yang tidak mewakili keadaan dataset tersebut. Untuk keperluan seperti itu, beberapa peneliti telah mengusulkan pengembangan metode K-Means yang secara khusus memanfaatkan kernel trik, dimana data space untuk data awal di-mapping ke feature space yang berdimensi tinggi. Beberapa hal yang perlu diperhatikan dalam pengembangan metode K-Means dengan kernel trik ini adalah bahwa data pada feature space tidak lagi dapat didefinisikan secara eksplisit, sehingga penghitungan nilai membership function dan centroid tidak dapat dilakukan secara langsung.
Universitas Sumatera Utara
Beberapa trik penghitungan telah diusulkan dalam menurunkan nilai kedua variabel yang diperlukan tersebut. Dengan penerapan trik perhitungan terhadap kedua variabel tersebut, objective function yang digunakan dalam menilai apakah suatu proses pengelompokan sudah converge atau tidak juga akan berubah.
Sumber: Agusta, 2006 Gambar 2.1 Salah Satu Dataset yang Mempunyai Bentuk Khusus
2.5 Berat Badan Ideal
Berat badan ideal sangat berpengaruh terhadap kondisi kesehatan tubuh manusia. Seseorang yang memiliki berat badan ideal, akan lebih kecil kemungkinannya untuk terserang penyakit dibandingkan dengan orang yang memiliki berat badan yang tidak ideal (Hartono, 2006).
Ada beberapa faktor yang mempengaruhi ideal atau tidaknya berat tubuh seseorang. Adapun faktor-faktor tersebut adalah:
1. Keseimbangan Asupan Nutrisi Manusia membutuhkan nutrisi yang seimbang untuk menjaga kondisi tubuhnya agar tetap fit. Asupan nutrisi ini diperoleh dari makanan dengan kadar yang berbeda-beda untuk setiap orang.
Universitas Sumatera Utara
Kekurangan nutrisi akan menyebabkan kinerja organ-organ tubuh menurun yang mengakibatkan tubuh seseorang rentan terhadap serangan penyakit, karena tubuhnya tidak mampu memproteksi diri dari serangan yang terjadi. Sebaliknya, nutrisi yang berlebihan dalam tubuh menyebabkan berat tubuh naik secara drastis. Hal ini diakibatkan oleh nutrisi yang masuk lebih besar daripada nutrisi yang dibutuhkan, sehingga tubuh tidak dapat menyerap seluruh nutrisi tersebut yang mana sisanya akan menjadi timbunan lemak dalam tubuh. 2. Aktivitas Gerakan Tubuh Tubuh manusia terdiri dari jutaan sel yang selalu aktif setiap hari menyokong sistem organ tubuh manusia. Agar sel-sel ini selalu dalam kondisi yang baik, selsel ini harus sering diaktifkan dengan cara menggerakkan tubuh secara aktif. Salah satu aktivitas yang cocok untuk mengaktifkan gerakan tubuh adalah dengan melakukan olah raga, karena dengan melakukan olah raga, selain mengaktifkan sel-sel di dalam tubuh, timbunan lemak juga akan berkurang, karena dibakar sebagai bahan bakar dari aktivitas olah raga yang dilakukan. 3. Gaya Hidup dan Pola Makan Gaya hidup yang kita terapkan sehari-hari sangat berpengaruh terhadap ideal atau tidaknya berat badan kita. Merokok, minum minuman keras akan membawa efek samping yang serius bagi sel-sel tubuh ynag selanjutnya akan mengakibatkan berat tubuh manusia semakin jauh dari nilai ideal.
Universitas Sumatera Utara
2.5.1
Ukuran Kerangka
Untuk menentukan ukuran kerangka tubuh, dilakukan pengukuran lingkar pergelangan tangan dengan pita meteran serta nilai tinggi badannya. Untuk menghitung nilai ukuran kerangka manusia, dapat dilihat dari ukuran lingkar lengan bawahnya sebagaimana terlihat pada Gambar 2.3. Untuk menghitung nilai ukuran kerangka manusia, dapat dilihat dari ukuran lingkar lengan bawahnya.(Hartono, 2006).
Lingkar Lengan Bawah
Gambar 2.2 Lingkar Lengan Bawah Rumus untuk menghitung ukuran kerangka manusia seperti ditunjukkan pada persamaan berikut : UK =
Dimana : UK
= Ukuran Kerangka
TB
= Nilai Tinggi Badan
LLB
= Ukuran Lingkar Lengan Bawah
TB LLB
…………………………. (7)
Setelah ukuran kerangka diperoleh, untuk menentukan apakah ukuran kerangka manusia tersebut termasuk kategori kecil sedang atau besar ditentukan dengan melihat jenis kelamin dan nilai ukuran kerangkanya berdasarkan aturan yang ditunjukkan pada Tabel 2.1.
Universitas Sumatera Utara
Tabel 2.1 Aturan Kategori Ukuran Kerangka Jenis Kelamin Nilai Ukuran Kerangka Kategori Ukuran Kerangka Laki-Laki
< 9,6
Kerangka Kecil
Laki
9,6 – 10,4
Kerangka Sedang
Laki
>10,4
Kerangka Besar
Perempuan
<10,1
Kerangka Kecil
Perempuan
10,1 – 11,0
Kerangka Sedang
Perempuan
>11,0
Kerangka Besar
Sumber: Terapi Gizi & Diet Rumah Sakit, Hartono, 2006.
2.5.2
BMI (Body Mass Index)
BMI (Body Mass Index) merupakan suatu pengukuran yang membandingkan berat badan dengan tinggi badan. BMI merupakan teknik untuk menghitung index berat badan, sehingga dapat diketahui kategori tubuh kita apakah tergolong kurus, normal atau gemuk. BMI dapat digunakan untuk mengontrol berat badan sehingga dapat mencapai berat badan normal yang sesuai dengan tinggi badan (Judic, 2009). Dalam menghitung BMI diperlukan dua parameter, yaitu berat badan (kg) dan tinggi badan (cm). BMI dapat dihitung dengan menggunakan persamaan berikut : BMI =
Dimana : BMI
= Nilai body mass index
BB
= Berat badan dalam kilogram
TB
= Tinggi Badan dalam centimeter.
BB TB 2
……………………… (8)
Untuk mengukur apakah berat badan seseorang ideal atau tidak, dapat dilakukan dengan
melihat
nilai BMI
(Body
Mass Index)
tubuhnya
dan
membandingkan nilainya dengan aturan yang ditunjukkan pada Tabel 2.2.
Universitas Sumatera Utara
Tabel 2.2 Aturan Perhitungan Berat Badan Ideal Nilai BMI
Keterangan
<18,5
Berat Kurang
18,5 – 22,9
Berat Normal
23 – 24,9
Obesitas Ringan
25 – 29,9
Obesitas Sedang
>= 30
Obesitas Berat
Sumber: Terapi Gizi & Diet Rumah Sakit, Hartono, 2006.
Batas ambang BMI ditentukan dengan merujuk ketentuan FAO/WHO, yang membedakan batas ambang untuk laki-laki dan perempuan. Disebutkan bahwa batas ambang normal untuk laki-laki adalah 20,1 – 25,0 dan perempuan adalah 18,7 – 23,8.
Untuk kepentingan monitoring dan tingkat defesiensi kalori ataupun tingkat kegemukan, lebih lanjut FAO/WHO menyarankan menggunakan satu batas ambang antara laki-laki dan perempuan. Ketentuan yang digunakan adalah menggunakan ambang batas laki-laki untuk kategori kurus tingkat berat danmenggunakan ambang batas pada perempuan untuk kategori gemuk tingkat berat. Untuk kepentingan Indonesia, batas ambang dimodifikasi lagi berdasarkan pengalaman klinis dan hasil penelitian dibeberapa negara berkembang.
2.5.3
BMR (Basal Metabolic Rate)
BMR (Basal Metabolic Rate) adalah kebutuhan kalori minimum yang diperlukan untuk mempertahankan hidupsi individu dalam keadaan istirahat. Hal ini dapat dilihat sebagai jumlah energi (diukur dalam kalori) dikeluarkan oleh tubuh dalam keadaan statis tanpa aktifitas. BMR bertanggung jawab atas pembakaran hingga 70% dari total yang kalori yang dikeluarkan, namun angka ini bervariasi berdasarkan faktor-faktor berikut ini : •
Genetika Beberapa orang dilahirkan dengan metabolime yang berbeda-beda.
•
Gender
Universitas Sumatera Utara
Pria yang notabennya memiliki massa otot yang lebih besar dan presentase lemak tubuh yang rendah berarti mereka memiliki BMR yang lebih rendah dibanding wanita. •
Usia Semakin bertambah usia seseorang maka semakin rendah nilai BMR yang mereka butuhkan. Turun setelah berusia diatas 20 tahun. Turun sekitar 2% selama kurun waktu 10 tahun.
•
BMI BMI seseorang juga menjadi faktor besar dari kebutuhan BMR seseorang. Semakin gemuk seseorang, maka tinggi pula BMR orang tersebut.
•
Aktifitas & Olahraga Aktifitas atau latihan fisik seseorang tidak hanya mempengaruhi berat badan dan pembakaran kalori saja, tapi juga berpengaruh kepada nilai BMR seorang pasien.
Rumus BMR sendiri menggunakan variabel usia, tinggi badan, berat badan dan jenis kelamin. Rumus ini lebih akurat daripada menghitung kebutuhan kalori berdasarkan berat badan saja. BMR pasien dapat dihitung melalui rumus berikut ini, dan dibedakan berdasarkan jenis kelamin:
BMR (wanita) = 655 + (9,6 x BB) + (1,8 x TB - (4,7 x U) BMR (pria) = 66 + (13,7 x BB) + (5 x TB - (6,8 x U)…………..(9)
Dimana : BB = Berat badan dalam kilogram TB = Tinggi Badan dalam centimeter U = Usia dalam tahun
Universitas Sumatera Utara
Setelah kita mendapatkan hasil BMR pasien, kita harus menghitung kebutuhan kalori harian dengan menggunakan Persamaan Harris Benedict, sebagai berikut : Kelompok 1 : Tidak berolah raga Kebutuhan Kalori Harian
= BMR x 1.2
Kelompok 2 : Berolah raga ringan (1-3 kali seminggu) Kebutuhan Kalori Harian
= BMR x 1.375
Kelompok 3 : Berolah raga sedang (3-5 kali seminggu) Kebutuhan Kalori Harian
= BMR x 1.55
Kelompok 4 : Berolah raga berat (6-7 kali seminggu) Kebutuhan Kalori Harian
= BMR x 1.725
Kelompok 5 : Berolah raga berat dan sangat aktif Kebutuhan Kalori Harian
2.5.4
= BMR x 1.9…………………(10)
Manfaat Mengetahui BMI& BMR
Dengan mengetahui nilai BMI seseorang maka dapat diketahui apakah termasuk kategori kurang berat badan, normal atau kelebihan berat atau obesitas (kegemukan). Resiko penyakit yang berhubungan dengan derajat kegemukan seperti penyakit jantung, kencing manis bahkan stroke dapat dilihat dari nilai BMI yang dihasilkan. Nilai BMI dipengaruhi oleh usia namun sama pada kedua jenis kelamin. Nilai BMI dapat tidak sesuai pada derajat kegemukan dari populasi yang berbeda, dalam hubungannya dengan perbedaan proporsi tubuh. Sebagai contoh, ada orang Amerika dan orang Asia yang memiliki nilai BMI yang sama. Namun dilihat dari kenyataan, orang Asia tersebut memiliki proporsi massa lemak yang lebih banyak dari pada massa otot dibandingkan dengan orang Amerika.
Berdasarkan penelitian di bidang kesehatan, dengan mengetahui dan mengontrol nilai BMI, seseorang dapat mengurangi resiko penyakit 35 – 55 % dibandingkan orang yang tidak mengetahui berapa nilai BMI untuk standar ideal tubuhnya. Jadi dengan mengetahui cara menghitung BMI, seseorang dapat mengontrol diet makanannya sehari-hari berdasarkan kandungan gizi yang dibutuhkan tubuh setiap hari (Hartono, 2006).
Universitas Sumatera Utara
Sedangkan dengan mengetahui nilai BMR seseorang yang artinya kita dapat mengetahui jumlah kalori yang dibutuhkan untuk menjaga berat badan ideal. Kita dapat dengan mudah menghitung jumlah kalori yang kita butuhkan untuk menurunkan dan menaikkan berat badan sesuai dengan kondisi ideal yang kita inginkan.
2.6 Penelitian Terkait
Penelitian oleh Tedy Rismawan dan Sri Kusumadewi yang berjudul Aplikasi K-Means untuk Pengelompokkan Mahasiswa Berdasarkan Nilai Body Mass Index (BMI) dan Ukuran Kerangka dilakukan proses pengelompokkan 20 data sampel menjadi 3 kelompok berdasarkan nilai BMI dan ukuran kerangka. Ketiga kelompok tersebut adalah BMI normal dan kerangka besar, BMI obesitas sedang dan kerangka sedang, BMI obesitas berat dan kerangka kecil. Pengelompokkan tersebut berdasarkan status gizi dan ukuran kerangka dengan memasukkan parameter kondisi fisik dari orang tersebut. Algoritma k-means dimulai dengan menetapkan nilai-nilai pusat dari cluster atau biasa disebut dengan centroid atau meanssecara acak. Selanjutnya dihitung jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus Euclidian hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Setelah itu, setiap data diklasifikasikan berdasarkan kedekatannya dengan centroid. Proses perhitungan jarak setiap data terhadap masing-masing centroid dilakukan terus hingga nilai centroid tidak mengalami perubahan (Rismawan, 2008).
Penelitian lainnya oleh Dadan Saepulloh yang berjudul Analisis Data Mining K-Means
Cluster
Analysis
untuk
Data
Berjenis
Biner
dilakukan
proses
pengelompokkan rumah tangga sasaran (RTS) bantuan langsung tunai (BLT). Penelitian
ini
menggabungkan
algoritma
K-Means
Clusteringdenganmetode
perhitungan tingkat similaritas seperti Jaccard similarity, Anderberg similarity, Czekanowsky similarity, dan Kulczynski similarity. Algoritma K-Means Cluster Analysis mempergunakan metode perhitungan jarak untuk mengukur tingkat kedekatan antara data dengan titik tengah dengan Euclidean distance. Untuk data yang berjenis biner, metode perhitungan jarak ini menjadi tidak tepat diterapkan secara langsung sehingga perlu dilakukan perubahan yaitu dengan cara mempergunakan metode perhitungan similaritas (Saepulloh, 2010).
Universitas Sumatera Utara