BAB IV
PENGUJIAN DAN ANALISIS
Pada bab ini akan dijelaskan tentang pengujian dari masing – masing metode computing dan juga analisa dari hasil pengujian tersebut. Pengujian dilakukan pada waktu proses dengan menjalankan aplikasi yang menerapkan algoritma sorting, perkalian matriks, inverse matrix dengan gauss jordan, BFS, dan Binary Search secara bersama-sama pada setiap metode computing, dan kemudian akan di ambil analisa. 4.1. Pengujian pada CPU Computing Pengujian untuk CPU computing dilakukan dengan menjalankan beberapa aplikasi yang telah dirancang secara bersamaan, kemudian hasil waktu akan dibandingkan. 4.1.1. Pengujian dengan Integer A. Aplikasi yang diuji Aplikasi sorting , perkalian matriks, binary search , dan eliminasi gauss jordan dengan menggunakan input bilangan integer. B. Langkah Pengujian 1. Input jumlah data pada masing-masing aplikasi. 2. Eksekusi keempat aplikasi secara bersamaan. 3. Setelah selesai catat waktu yang dibutuhkan masing-masing aplikasi. C. Hasil dan Analisa
29
Tabel 4.1. Pengujian Multitasking CPU dengan input Data Integer Sorting
Gauss J
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran (Variabel) 1.000 2.000 3.000 4.000 5.000
Binary Search
Waktu (ms) 903 4.721 11.134 20.783 32.792 Waktu (ms)
Matriks
12.484 250.124 333.325 467.822 1.167.870
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran 1.000 2.000 3.000 4.000 5.000
Gambar 4.1 Hasil Sorting dengan Sampel 100 Data.
30
Waktu(ms) 0,173 0,181 0,190 0,228 0,236 Waktu(ms) 27.243 98.827 1.066.902 1.180.062 2.611.740
Gambar 4.2 Hasil Perkalian Matriks dengan sampel Matriks 10 x 10.
Gambar 4.3 Hasil dari Eliminasi Gauss Jordan dengan Sampel Matriks 10 x 10 .
31
Gambar 4.4 Hasil Binary Search dengan 30 Sampel Data. Pemrosesan CPU dengan mengimplementasikan algoritma search dan sorting, dapat menghasilkan waktu pemrosesan 0,903 detik sampai 32,792 detik untuk sorting dan 0,000173 detik sampai 0,000236 detik untuk search dengan input data 1.000.000 sampai 9.000.000 , namun waktu pemrosesan meningkat dengan melakukan perhitungan matriks dan juga eliminasi linier gauss jordan. Jumlah dari array dan proses read and write pada masing – masing array yang digunakan, membuat pemrosesan pada sorting dan search membutuhkan waktu yang lebih sedikit dari perhitungan eliminasi linier dan perkalian matriks. CPU membutuhkan waktu sampai 2.600,740 detik untuk mengolah masukan data untuk algoritma perkalian matriks dan 1.167,870 detik untuk eliminasi linier dengan input data matriks 5000 x 5000. Meskipun CPU yang digunakan sudah memiliki 4 thread dan juga memiliki clock speed yang cukup besar, susunan sekuensial algoritma dari program yang diterapkan pada CPU, waktu pemrosesan dari perhitungan algoritma matriks tidak secepat searching dan sorting.
32
4.1.2. Pengujian Dengan Floating Point A. Aplikasi yang Diuji Aplikasi sorting , perkalian matriks, binary search , dan eliminasi gauss jordan dengan menggunakan input bilangan floating point. B. Langkah Pengujian 1. Input jumlah data pada masing-masing aplikasi. 2. Eksekusi keempat aplikasi secara bersamaan. 3. Setelah selesai catat waktu yang dibutuhkan masing-masing aplikasi. C. Hasil dan Analisa Tabel 4.2. Pengujian Multitasking CPU dengan Input Data Floating Point Sorting
Gauss J
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran (Variabel) 1.000 2.000 3.000 4.000 5.000
Binary Search
Waktu (ms) 295 2.892 5849 9.921 15.040 Waktu (ms)
Matriks
4.683 93.014 339.697 754.039 787.667
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran 1.000 2.000 3.000 4.000 5.000
Waktu(ms) 0,128 0,215 0,285 0,201 0,224 Waktu(ms) 17.506 290.700 848.876 2.090.270 3.183.011
Gambar 4.5 Sorting dengan input Floating Point dan 100 Sampel Data .
33
Gambar 4.6 Binary Search dengan input 100 sampel data Floating Point.
Gambar 4.7 Perkalian matriks dengan sampel Matriks 10x10.
Gambar 4.8 Metode Eliminasi Gauss Jordan dengan sampel 2 variabel. 34
Pemrosesan algoritma searching dan sorting dengan ukuran data 9.000.000 data, CPU membutuhkan waktu 15,040 detik untuk sorting dan 0,000224 detik untuk searching, karena CPU keluaran terbaru sudah dilengkapi dengan Floating Point Unit (FPU) yang ditanamkan oleh pabrikan di chipset. Namun FPU pada CPU belum bisa memberikan waktu proses seperti pada saat implementasi sorting dan searching. Pada saat memproses data input yang berupa floating point pada implementasi algoritma perkalian matriks membutuhkan waktu pemrosesan 3.183,011 detik dan metode eliminasi gauss jordan membutuhkan waktu 787,667 detik dengan menggunakan input data matriks yang berukuran 5000 x 5000. 4.2.
Pengujian dengan GPU Computing Pengujian pada GPU computing dengan menggunakan beberapa aplikasi yang juga
digunakan pada CPU computing , yang nantinya akan di eksekusi secara bersamaan, dan hasilnya akan dibandingkan dengan metode lainnnya. 4.2.1. Pengujian dengan Integer A. Aplikasi yang Diuji Aplikasi sorting , perkalian matriks, binary search , dan eliminasi gauss jordan dengan menggunakan input bilangan floating point. B. Langkah Pengujian 1. Input jumlah data pada masing-masing aplikasi. 2. Eksekusi keempat aplikasi secara bersamaan. 3. Setelah selesai catat waktu yang dibutuhkan masing-masing aplikasi. C. Hasil dan Analisa
35
Tabel 4.3. Pengujian Multitasking GPU dengan input Data Integer Sorting
Gauss J
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran (Variabel) 1.000 2.000 3.000 4.000 5.000
Binary Search
Waktu (ms) 0,002464 0,002464 0,002464 0,002464 0,002528 Waktu (ms)
Matriks
0,002496 0,002496 0,002432 0,002624 0,002624
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran 1.000 2.000 3.000 4.000 5.000
Waktu(ms) 0,065376 0,076544 0,078528 0,085376 0,084224 Waktu(ms) 0,002464 0,002624 0,002464 0,002464 0,002464
Berbeda dengan menggunakan CPU yang membutuhkan waktu proses lebih dari 50 menit pada saat pemrosesan perkalian matriks dengan ukuran data matriks yang sama yaitu 5000 x 5000, data yang di proses oleh GPU membutuhkan waktu proses 0,002464 milidetik. Karena GPU memiliki memori utama tersendiri untuk menopang kinerja dan jumlah core processor CUDA yang digunakan mempunyai 144 inti, dibandingkan dengan core processor CPU yang digunakan berjumlah 2 inti 4.2.2. Pengujian dengan Floating Point A. Aplikasi yang Diuji Aplikasi sorting , perkalian matriks, binary search , dan eliminasi gauss jordan dengan menggunakan input bilangan floating point. B. Langkah Pengujian 1. Input jumlah data pada masing-masing aplikasi. 2. Eksekusi keempat aplikasi secara bersamaan. 3. Setelah selesai catat waktu yang dibutuhkan masing-masing aplikasi. C. Hasil dan Analisa
36
Tabel 4.4. Pengujian Multitasking GPU dengan input Data Floating Point Sorting
Gauss J
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran (Variabel) 1.000 2.000 3.000 4.000 5.000
Binary Search
Waktu (ms) 0,002464 0,002464 0,002464 0,002464 0,002528 Waktu (ms)
Matriks
0,002496 0,002496 0,002432 0,002624 0,002510
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran 1.000 2.000 3.000 4.000 5.000
Waktu(ms) 0,075376 0,076544 0,078528 0,085376 0,088321 Waktu(ms) 0,002464 0,002624 0,002464 0,002464 0,002464
Pada saat input dengan menggunakan data bertipe float, waktu yang dibutuhkan dalam pemrosesan tidak berbeda jauh dengan input data integer yang sebelumnya telah diuji. Dengan matriks 5000 x 5000 data integer membutuhkan waktu 0,002464 milidetik dan dengan input jumlah data yang sama tetapi bertipe float waktu prosesnya 0,088321 milidetik. Berbeda dengan pemrosesan menggunakan CPU yang sudah memiliki FPU, waktu pemrosesan pada perhitungan matriks 5000 x 5000 membutuhkan waktu 3.183,011 detik. GPU CUDA didesain untuk render grafis yang memiliki data – data floating point dan di desain menggunakan arsitektur yang berbeda untuk pengolahan data,
maka
pemrosesan dengan input data float tidak akan membebani dari kinerja GPU. 4.3.
Pengujian dengan MPI Pengujian dengan MPI, menggunakan aplikasi MPICH2 dan menggunakan lib,
include dan bin dari MPICH2 untuk eksekusi aplikasi yang sudah terintegrasi dengan MPI. Menggunakan 2 PC yang tersambung dengan LAN. 4.3.1. Pengujian dengan Integer A. Aplikasi yang Diuji Aplikasi sorting , perkalian matriks, binary search , dan eliminasi gauss jordan dengan menggunakan input bilangan Integer. 37
B. Langkah Pengujian 1. Input jumlah data pada masing-masing aplikasi. 2. Eksekusi keempat aplikasi secara bersamaan. 3. Setelah selesai catat waktu yang dibutuhkan masing-masing aplikasi. C. Hasil dan Analisa Tabel 4.5. Pengujian Multitasking cluster CPU dengan input data Integer Sorting
Gauss J
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran (Variabel) 1.000 2.000 3.000 4.000 5.000
Binary Search
Waktu (ms) 600 2.614 5.657 11.604 20.743 Waktu (ms)
Matriks
3.493 16.974 50.827 112.843 212.680
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran 1.000 2.000 3.000 4.000 5.000
Waktu(ms) 2.353 3.537 4.992 9.060 13.154 Waktu(ms) 12.729 107.041 375.454 997.356 1.995.244
Pengujian dengan menggunakan MPI didapatkan waktu yang lebih cepat dari menggunakan satu CPU, pada sorting menggunakan input 9.000.000 data, single CPU membutuhkan waktu 32,792 detik dan dengan cluster computing membutuhkan waktu proses 20,743 detik. Namun ada yang berbeda dengan Binary Search , dikarenakan struktur data dari binary search. Apabila data di distribusikan ,akan membutuhkan waktu pada saat data transfer dan waktu koneksi antara dua komputer. Pada implementasi perkalian matriks 5000 x 5000, cluster computing dapat menangani proses yang diberikan lebih cepat dari komputasi dengan single CPU, karena menggunakan 2 processor yang memiliki kecepan dan virtual multithread yang tidak begitu berbeda jauh dan dibantu dengan library dari MPI yang membantu membagi dan mendistribusikan data. Implementasi matriks dengan input ukuran data matriks 5000 x 5000 memiliki waktu proses 1.995,244 detik, sedangkan pada single CPU memakan waktu lebih lama 2.611,740 detik.
38
4.3.2. Pengujian dengan Floating Point A. Aplikasi yang Diuji Aplikasi sorting , perkalian matriks, binary search , dan eliminasi gauss jordan dengan menggunakan input bilangan Integer. B. Langkah Pengujian 1. Input jumlah data pada masing-masing aplikasi. 2. Eksekusi keempat aplikasi secara bersamaan. 3. Setelah selesai catat waktu yang dibutuhkan masing-masing aplikasi. C. Hasil dan Analisa Tabel 4.6. Pengujian Multitasking cluster CPU dengan input data Floating Point Sorting
Gauss J
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran (Variabel) 1.000 2.000 3.000 4.000 5.000
Binary Search
Waktu (ms) 1.237 2.211 5.605 7.892 19.050 Waktu (ms)
Matriks
76.356 611.953 2.033.694, 4.856.766 9.475.768
Jumlah data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000 Ukuran 1.000 2.000 3.000 4.000 5.000
Waktu(ms) 2.530 5.788 11.689 15.170 17.234 Waktu(ms) 13.093 105.003 395.775 1.010.834 2.065.384
Pengujian dengan menggunakan input floating point menunjukan bahwa proses yang berjalan membutuhkan waktu yang lebih lama dari input menggunakan integer pada saat memproses perkalian matriks 5000 x 5000, dengan input bilangan integer membutuhkan waktu 1.995,244 detik sedangkan dengan input bilangan floating point membutuhkan waktu 2.065,384 detik. Ada sebuah metode perhitungan yang membutuhkan waktu yang lebih lama dari perhitungan lainnya, hal ini disebabkan transfer data antara masing – masing komputer yang membutuhkan waktu dalam penyalinan memory dan pengolahan data pada CPU yang mengolah data berpusat pada masing – masing core per detiknya dan tidak efisien dalam pengolahan data kompleks yang banyak secara bersamaan.
39
4.4. Perbandingan Hasil Pengujian dengan Teori Kompleksitas Waktu Setiap algoritma yang digunakan dalam pengujian memiliki kompleksitas, pada perkalian matriks dan eliminasi linier kompleksitas waktu yang dimiliki adalah O(N3), pada sorting memiliki kompleksitas waktu O(N log N) dan binary search memiliki kompleksitas waktu O(log N). Perhitungan waktu kompleksitas perkalian matriks dan eliminasi linier pada input data 1000 x 1000 membutuhkan waktu pemrossan waktu 13.093 ms, apabila diterapkan pada penggunaan O(N3), pada input 2000 x 2000 akan menghasilkan waktu 104.744 ms , dan waktu pada pengujian menggunakan CPU 105.003 ms untuk perkalian matriks dan untuk eliminasi linier pada input data 1000 x 1000 membutuhkan waktu pemrosesan 76.356 ms, saat diterapkan dengan kompleksitas O(N3), maka akan menghasilkan waktu 610.848 ms. Selisih waktu dikarenakan beberapa faktor, seperti kecepatan CPU, kapasitas RAM, dan Jumlah core dari CPU. GPU yang memiliki arsitektur berbeda dengan CPU, mengeksekusi data dengan paralel ke semua core yang dimiliki GPU. Waktu yang dibutuhkan tidak seperti CPU yang berjalan secara sekuensial. Dengan performa memory copy host to device 6000 MiB/s, device to host sebesar 6000 MiB/s, dan device to device sebesar 12.000 GiB/s, serta GPU core performance untuk integer 84.000 Giop/s, single-precision float 168.608 Gflop/s, dan double-precision float 21.000 Gflop/s maka waktu pemrosesan mampu diselesaikan dalam kurang dari 1 detik. Pemrosesan algoritma oleh GPU memiliki kompleksitas waktu yang sama dengan pemrosesan pada CPU. Karena pemrosesan pada GPU berjalan secara paralel, GPU membagi keseluruhan waktu proses sejumlah proses paralel. Dengan hasil waktu pemrosesan paralel dan sekuensial yang berbeda, bisa dicari speed-up dari masing – masing algoritma dengan menggunakan rumus S = T old / T new. Hasil speed-up yang akan di hitung berdasarkan dari waktu proses dari CPU dan GPU. Pada Matriks dengan input 1000 x 1000 hasil dari speed-up adalah S = 27.243 / 0,002464 = 11.056.412 kali. Semakin bertambah jumlah datanya, maka nilai dari speed-up akan bertambah tinggi.
40
4.5. Tabel Perbandingan Hasil Pengujian CPU Computing, GPU Computing, dan Cluster Computing 4.5.1. Sorting Jumlah Data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000
CPU Computing (waktu) (ms) integer float
903 4.721 11.134 20.783 32.792
295 2.892 5849 9.921 15.040
GPU Computing (waktu) (ms) integer float
0,002464 0,002464 0,002464 0,002464 0,002528
0,002464 0,002464 0,002464 0,002464 0,002528
Cluster Computing (waktu) (ms) integer float
600 2.614 5.657 11.604 20.743
1.237 2.211 5.605 7.892 19.050
4.5.2. Binary Search Jumlah Data 1.000.000 3.000.000 5.000.000 7.000.000 9.000.000
CPU Computing (waktu) (ms) integer float
0,173 0,181 0,190 0,228 0,236
0,128 0,215 0,285 0,201 0,224
GPU Computing (waktu) (ms) integer float
0,065376 0,076544 0,078528 0,085376 0,084224
0,075376 0,076544 0,078528 0,085376 0,088321
Cluster Computing (waktu) (ms) integer float
2.353 3.537 4.992 9.060 13.154
2.530 5.788 11.689 15.170 17.234
4.5.3. Perkalian Matriks Jumlah Data 1.000 2.000 3.000 4.000 5.000
CPU Computing (waktu) (ms) integer float
27.243 98.827 1.066.902 1.180.062 2.611.740
17.506 290.700 848.876 2.090.270 3.183.011
GPU Computing (waktu) (ms) integer float
0,002464 0,002624 0,002464 0,002464 0,002464
0,002464 0,002624 0,002464 0,002464 0,002464
Cluster Computing (waktu) (ms) integer float
12.729 107.041 375.454 997.356 1.995.244
13.093 105.003 395.775 1.010.834 2.065.384
4.5.4. Eliminasi Linier Gauss Jordan Jumlah Data 1.000 2.000 3.000 4.000 5.000
CPU Computing (waktu) (ms) integer float
12.484 250.124 333.325 467.822 1.167.870
4.683 93.014 339.697 754.039 787.667
GPU Computing (waktu) (ms) integer float
0,002496 0,002496 0,002432 0,002624 0,002624 41
0,002496 0,002496 0,002432 0,002624 0,002510
Cluster Computing (waktu) (ms) integer float
3.493 16.974 50.827 112.843 212.680
76.356 611.953 2.033.694, 4.856.766 9.475.768