SEKOLAH TINGGI TEKNOLOGI TERPADU NURUL FIKRI
BIG DATA
RIZKY YUDO ATMAJA 0110212003
Apa itu Big Data? Jika diterjemahkan secara mentah-mentah, Big Data berarti suatu data dengan kapasitas yang besar. Sebagai contoh, saat ini kapasitas DWH (Data Warehouse) yang digunakan oleh perusahaan-perusahaan di Jepang berkisar dalam skala terabyte. Namun, jika misalnya dalam suatu sistem terdapat 1000 terabyte (1 petabyte) data, apakah sistem tersebut bisa disebut Big Data?
Satu lagi, Big Data sering dikaitkan dengan SNS (Social Network Service), contohnya Facebook. Memang benar Facebook memiliki lebih dari 800 juta orang anggota, dan dikatakan bahwa dalam satu hari Facebook memproses sekitar 10 terabyte data. Pada umumnya, SNS seperti Facebook tidak menggunakan RDBMS (Relational Database Management System) sebagai software pengolah data, melainkan lebih banyak menggunakan NoSQL.
Dengan mengkombinasikan kedua uraian di atas, dapat ditarik sebuah definisi bahwa Big Data adalah "suatu sistem yang menggunakan NoSQL dalam memproses atau mengolah data yang berukuran sangat besar, misalnya dalam skala petabyte". Boleh dikatakan definisi tersebut masih setengah benar karena masih belum menggambarkan Big Data secara menyeluruh.
Memang benar, NoSQL dikenal memiliki potensi dan kapabilitas Scale Up (peningkatan kemampuan mengolah data dengan menambah jumlah server atau storage) yang lebih unggul daripada RDBMS. Tetapi, bukan berarti RDBMS tak diperlukan. NoSQL memang lebih tepat untuk mengolah data yang sifatnya tak berstruktur seperti data teks dan gambar, namun NoSQL kurang tepat bila digunakan untuk mengolah data yang sifatnya berstruktur seperti data-data numerik, juga kurang sesuai untuk memproses data secara lebih detail demi menghasilkan akurasi yang tinggi. Pada kenyataannya, Facebook juga tak hanya menggunakan NoSQL untuk memproses data-datanya, Facebook juga tetap menggunakan RDBMS. Lain kata, penggunaan RDBMS dan NoSQL mesti disesuaikan dengan jenis data yang hendak diproses dan proses macam apa yang dibutuhkan guna mendapat hasil yang optimal.
Ada yang mendeskripsikan Big Data sebagai fenomena yang lahir dari meluasnya penggunaan internet dan kemajuan teknologi informasi yang diikuti dengan terjadinya pertumbuhan data yang luar biasa cepat, yang dikenal dengan istilah ledakan informasi (Information Explosion) maupun banjir data (Data Deluge). Hal ini mengakibatkan terbentuknya aliran data yang super besar dan terus-menerus sehingga sangat sulit untuk dikelola, diproses, maupun dianalisa dengan menggunakan teknologi pengolahan data yang selama ini digunakan (RDBMS). Definisi ini dipertegas lagi dengan menyebutkan bahwa Big Data memiliki tiga karakteristik yang dikenal dengan istilah 3V: Volume, Variety, Velocity. Dalam hal ini, Volume menggambarkan ukuran yang super besar, Variety menggambarkan jenis yang sangat beragam, dan Velocity menggambarkan laju pertumbuhan maupun perubahannya.
Bagaimana perkembangan Big Data? Istilah Big Data mulai muncul setelah Tahun 2005 diperkenalkan oleh O’Relly Media. Faktanya data sudah dimanfaatkan sejak 7000 tahun yang lalu ketika akuntansi diperkenalkan di Mesopotamia untuk mencatat pertumbuhan hasil panen dan ternak. Prinsip akuntansi terus berkembang dan Tahun 1663 John Graunt mencatat dan meneliti semua informasi tentang angka kematian di London. Dia ingin memperoleh pemahaman dan membangun sistem peringatan tentang wabah penyakit. Pada catatan analisis data statistik pertama tercatat bahwa Graunt mengumpulkan temuannya dalam buku Natural and Politics Observations Made dan Bills of Mortality, yang menyampaikan tentang penyebab kematian pada abad ke-17. emenjak itu, prinsip-prinsip akuntansi berkembang tetapi tidak terjadi sesuatu yang luar biasa sampai abad ke-20 era informasi dimulai. Modern data dimulai tahun 1887 ketika Herman Hollerith
menemukan mesin komputasi yang dapat membaca holes punched paper dengan tujuan untuk mengorganisir data sensus. Projek pertama berkenaan data dibuat pada tahun 1937 dibawah kepemimpinan Franklin D Roosevelt. Mesin data processing pertama kali muncul pada tahun 1943 dan dikembangkan oleh Inggris untuk menafsirkan kode yang digunakan oleh Nazi selama Perang Dunia II. Alat tersebut digunakan untuk menyadap pesan dengan kecepatan 5.000 karakter per detik. Sehingga mereduksi pekerjaan yang sebelumnya diselesaikan selama berminggu-minggu menjadi hanya dalam hitungan jam.
Pada tahun 1952 dibentuklah NSA (National Security Agency) dan dalam waktu sepuluh tahun telah merekrut lebih dari 12.000 cryptologist. Mereka bekerja dengan informasi yang sangat banyak selama perang dingin dan mulai mengumpulkan dan memproses data-data intelijen. Pada tahun 1965 pemerintah Amerika Serikat memutuskan untuk membangun pusat data untuk menyimpan lebih dari 742 juta data pajak penghasilan dan 175 juta sekumpulan sidik jari. Pada tahun 1989 ahli komputer dari Inggris, Tim Berners-Lee menemukan World Wide Web. Ia berkeinginan untuk memfasilitasi pertukaran informasi melalui sistem hypertext. Ia mengetahui dampak dari penemuannya. Seperti pada tahun 90-an pembuatan data memicu lebih banyak lagi device terhubung ke internet. Pada tahun 1995 supercomputer pertama dibuat. Alat tersebut mampu mengerjakan tugas dalam jumlah banyak dalam waktu singkat. Pada tahun 2005 Roger Mougalas dari O’Reilly Media menciptakan istilah Big Data untuk pertama kalinya, hanya setahun setelah mereka membuat istilah Web 2.0. Itu mengacu pada serangkaian data besar yang hampir tidak mungkin untuk mengelola dan memproses dengan menggunakan tools business intelligence tradisional.
Apa manfaat yang diberikan? Manfaat pertama dari pemanfaatan big data adalah perusahaan memiliki kesempatan untuk mengambil keputusan bisnis yang didasarkan atas data yang ilmiah dan terukur, bukan berdasarkan common sense, intuisi, atau kebijaksanaan yang bersifat praktis.
Selama bertahun-tahun, HR telah menggunakan data tidak terstruktur dari jawaban karyawan dalam survey engagement, performance review, dll. Di era big data ini, data tak terstruktur tersebut datang dari sumber dalam dan luar organisasi, termasuk dari social media, blog, wiki, email, dan lain-lain. Semua sumber ini akan memberikan semakin banyak insight terhadap keterlibatan karyawan terhadap perusahaan.
Menurut Ranjan Dutta, direktur pengukuran dan predictive analytics pada PwC Saratoga, teknik analisa otomatis terhadap data tak terstruktur sebagian besar masih dalam tahap awal pengembangannya. Tetapi kemampuan tools-tools seperti ini akan berkembang cepat dalam 5 tahun ke depan. Menurutnya, perusahaan seperti SAP, Oracle, dan Workday saat ini terus mengembangkan perangkat lunak yang terus memudahkan analisa big data.
Facebook dan situs jejaring sosial lain juga menjanjikan. FedEx misalnya, melakukan studi korelasi antara data karyawan dengan data kepuasan konsumen. Mereka mencari tahu bagaimana perbandingan apa yang dikatakan karyawan tentang FedEx dalam situs jejaring sosial dan situs web karir dengan apa yang dikatakan karyawan dalam survey engagement. “Karyawan adalah duta brand, dan social media adalah seperti mikrofon besar yang menyuarakan tentang perusahaan Anda,” ujar Bennett. “Kepuasan karyawan hari ini akan keluar melampaui tempat kerja dan memasuki ranah social. Apabila ada karyawan tidak puas dan menampilkannya di social media, maka kita punya masalah.”
Simpul ketiganya Big Data bukanlah semata-mata hanya soal ukuran. Big data adalah data berukuran raksasa yang volumenya terus bertambah, terdiri dari berbagai jenis atau variasi data, terbentuk secara terus menerus dengan kecepatan tertentu dan harus diproses dengan kecepatan tertentu pula. Momen awal ketenaran istilah ‘big data’ adalah kesuksesan Google dalam memberdayakan ‘big data’ dengan menggunakan teknologi canggihnya yang disebut Bigtable beserta teknologiteknologi pendukungnya.
Referensi: http://michsamuel.blogspot.co.id/2014/03/v-behaviorurldefaultvmlo_14.html http://en.wikipedia.org/wiki/Big_data http://komangaryasa.com/2014/12/sejarah-singkat-big-data/