ANALISIS BIG DATA - RPKPS
RENCANA PROGRAM DAN KEGIATAN PEMBELAJARAN SEMESTER (RPKPS) MATA KULIAH
:
Analisis Big Data
SEMESTER
:
7
KODE MATA KULIAH
:
TIF-151456
SKS
:
3 (Teori)
Dosen
:
Imam Cholissodin, M.Kom.
Deskripsi Singkat Mata kuliah Analisis Big Data mencakup konsep analisis Big Data, termasuk Volume, Velocity, dan Variety (3V), kemudian terdapat analisis prediktif, tanpa adanya kendala dari besarnya data yang diolah. Adanya kemajuan teknologi dalam hal penyimpanan, pengolahan, dan analisis Big Data meliputi (a) penurunan secara cepat terhadap biaya penyimpanan data dalam beberapa tahun terakhir; (b) fleksibilitas dan efektivitas biaya pada pusat data dan komputasi awan untuk perhitungan elastisitas dan penyimpanan; dan (c) pengembangan kerangka kerja baru seperti Hadoop Ecosystem, yang memungkinkan pengguna untuk mengambil manfaat dari sistem komputasi terdistribusi menyimpan sejumlah data yang besar melalui pemrosesan paralel. Sehingga kemajuan teknologi ini telah menciptakan beberapa perbedaan antara analisis tradisional dengan analisis tingkat lanjut pada Big Data.
Tujuan Instruksional Perkuliahan Setelah mengikuti mata-kuliah ini mahasiswa dapat: 1. Mempelajari dan memahami konsep dasar analisis Big Data, termasuk Volume, Velocity, dan Variety (3V). 2. Mampu melakukan analisis prediktif atau implementasi metode tertentu lainnya untuk mengambil nilai dari data, tanpa adanya kendala atas besarnya data yang diperlukan. 3. Mampu menjawab tantangan termasuk analysis, capture, curation, search, sharing, storage, transfer, visualization, and information privacy dan peluang yang ditimbulkan oleh "Big Data" dalam berbagai domain dan bagaimana teknik statistik dan algoritma yang inovatif dapat membantu mengumpulkan data penting dan mempercepat penemuan informasi dalam data yang besar. 4. Mampu mengambil potensi dari data yang besar untuk membantu meningkatkan operasi atau tindakan yang sebaiknya dilakukan dengan lebih cepat, yang memunculkan pengambilan keputusan yang lebih cerdas dari Big Data.
Pustaka Yang Digunakan 1. Big Data Analytics, 1st Edition. Editor(s): Govindaraju, Raghavan, and Rao. Release Date: 07 Jul 2015. Imprint: Elsevier. 2. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. Editor: EMC Education Services. January 2015. 3. Judith S. Hurwitz, et. al. 2013. Big Data For Dummies, John Wiley & Sons, Inc., Hoboken, New Jersey.
Rencana Program Dan Kegiatan Pembelajaran Semester (RPKPS) PERTEMUAN KE
JENIS KEGIATAN PEMBELAJARAN
POKOK BAHASAN
SUB POKOK BAHASAN
BENTUK TUGAS
BOBOT NILAI
(1)
(2)
(3)
(4)
(5)
(5)
1
Kuliah
Membahas silabus dan kontrak kuliah
- Pengantar Big Data & Data Analytics Lifecycle
- Tidak ada
- Dasar-Dasar Metode Data Analytic - Teori dan Metode Analitik Data Tingkat Lanjut (Clustering) - Teori dan Metode Analitik Data Tingkat Lanjut (Regresi) - Teori dan Metode Analitik Data Tingkat Lanjut (Klasifikasi) - Teknologi dan Tools 2
Kuliah
Pengantar Big Data & Data Analytics Lifecycle
- Gambaran Umum Big Data o
Data Structures
o
Analyst Perspective on Data Repositories
- State of the Practice in Analytics o
BI Versus Data Science
o
Current Analytical Architecture
o
Drivers of Big Data
o
Emerging Big Data Ecosystem and a New Approach to Analytics
- Key Roles for the New Big Data Ecosystem - Examples of Big Data Analytics - Data Analytics Lifecycle Overview o
Key Roles for a Successful Analytics Project
o
Background and Overview of Data Analytics Lifecycle
- Phase 1: Discovery o
Learning the Business Domain
o
Resources
o
Framing the Problem
o
Identifying Key Stakeholders
o
Interviewing the Analytics Sponsor
o
Developing Initial Hypotheses
o
Identifying Potential Data Sources
- Phase 2: Data Preparation o
Preparing the Analytic Sandbox
o
Performing ETLT
o
Learning About the Data
o
Data Conditioning
o
Survey and Visualize
- Diskusi Kelompok - Latihan
o
Common Tools for the Data Preparation Phase
- Phase 3: Model Planning o
Data Exploration and Variable Selection
o
Model Selection
o
Common Tools for the Model Planning Phase
- Phase 4: Model Building o
Common Tools for the Model Building Phase
- Phase 5: Communicate Results - Phase 6: Operationalize - Case Study: Global Innovation Network and Analysis (GINA) 3
Kuliah
Dasar-Dasar Metode Data Analytic
- Introduction o
Graphical User Interfaces
o
Data Import and Export
o
Attribute and Data Types
o
Descriptive Statistics
- Diskusi Kelompok - Latihan
- Exploratory Data Analysis o
Visualization Before Analysis
o
Dirty Data
o
Visualizing a Single Variable
o
Examining Multiple Variables
o
Data Exploration Versus Presentation
- Statistical Methods for Evaluation
4
Kuliah
Teori dan Metode Analitik Data Tingkat Lanjut (Clustering)
o
Hypothesis Testing
o
Difference of Means
o
Wilcoxon Rank-Sum Test
o
Type I and Type II Errors
o
Power and Sample Size
o
ANOVA
- Overview of Clustering
- Diskusi Kelompok
- K-means versus Kernel Kmeans
- Latihan
o
Use Cases
o
Overview of the Method
o
Determining the Number of Clusters
o
Diagnostics
o
Reasons to Choose and Cautions
- Additional Algorithms 5
Kuliah
Tugas Paper 1 (Keyword: Big Data)
- Review (Deskripsi : Problem Base, Algoritma (alur, kelebihan & kekurangan), Hasil & Evaluasi)
- Presentasi Kelompok
6
Kuliah
Teori dan Metode Analitik Data Tingkat Lanjut (Regresi)
- Linear Regression o
Use Cases
o
Model Description
o
Diagnostics
- Diskusi Kelompok - Latihan
- Logistic Regression o
Use Cases
o
Model Description
o
Diagnostics
- Reasons to Choose and Cautions - Additional Regression Models 7
Kuliah
Quiz 1
-
-
8
Kuliah
UTS
-
-
9
Kuliah
Teori dan Metode Analitik Data Tingkat Lanjut (Klasifikasi)
- Naïve Bayes: o
Bayes’ Theorem
o
Naïve Bayes Classifier
o
Smoothing
o
Diagnostics
o
Naïve Bayes in R
- Diskusi Kelompok - Latihan
- Decision Trees: o
Overview of a Decision Tree
o
The General Algorithm
o
Decision Tree Algorithms
o
Evaluating a Decision Tree
o
Decision Trees in R
- Diagnostics of Classifiers - Additional Classification Methods 10
Kuliah
Teknologi dan Tools Big Data 1 of 3
- Technology and Tools: MapReduce and Hadoop - Analytics for Unstructured Data o
Use Cases
o
MapReduce
o
Apache Hadoop
- Diskusi Kelompok - Latihan
- The Hadoop Ecosystem o
Spark
o
Pig
o
Hive
o
HBase
o
Mahout
- NoSQL 11
Kuliah
Tugas Paper 2 (Keyword: Big Data)
- Review (Deskripsi : Problem Base, Algoritma (alur, kelebihan & kekurangan), Hasil & Evaluasi)
- Presentasi Kelompok
12
Kuliah
Teknologi dan Tools Big Data 2-3 of 3
- Technology and Tools: MapReduce and Hadoop
- Diskusi Kelompok
- Analytics for Unstructured Data o
Use Cases
o
MapReduce
o
Apache Hadoop
- Latihan
- The Hadoop Ecosystem o
Spark
o
Pig
o
Hive
o
HBase
o
Mahout
- NoSQL 13
Kuliah
Quiz 2 + Progress FP ke-1
14
Kuliah
Progress FP ke-2
- Pengajuan Judul (Paper Ref. Utama) & Acc Persetujuan
- Diskusi Kelompok
- Membuat Siklus Penyelesaian (Perhitungan Manual)
- Presentasi Kelompok
- Implementasi Program dan Analisis Hasil Pengujian - Dokumentasi sesuai Template 15
Kuliah
Progress FP ke-3
- Hasil Revisi Dokumentasi & Implementasi
- Presentasi Kelompok
16
Kuliah
UAS/Pengumpulan Akhir Final Project
- Dokumentasi sesuai Template. Program, PPT
- Presentasi Kelompok
Sistem Penilaian Point Keaktifan + 20% Tugas + 15% Quiz + 25% UTS + 40% UAS/FP