BAB II TINJAUAN PUSTAKA
Kebutuhan manusia manu nusi sia akan informasi infor orma m si membuat banyaknya penyedia informasi infor rmasi seperti situs berita berit ita online. Terlalu banyaknya
situs
kesulitan kesulita tan
berita be erita
dalam dala l m
online
menyerap meny nyer erap ap
membuat membu buat
informasi inf nfor orma masi
pengguna
yang
berbobot.
Terkadang Terk kadang situs situ us berita b rita yang satu be u berbeda ber e beda d dengan denga gan yang lainnya la ainnya a
tentang te g
informasi i nfo orm mas asi i
berita be
apa
yang
diberitakan. dib iber eritakan an. .
di
setiap
situs
Berbedanya Berb bed e anya
membuat mem e bu uat
pengguna pengg guna
membuka memb buk uka banyak ba anyak situs berita. Kebiasaan pengguna pen ngg g un una a membuka m mbuk me uka lebih le ebih
dari dari
satu
informasinya in info f rm masinya penelitian pe peneli litian
situs
dapat
ini,
berita
untuk
mendapatkan men nda dapa patkan n
memakan
banyak
waktu. wakt tu.
Pada Pada
dibangun
sebuah
aplikasi aplikas a i
yang ya g
akan
digunakan digun nakan untuk membaca berita dari berbagai sumber. sumbe er. Teknologi web scraping g digunakan dalam penelitian penelit tian ini i untuk untu tuk k mengambil data dari berbagai berbag gai situs berita. berita a. Selain Selai ain n web
scraping, scrapin ing g,
aplikasi apli lika kasi si
yang yan ng
dibangun diba di bangun n
ini ini
juga
bisa bi isa
melakukan m elakukan peringkasan berita beri rit ta dengan menggunakan metode me eto tode de TF-IDF. TF TF-ID IDF. Bab Bab tinjauan tin inja jaua uan pustaka pust pu stak aka a ini ini akan akan menjabarkan men enja jaba bark rkan an beberapa beb eber erapa penelitian pe ene eli liti tian an
yang yan ng
pembangunan pemban ngu guna nan
terlebih terl te r ebih ih
aplikasi
dahulu dah ahulu
web w b we
scraper s craper
dilakukan di ila laku kuka kan n situs s
sebelum seb se belum
berita be
dan
peringkas berita. Berikut Ber rikut adalah ad dalah beberapa penelitian lain
yang
menjadi
acuan a uan ac
penulis
untuk
membangun
aplikasi ini. Penelitian
yang
dilakukan dil i ak akukan
oleh
(Riyadi,
2013)
dalam tugas akhirnya yang berjudul “Rancang Bangun REST Web Service untuk Perbandingan Harga Pengiriman dengan Metode
Web
Scrapping
dan
Pemanfaatan
API”.
Dalam
penelitian ini dibangun aplikasi untuk membandingkan 8
harga
pengiriman
dari
TIKI,
JNE
dan
POS
Indonesia.
Pengguna tidak perlu membuka situs web penyedia layanan pengiriman
tersebut
satu
persatu
dan
tidak
perlu
menginputkan data berulang-ulang. berulang-ulang. g. Pembangunan aplikasi pada
penelitian penel lit itian
ini
menggunakan mengguna nakan
teknologi
REST(Representational REST(Repres esentational l State Transfer) web eb service, web scraping ng g
dan
Interface) Inte erface)
pemanfaatan pem emanfa aat atan an
ongkir.info. ong gki kir. r info.
API(Application A PI( PI (Ap Appl plication Pemanfaatan Pemanfaa ata an
API AP PI
Programming P ogramming Pr ongkir.info ongk gkir.info
pada digunakan untuk pa ada penelitian pen enel elit i ian ini in un ntu tuk mendapatkan me end ndap apatkan n data harga harg ga pengiriman pen pe ngir rim iman barang dan layanan kurir ku uri r r JNE. JNE. web
scraping scrap aping g
pada
penelitian
ini
Teknik Tekn k ik
digunakan dig gun u ak akan an
untuk unt tuk u
mendapatkan me endapat tkan harga pengiriman barang pada situs sit tus TIKI TIK IKI dan n POS POS
Indonesia. In ndonesia.
Setelah
data
harga
pengiriman pengirim man a
barang bar arang
didapatkan didap di patkan kemudian dimasukkan ke dalam database. databa ase. . REST R ST RE T web
service
digunakan
untuk
mengakses
data a
harga harg rga a
pengiriman p ngiriman barang pada database. pe (Utomo, 2012) ) melakukan penelitian penelitian dengan an judul jud dul “Implementasi “Implement tas si
PHP PHP
pada pada
Situs”.
Halaman
sebuah sebu se buah ah
aplikasi
menghasilkan meng me ngha hasi sil lka kan n otomatis otom ot mat atis is halaman halama an juga
rangkuman
dari
berbasis
konten kont ko ten
website website
kata
aplikasi
wikipedia,
web
hasil
yahoo,
dibangun diba ang ngu un untuk untu un tuk
Sistem Sist Si stem em
secara sec ecara
ditampilkan dit itam ampi pilk lkan an
yang
berupa
Dengan untuk
bing
Otomatis Otomati tis s
digunakan digunaka kan n
kata
dibuat dibua at dan da an
dan n
ini
pada
kunci. kunci.
ini
yang
otomatis. otom ot omat atis is. .
konten ko n
berdasarkan berdasa sarkan n
Konten Ko
penelitian
secara sec ecar ra
memasukkan dan
Penghasil Peng Pe ngha hasil il
Dalam Dal alam
menghasilkan men engh ghas asi ilka kan n
akan
scraping g
sebagai seba se baga g i
kunci. kun unci ci.
pada Sistem
judul,
memanfaatkan mengambil
berdasarkan
isi, Web
konten keyword
yang dimasukkan oleh pengguna peng gguna aplikasi. Jika artikel ditemukan maka akan tampil pada halaman web dan jika tidak ditemukan maka akan menampilkan pesan not found. Metode
pengambilan
konten 9
yang
digunakan
adalah
fetching
dan
rangking
yang
sebuah
cURL.
konten
Menurut
bagus
oleh
yang
unik,
penulis mesin
agar
mendapatkan
pencari
sedangkan
dibutuhkan
dengan
teknik
hasilnya pencari konten hasil ilnya tidak unik. un nik ik. (Rifangi, i, 2012) melakukan penelitian peneli litian dalam tugas akhirnya dengan dengan judul l “Rancang Bangun Aplikasi Ap pli l kasi Dekstop Client Transkrip Transkr krip ip Nilai ai pada pad ada a Domain Doma Do main in “krs.amikom.ac.id” “krs.ami mikom.ac.id” dengan deng gan
Teknik k
Web We
Scraping”.
Pada Pad ada a
penelitian peneliti pe tian
ini
dibangun di ibangun un sebuah seb ebuah aplikasi apl ap likasi untuk simulasi sim imul ulasi transkrip tran tr ansk s rip nilai IPK IPK
berbasis berb be rbasis s
dekstop.
Penggunaan
web eb
scraping scr crap apin ing g
pada pada
penelitian pene eli litian n ini adalah untuk mengambil data da a yang yang ada ad pada pa ada krs.amikom.ac.id. krs rs.amikom.ac.id. Dengan data tersebut tersebu ut pengguna peng pe nggu g na a bisa melakukan bis melakukan akses nilai maupun melakukan n simulasi si imu ula lasi i IPK IP menggunakan menggunakan aplikasi dekstop. (Josi, et al., 2014) melakukan penelitian n dengan denga gan n judul j dul “Penerapan Teknik Web Scraping ju g pada Mesin Pencari Penc cari i Artikel Arti tik kel
Ilmiah”.
Desember
2013 201 013 3
observasi o servasi ob
Penelitian sampai sa amp mpai ai
pada
perancangan, pera pe anc ncangan,
portal
dan
ini
akhir akh khir ir
dilakukan Januari Januari ri
jurnal jurnal
2014
gratis.
pengimplementasian
pada pa ada
awal awa wal l
dengan deng gan
Penelitian, Penelit tia ian n,
tentang
aplikasi apli ap lika kasi
pencarian penc pe car aria ian n artikel arti ar tike kel l ilmiah ilmi il miah ah dengan den enga gan n bahasa baha ba asa pemrograman pem emro rogr gra aman an PHP PHP dan da MySQL MySQ My SQL L sebagai seba se baga gai i databasenya. data tabase sen nya. Proses Prose ses s pencarian penc pe ncar aria ian n artikel art ar tikel dengan n keyword d
menggunakan menggunakan yang
akan
web e
scraping. scraping.
dicari,
jika
User er r
memasukkan memasukkan
ada
maka
akan
ditampilkan pada halaman halam man web dan jika tidak maka akan muncul
pesan
teknik
yang
not
found. foun nd.
bermanfaat
Teknik Te eknik untuk un ntuk
web
scraping g
mendapatkan
adalah
data
dari
halaman–halaman web secara a cepat. Berdasarkan
beberapa
penelitian
yang
sudah
dilakukan sebelumnya, penulis dapat menyimpulkan bahwa faktor menggunakan web scraping adalah banyaknya situs 10
yang
harus
dibuka
untuk
mendapatkan
informasi.
Keuntungan menggunakan web scraping adalah hemat waktu. Salah satu keuntungan memanfaatkan web scraping adalah data
atau
konten
dari dari
beberapa pa
sumber
atau
website
dimasukkan dapat dimasukk kan dalam satu aplikasi saja. saj a a. Penulis Penul lis mencoba membangun web scraper scrape er untuk untuk situs berita
dengan n
maksud ma d
memudahkan mem emud udah ahka kan n
dan
menghemat menghe hemat
waktu
pembaca pemb baca berita a dalam dal a am mengakses berita. ber rit ita. Aplikasi Aplikas asi yang akan ak kan dibangun dib iban angu gun dibagi di iba bagi menjadi dua yaitu yaitu aplikasi apl plik i asi untuk administrator admi ini ist str rato or dan aplikasi untuk user r atau ata tau u pengguna. penggu pe una. Aplikasi Apli ika kasi
admin
berbasis
website
berfungsi berfu f ng gsi
untuk unt tuk u
pengaturan pe engatur ran scraping g konten berita berupa URL L dan an rules. r les. ru Aplikasi Apli Ap l ka asi
untuk
membaca memba me aca
berita.
user r
berbasis
Selain
mobile
berfungsi
berfungsi berfung ngsi i
untuk
untuk unt ntuk k
menampilkan men nampi pilk l an n
berita, berit ta, aplikasi mobile yang dibuat juga bisa meringkas meringk kas beberapa b berapa be pengguna. peng ngg guna. berfungsi yang yang
berita
sesuai
Penulis untuk untu un tuk k
nantinya
juga
mengambil me eng ngam ambi b l
kata
kunci
membuat data data
ditampilkan ditampil lka kan
web
berita berit ita a
pada
Database Data Da taba b se yang digunakan adalah MySQL.
11
yang
dimasukan di imasu ukan n
service ce
yang yan ang g
pada
database databa base se
aplikasi
mobile. mobi bile e.
Tabel T abel 2.1 Tabel T bel Perbandingan Sistem Ta Sis istem
No
Pembanding
Riyadi
Utomo Utom Ut omo o
Rifangi Rifang gi
Josi, Jo
*Penulis
(2013) (201 13)
(2012)
(2012)
Abdillah, & Abdil
(2015)
Suryayusra Surya (2014) (20 1
2
Judul
Tujuan
Rancang Ranc cang Bangun Bang Ba n un
Implementasi PHP
Rancang Bangun B ng Ba gun
Penerapan Pen nera
Pembangunan Web
REST RES ST We Web eb Service Serv vice
sebagai Penghasil
Aplikasi
Teknik Tekn nik Web
Scraper Situs
untuk un ntuk Perbandingan Perban Pe andingan
Konten Otomatis
Dekstop Client Clie ent
scraping s crap pi
Berita dan
Harga Ha a Pengiriman P ng Pe giriman
pada Halaman
Transkrip Nilai Nil lai
pada Mesin pa M
Peringkas Berita
dengan deng de ngan Metode Met tode Web
Situs
pada Domain
Pencari Penc car
Scrapping Scrapp Sc p ing g dan
“krs.amikom.ac. “krs.amikom.ac c.
Artikel Ar rtike ke
Pemanfaatan Pe ema m nf faa aata an API
id”
Ilmiah Ilmi mia ah
Membangun Me emb mbangun REST Web Web
Membangun Memb Me mban a gu gun n
Membangun Memb Me mban angu gun n
Membangun Memb mba an
Service Serv rvic ice untuk
aplikasi
aplikasi
aplikasi apli ap lika Web aplikasi
perbandingan perb rban ndi ding n an harga
penghasil
pengiriman peng gir irim iman an barang bar aran ang g
yang ya ng
dengan n Web Web
membangun me emb mban angu g n
scraping dan dan Pemanfaatan API
konten dekstop Client dapat dap apat at tr transkrip tran ansk skri rip p nilai nila ni lai i konten ko en pa pada a do domain doma m in
scraping scra sc rapi pada pad pa da
Membangun
scraper
mesin berita
web situs untuk
pencari p encar
mengambil
pada web b yang ber “krs.ami “krs.amikom.ac. miko k m. .ac ac.
artikel artike
berita
CMS word wordpres. dpres.
ilmiah
peringkas berita
12 1 2
id”
data dan
3
Basis Data
Ya
Ya
Tidak
Ya
Ya
4
Platform
Web
Web
Dekstop
Web
Web dan Moblie
5.
Bahasa
PHP
PHP PH P
Actionscript Acti Ac tionscript
PHP
PHP
Pemrograman
13 1 3