Bab II Dasar Teori Permainan dan Lelang II.1 Sejarah Teori Permainan
Teori permainan merupakan studi formal konflik dan kerjasama. Konsep teori permainan diaplikasikan ketika aksi beberapa agen atau pemain saling berpengaruh. Konsep teori permainan menghasilkan suatu cara untuk formulasi, pembentukan struktur, analisis, dan pemahaman skenario strategis.
Contoh terdahulu dari analisis teori permainan adalah studi duopoli oleh Cournot pada tahun 1838. Lalu ahli matematika Emile Borel menyarankan suatu teori formal permainan tahun 1921, yang penelitiannya dilanjutkan oleh John von Neumann pada tahun 1928. Teori permainan ditetapkan sebagai bidang tersendiri setelah publikasi tahun 1944 berjudul Theory of Games and Economic Behavior oleh von Neumann dan ahli ekonomi Oskar Morgenstern. Tahun 1950, John Nash mendemonstrasikan bahwa permainan terbatas selalu memiliki titik ekuilibrium yaitu aksi yang dipilih oleh semua pemain dan terbaik untuk seluruh pemain tersebut, jika diberikan strategi yang dipilih lawan mereka. Konsep sentral teori permainan non kooperatif ini kemudian menjadi fokus dalam analisis di masamasa berikutnya. Pada tahun 1950 dan 1960, aplikasi teori permainan diperluas ke permasalahan perang dan politik. Sekitar tahun 1970, teori permainan memberikan suatu arah revolusi dalam teori ekonomi. Pada akhir tahun 1990-an, aplikasi teori permainan yang lebih tinggi diterapkan dalam desain lelang.
II.2 Definisi dan Jenis Teori Permainan
Teori permainan merupakan suatu cara formal untuk menganalisis interaksi strategi antara sekelompok pemain rasional yang bertingkah laku secara strategis. Interaksi strategis berarti bahwa hasil permainan bergantung pada semua pemain. Contoh sederhana dari sebuah permainan adalah ketika enam orang pergi makan ke restoran bersama-sama. Kejadian ini merupakan problem pengambilan keputusan sederhana jika masing-masing membayar makanannya sendiri, tetapi
4
jika semua sepakat untuk membagi pembayaran secara merata, maka peristiwa ini merupakan permainan.
Unsur-unsur yang termasuk dalam teori permainan adalah: •
Pemain (pembuat keputusan)
•
Pilihan (tindakan yang dapat diambil), terbagi menjadi: o Keputusan non-strategis: keputusan dengan set pilihan satu pemain didefinisikan tidak berkaitan dengan pilihan pemain lain o Keputusan strategis: keputusan dengan set pilihan yang dihadapi pemain dan/atau hasil pilihan tersebut bergantung pada pilihan yang diambil pemain lain
•
Payoff (keuntungan, penghargaan)
•
Pilihan untuk membayar (objektif)
Jenis permainan dibagi menjadi permainan kooperatif dan non-kooperatif, masing-masing dibagi lagi menjadi permainan statik dan dinamik.
Tabel II. 1 Jenis Permainan
Statik Dinamik
Non-kooperatif Kooperatif Pemrograman matematis Teori permainan dan teori permainan non- kooperatif kooperatif Permainan dinamik Teori kontrol kooperatif
II.2.1 Permainan Kooperatif dan Non-Kooperatif
Teori permainan dibagi menjadi dua cabang yaitu teori permainan kooperatif dan non-kooperatif. Kedua cabang ini memiliki perbedaan dalam ketergantungan antar pemain. Teori non-kooperatif menggambarkan detail permainan sebagai model dari semua pergerakan yang dapat dilakukan oleh semua pemain. Sedangkan teori permainan kooperatif lebih abstrak dan hanya mendeskripsikan akibat atau hasil dari kombinasi kerjasama pemian. Teori permainan kooperatif menganalisis permainan-permainan koalisional terkait dengan kekuatan relatif yang dimiliki
5
oleh berbagai pemain, atau analisis tentang pembagian hasil di antara koalisi yang berhasil. Konsep ini umumnya diaplikasikan pada situasi yang muncul di dunia politik atau hubungan internasional yang memiliki konsep kekuasaan sebagai hal yang penting. Meskipun merupakan istilah standar, kooperatif dan non-kooperatif dalam teori permainan terkadang kurang tepat. Istilah ini memberi kesan bahwa tidak ada kesempatan bekerjasama dalam permainan non-kooperatif dan tidak ada konflik atau kompetisi dalam permainan kooperatif. Tetapi pada kenyataannya salah satu bagian dalam permainan non-kooperatif mempelajari kemungkinan kerjasama, dan pada teori kooperatif tidak hanya terdapat kerjasama antar pemain, tetapi juga kompetisi yang cukup kuat dalam bentuk yang tidak mengikat.
Kedua jenis permainan ini mempertimbangkan pemain: individu yang membuat keputusan, tindakan: pilihan yang dapat dibuat oleh pemain, dan aturan permainan. Tetapi kedua permainan ini berbeda pada konsep yang digunakan untuk membangun solusi. Teori permainan kooperatif berusaha menemukan pembagian yang adil dan fair; sedangkan permainan non-kooperatif memiliki konsep solusi berdasar pada masing-masing pemain berusaha memaksimalkan keuntungannya.
II.2.2 Permainan Bentuk Strategis dan Ekstensif
Bentuk permainan strategis (disebut juga bentuk normal) merupakan jenis dasar permainan yang dipelajari dalam teori permainan non-kooperatif. Permainan bentuk strategis mencantumkan strategi masing-masing pemain dan outcome dari setiap kombinasi strategi yang dipilih. Outcome direpresentasikan oleh payoff terpisah untuk setiap pemain, yang merupakan angka (disebut juga utilitas) yang mengukur preferensi pemain terhadap outcome tersebut.
Bentuk permainan ekstensif, atau disebut juga pohon permainan, merupakan bentuk yang lebih detail dibandingkan bentuk strategis. Bentuk ini merupakan deskripsi lengkap permainan yang dilakukan setiap waktu. Bentuk ini meliputi
6
urutan pengambilan aksi oleh pemain, informasi yang dimiliki pemain pada saat mengambil aksi, dan waktu ketika ketidakpastian situasi teratasi.
II.3 Dominasi Strategi Permainan
Semua pemain dalam teori permainan diasumsikan bertindak rasional yaitu bertujuan memaksimalkan payoff masing-masing dan setiap pemain dapat melakukan perhitungan. Oleh karena itu, pemain akan membuat pilihan yang menghasilkan outcome yang paling disukai atau cenderung dipilih, jika diberikan pilihan yang akan diambil oleh pemain lain. Dalam kasus yang ekstrim, satu pemain dapat memiliki dua strategi A dan B sedemikian sehingga jika diberikan kombinasi strategi apapun dari pemain lain, outcome yang dihasilkan strategi A lebih baik dibandingkan outcome hasil strategi B. Hal seperti ini berarti bahwa strategi A mendominasi strategi B. Pemain yang rasional tidak akan pernah memilih untuk memainkan strategi yang terdominasi. Dalam beberapa permainan, pengujian strategi terdominasi menghasilkan kesimpulan bahwa pemain rasional hanya dapat memilih satu dari beberapa strategi yang dimiliki.
Contoh umum dalam teori permainan adalah dilema tahanan (prisoner’s dilemma) yang merupakan permainan strategis antara dua pemain. Masing-masing pemain memiliki dua strategi yaitu diam dan mengakui kesalahan. Pada permainan ini dua orang tersangka ditahan di sel yang berbeda dan tidak ada cukup bukti yang menunjukkan kesalahan mereka. Kemudian kedua tersangka diberi pilihan kebijakan sebagai berikut: •
Jika tidak ada yang mengaku maka keduanya dianggap melakukan pelanggaran kecil dan akan ditahan selama satu bulan.
•
Jika keduanya mengaku maka keduanya akan dipenjara selama enam bulan.
•
Jika salah satu mengaku, maka yang memberikan pengakuan akan dibebaskan sedangkan tersangka lain akan dipenjara selama sembilan bulan.
Permainan ini dapat dimodelkan dalam tabel payoff sebagai berikut.
7
Tersangka 2 Diam
-1 , -1
Diam
Mengaku
-9 ,
0
Tersangka1
0 , -9
Mengaku
-6 , -6
Gambar II. 1 Permainan Dilema Tahanan
Pemain 1 memilih baris strategi, sedangkan pemain 2 memilih kolom strategi. Dalam permainan ini, strategi “mengakui” mendominasi strategi “diam” dan berlaku bagi kedua pemain. Tidak ada pemain rasional yang akan memilih strategi terdominasi karena akan selalu lebih baik jika beralih ke strategi yang mendominasi. Outcome yang unik pada permainan ini adalah jika kedua tersangka mengaku (-6, -6). Secara matematis dominasi strategi dapat dirumuskan sebagai berikut: 1. Strategi terdominasi sempurna Strategi s i ' terdominasi sempurna oleh strategi s i " jika u i (s 1 , s 2 , ... s i-1 , s i ', s i+1 , ..., s n ) < u i (s 1 , s 2 , ... s i-1 , s i ", s i+1 , ..., s n ) untuk semua s 1 ∈ S 1 , s 2 ∈ S 2 , ..., s i-1 ∈S i-1 , s i+1 ∈ S i+1 , ..., s n ∈ S n . 2. Strategi dominasi lemah Strategi s i ' terdominasi lemah oleh strategi s i " jika u i (s 1 , s 2 , ... s i-1 , s i ', s i+1 , ..., s n ) ≤ (tetapi tidak selalu sama dengan) u i (s 1 , s 2 , ... s i-1 , s i ", s i+1 , ..., s n ) untuk semua s 1 ∈ S 1 , s 2 ∈ S 2 , ..., s i-1 ∈S i-1 , s i+1 ∈ S i+1 , ..., s n ∈ S n .
Suatu pemain rasional tidak akan memilih strategi yang terdominasi sempurna, oleh karena itu, strategi terdominasi sempurna dapat dieliminasi. Namun pemain rasional mungkin memilih strategi terdominasi lemah.
II.3.1 Eliminasi Strategi Terdominasi Sempurna Suatu strategi yang terdominasi sempurna dapat dieliminasi. Setelah eliminasi strategi terdominasi ini, maka ukuran dan kompleksitas permainan akan berkurang. Kemudian dapat dilakukan eliminasi strategi dominan sempurna tahap berikutnya. Eliminasi ini dapat dilakukan berturut-turut. Contoh dari iterasi
8
eliminasi ini adalah sebagai berikut. Misalkan terdapat dua bar di suatu kota yaitu bar 1 dan bar 2. Kedua bar ini dapat memasang harga $2, $4, atau $5. Terdapat 6.000 turis asing yang memilih bar secara acak dan 4.000 turis lokal yang memilih bar dengan harga terendah. Jika kedua bar menetapkan harga $2, maka masingmasing akan 5.000 pelanggan dan $10.000. Sedangkan jika bar 1 menjual minuman seharga $4, dan bar 2 seharga $5, maka bar 1 mendapatkan 7.000 pelanggan (3.000 + 4.000 = 7.000) dan penghasilan $28.000, bar 2 mendapatkan 3.000 pelanggan dan penghasilan $15.000. Tabel payoff dan eliminasi pertama strategi terdominasi dari permainan ini adalah sebagai berikut: Tabel II. 2 Eliminasi Strategi Terdominasi Tahap Pertama
Bar 2
Bar 1
$2
$2 10 , 10
$4 14 , 12
$5 14 , 15
$4
12 , 14
20 , 20
28 , 15
$5
15 , 14
15 , 28
25 , 25
Dari tabel payoff yang telah direduksi, dilakukan eliminasi strategi terdominasi tahap berikutnya. Tabel II. 3 Eliminasi Strategi Terdominasi Tahap Kedua
Bar 2
Bar 1
$4
$4 20 , 20
$5 28 , 15
$5
15 ,
25 ,
28
25
II.4 Ekuilibrium Nash Pada pembahasan sebelumnya, pertimbangan tentang dominasi strategi dapat memberikan saran yang tepat kepada pemain tentang strategi yang harus dipilih. Tetapi dalam banyak permainan, tidak terdapat strategi terdominasi, sehingga pertimbangan dominasi strategi tidak cukup untuk memberikan saran pemilihan strategi secara lebih spesifik.
9
Konsep utama ekuilibrium Nash merupakan konsep yang lebih umum. Ekuilibrium Nash merupakan suatu set strategi, satu strategi untuk setiap pemain, sedemikian sehingga strategi tersebut merupakan strategi terbaik untuk pemain yang terkait, diberikan bahwa semua pemain lain memainkan strategi ekuilibrium. Atau dengan kata lain, ekuilibrium Nash merupakan konsep solusi permainan dengan dua pemain atau lebih, dan tidak ada pemain yang dapat melakukan apapun untuk mendapat hasil yang lebih baik dengan mengubah strategi sendiri secara unilateral. Suatu permainan strategis bisa saja tidak memiliki ekuilibrium Nash, memiliki satu atau banyak ekuilibrium Nash. Contoh ekuilibrium Nash adalah sebagai berikut. Diberikan tabel payoff suatu permainan seperti pada tabel di bawah ini. Tabel II. 4 Tabel Payoff Permainan (Contoh Nash)
Pemain 1
T B
Pemain 2 L R 2, 2 0, 3 3, 0 1, 1
Dalam permainan ini terdapat empat profil strategi yaitu (T, L), (T, R), (B, L), dan (B, R). Pengecekan ekuilibrium Nash dapat dilakukan satu persatu: •
(T, L): diberikan aksi pemain 2 adalah L, dengan memilih B, pemain 1 mendapat payoff 3, lebih baik dibandingkan jika memilih T yang menghasilkan payoff 2. Maka (T, L) bukan merupakan ekuilibrium Nash. (Pemain 2 juga dapat menaikkan payoff-nya dari 2 menjadi 3 dengan memilih R dibandingkan memilih L.)
•
(T, R): diberikan aksi pemain 2 adalah R, dengan memilih B, pemain 1 mendapat payoff 1, lebih baik dibandingkan jika memilih T yang menghasilkan payoff 0. Maka (T, R) bukan merupakan ekuilibrium Nash.
•
(B, L): diberikan aksi pemain 1 adalah B, dengan memilih R, pemain 2 mendapat payoff 1, lebih baik dibandingkan jika memilih L yang menghasilkan payoff 0. Maka (B, L) bukan merupakan ekuilibrium Nash.
•
(B, R): baik pemain 1 atau 2 tidak dapat menaikkan payoff dengan memilih aksi yang berbeda dari yang sekarang dipilih. Maka profil aksi ini merupakan ekuilibrium Nash.
10
Perlu diperhatikan bahwa pada ekuilibrium (B, R), kedua pemain mendapat payoff yang lebih sedikit dibanding (T, L) sehingga kedua pemain akan berusaha mencapai (T, L), tetapi insentif individual masing-masing mengarah ke (B, R).
Setelah semua pemain mencapai strategi yang membentuk ekuilibrium Nash, tidak ada pemain yang memiliki insentif untuk melakukan deviasi dari strategi ekuilibrium, sehingga secara rasional para pemain akan tetap pada strategi tersebut. Hal ini menjadikan ekuilibrium Nash sebagai suatu konsep solusi permainan yang konsisten.
II.4.1 Pemilihan Ekuilibrium
Jika suatu permainan memiliki lebih dari satu ekuilibrium Nash, perlu suatu teori interaksi strategis yang mengarahkan pemain pada ekuilibrium yang ”paling sesuai”. Sudah banyak penelitian dalam teori permainan yang terkait dengan perbaikan ekuilibrium yang mencoba menurunkan kondisi yang membuat satu ekuilibrium lebih masuk akal atau lebih meyakinkan dibanding yang lain. Tetapi pertimbangan teoritis yang abstrak untuk pemilihan ekuilibrium seringkali lebih rumit dibandingkan model permainan teoritis sederhana yang diaplikasikan. Akan lebih jelas untuk mengobservasi bahwa suatu permainan memiliki ekuilibrium lebih dari satu, dan hal ini merupakan alasan ketika pemain terkadang tertahan di pendapatan yang rendah.
Tabel II. 5 Tabel Payoff Permainan Kualitas
Pemain I
Pemain II tidak beli membeli (2, 2) (0, 1) (1, 0) (1, 1)
Tinggi Rendah
Permainan yang sama dapat memiliki interpretasi yang berbeda yaitu ketika set strategi sebelumnya merupakan ekuilibrium yang tidak diinginkan kemudian menjadi masuk akal. Contoh sederhana seperti pada tabel II.5. Tabel payoff ini merupakan tabel payoff untuk dua kasus permainan.
11
•
Kasus I (Permainan Kualitas): pemain I merupakan provider layanan internet dan pemain II adalah pelanggan potensial. Keduanya akan melakukan kontrak layanan untuk periode tertentu. Provider dapat memberikan dua level layanan yaitu Tinggi dan Rendah. Layanan kualitas tinggi memerlukan biaya yang lebih tinggi. Bagi konsumen, layanan kualitas tinggi lebih bernilai dibandingkan kualitas rendah sehingga konsumen akan memilih tidak jadi membeli layanan jika mengetahui bahwa kualitas layanan rendah. Pemain II memiliki pilihan untuk membeli atau tidak membeli layanan tersebut. Permainan ini memiliki dua ekuilibrium Nash yaitu (Rendah, tidak membeli) dan (Tinggi, membeli).
•
Kasus II: Dua perusahaan ingin melakukan investasi dalam infrastruktur komunikasi. Mereka bermaksud untuk saling berkomunikasi menggunakan infrastruktur tersebut, tetapi mereka memutuskan untuk membeli infrastruktur komunikasi secara independen. Masing-masing perusahaan dapat memutuskan antara peralatan bandwidth Tinggi atau Rendah (nama strategi yang sama digunakan untuk kedua pemain, strategi membeli dan tidak membeli pada pemain II diganti dengan Tinggi dan Rendah). Payoff (yang tidak berubah) ini memiliki interpretasi untuk pemain I sebagai berikut (diaplikasikan sama terhadap pemain II karena tabel simetris): koneksi bandwidth Rendah bekerja dengan hasil yang sama (payoff 1) tanpa terpengaruh kualitas koneksi yang digunakan pemain lain. Mengubah koneksi dari Rendah ke Tinggi hanya akan dipilih jika pemain lain memakai bandwidth yang tinggi (payoff 2), jika tidak maka hanya menghasilkan biaya yang tidak perlu (payoff 0). Pada permainan kualitas, ekuilibrium (Rendah, Rendah) di sel kanan bawah merupakan ekuilibrium yang lebih rendah dibanding ekuilibrium lainnya. Tetapi sebenarnya ekuilibrium ini bukanlah ekuilibrium yang buruk, lagipula strategi Rendah jelas memiliki worst-case payoff yang lebih baik. Strategi Rendah juga disebut sebagai strategi max-min karena memaksimalkan payoff minimum yang dapat diperoleh pemain pada setiap kasus. Hal ini berarti juga bahwa investasi peralatan bandwidth rendah merupakan pilihan yang aman. Selain itu, strategi ini merupakan bagian dari ekuilibrium, dan secara
12
keseluruhan terbukti bahwa pemain mengharapkan pemain lain melakukan hal yang sama.
II.4.2 Permainan Evolusioner Permainan pemilihan bandwidth dapat diberikan dalam interpretasi berbeda ketika diaplikasikan pada suatu populasi besar pemain yang identik. Ekuilibrium lebih tepat dipandang sebagai hasil dari suatu proses dinamik dibandingkan analisis rasional.
Tabel II. 6 Tabel Payoff Permainan Pemilihan Bandwidth
Pemain I
Pemain II Rendah Tinggi (5, 5) (0, 1) (1, 0) (1, 1)
Tinggi Rendah
Tabel II.6 menunjukkan permainan pemilihan bandwidth dengan strategi masingmasing pemain adalah Tinggi dan Rendah. Payoff positif 5 untuk setiap pemain untuk kombinasi strategi (Tinggi, Tinggi) membuat strategi ini menjadi ekuilibrium yang lebih disukai dibandingkan dengan kasus yang sudah didiskusikan sebelumnya.
Dalam interpretasi evolusioner, terdapat populasi individu yang besar, masingmasing dapat mengambil satu strategi. Permainan mendeskripsikan payoff yang dihasilkan ketika kedua individu ini bertemu. Dinamik dari permainan ini didasarkan pada asumsi bahwa setiap strategi dimainkan oleh sebagian fraksi individual tertentu. Sehingga, jika diberikan distribusi strategi ini, individu dengan payoff rata-rata yang lebih baik akan lebih sukses dibandingkan individu yang lain, sehingga proporsi dalam populasi akan meningkat. Hal ini kemudian akan mempengaruhi strategi yang lebih baik untuk dipilih.
Pada contoh tabel II.6, sejumlah pengguna yang terhubung ke jaringan sudah memiliki peralatan bandwidth tinggi atau rendah. Sebagai contoh misalkan seperempat pengguna memilih peralatan Tinggi dan tiga perempat pengguna
13
memilih Rendah. Akan lebih mudah jika angka ini dijadikan persentasi terhadap kolom yang merepresentasikan strategi pemain II. Seorang user baru, sebagai pemain I kemudian akan memutuskan untuk memilih antara Tinggi dan Rendah, dengan payoff bergantung pada angka fraksi yang diberikan. Payoff pemain I menjadi (¼ x 5) + (¾ x 0) = 1,25 jika memilih Tinggi, dan (¼ x 1) + (¾ x 1) = 1 jika memilih Rendah. Dengan ekspektasi angka payoff yang didapatkan pemain I ini ketika berinteraksi dengan yang lain, pemain I akan lebih baik memilih strategi Tinggi. Dengan pilihan pemain I untuk mengikuti populasi strategi Tinggi, proporsi individu tipe Tinggi akan naik, dan semakin lama keuntungan strategi ini akan semakin nyata. Selain itu, user yang mengganti peralatannya juga akan membuat perhitungan yang sama, dan juga akan mengganti strategi dari Rendah ke Tinggi. Pada akhirnya semua pemain akan memainkan Tinggi sebagai satusatunya strategi yang bertahan, yaitu strategi ekuilibrium pada sel kiri atas tabel II.6.
Outcome jangka panjang yang menghasilkan pilihan peralatan bandwidth tinggi bergantung pada fraksi inisial yang memilih Tinggi (harus cukup banyak). Sebagai contoh, jika hanya sepuluh persen yang memilih Tinggi, maka payoff yang diharapkan untuk strategi Tinggi adalah 0,1 x 5 + 0,9 x 0 = 0,5, kurang dari payoff yang diharapkan untuk strategi Rendah yaitu 1 (besarnya selalu 1, berapapun distribusi user dalam populasi). Sehingga seperti pada contoh sebelumnya, jumlah user Rendah meningkat, sehingga ekuilibrium mengarah ke sel kanan bawah pada tabel. Dengan mudah dapat disimpulkan bahwa fraksi kritis user Tinggi agar strategi Tinggi menjadi strategi yang lebih baik adalah 1/5.
Sudut pandang populasi-dinamik permainan yang evolusioner bermanfaat karena tidak memerlukan asumsi bahwa semua pemain bersifat rumit dan berpikir semua pemain lain juga rasional, yang terkadang tidak realistis. Ide rasionalitas dari asumsi ini justru digantikan konsep yang lebih lemah yaitu kesuksesan reproduktif: strategi yang rata-rata sukses akan lebih sering digunakan dan pada akhirnya akan menang. Pandangan ini pertama dikemukakan dalam biologi
14
teoritis oleh Maynard Smith (Evolution and the Theory of Games, Cambridge University Press, 1982).
II.5 Ekuilibrium Strategi Campuran Dalam beberapa situasi, pemain dapat memilih aksi secara acak. Jika pemain memilih aksi yang akan dimainkan secara acak, maka dapat dikatakan bahwa pemain menggunakan strategi campuran, kebalikan dari strategi murni. Dalam strategi murni pemain memilih satu aksi dengan pasti, sedangkan dalam strategi campuran, pemain memilih sebuah distribusi probabilitas pada set aksi yang tersedia. Sebagai ilustrasi sederhana, digunakan permainan matching-pennies berikut. Tabel II. 7 Tabel Payoff Matching-Pennies
Pemain 1
Pemain 2 H T (1, -1) (-1, 1) (-1, 1) (1, -1)
H T
Jika strategi pemain dibatasi hanya satu aksi seperti yang sudah dilakukan sebelumnya, maka permainan ini tidak memiliki ekuilibrium Nash. Oleh karena itu, untuk mendapatkan ekuilibrium pada kondisi tunak, digunakan strategi campuran. Misalkan setiap pemain memainkan H dan T dengan probabilitas ½. Karena pemain 2 memainkan H dengan probabilitas ½, ekspektasi payoff pemain 1 jika memainkan H adalah (1/2) (1) + (1/2) (-1) = 0. Dengan cara yang sama, ekspektasi payoff untuk aksi T adalah 0. Dengan demikian pemain 1 tidak memiliki alasan untuk menyimpang dari memainkan H dan T dengan probabilitas masing-masing ½, begitu juga pemain 2. Maka dapat disimpulkan bahwa memainkan H dan T dengan probabilitas ½ dan ½ merupakan ekuilibrium strategi campuran permainan ini.
II.6 Permainan Berulang
Permainan berulang memberikan kerangka pemikiran formal dan cukup general untuk memeriksa alasan pemain memiliki ketertarikan untuk melakukan
15
kerjasama jangka panjang. Secara formal, permainan berulang mengacu pada suatu set agen yang sama yang memainkan permainan yang sama pula secara berulang, yang disebut sebagai “tahap permainan”, sepanjang horison waktu (biasanya tidak terbatas).
Selama penelitian dan pengembangan selama tiga dekade terakhir, perekonomian saat ini mengenal tiga cara umum untuk mencapai efisiensi: •
Kompetisi
•
Kontrak
•
Hubungan jangka panjang
Untuk layanan dan barang standar, dengan jumlah penjual dan pembeli potensial yang sangat banyak, promosi kompetisi pasar merupakan cara efektif mencapai efisiensi. Hal ini dirumuskan sebagai Teorema Kesejahteraan Pertama dan Kedua dalam teori ekuilibrium umum. Tetapi terdapat juga problem penting alokasi sumberdaya yang tidak melibatkan layanan dan barang terstandarisasi. Dalam hal ini, menyelaraskan insentif individual dengan tujuan sosial merupakan hal yang esensial untuk efisiensi, dan hal ini dapat dicapai melalui skema insentif (penalti atau reward). Skema insentif ini dapat dipenuhi melalui kontrak formal atau relasi jangka panjang. Penalti dan reward ditentukan ditentukan oleh kontrak formal, sedangkan pada relasi jangka panjang, nilai interaksi di masa yang akan datang bertindak sebagai penalti dan reward untuk mengendalikan tingkah laku pemain. Teori kontrak dan desain mekanisme terkait dengan penalti dan reward, sedangkan relasi jangka panjang terkait dengan permainan berulang. Teori-teori ini memberikan metode umum untuk mencapai efisiensi, dan menjadi unsur pembangun penting dalam teori ekonomi modern.
Sebuah contoh sederhana adalah kolusi antara dua pombensin dan strategi trigger. Misalkan terdapat dua pombensin yang lokasinya berdekatan dengan biaya marjinal identik dan konstan yaitu c (harga borongan bensin) dan berkompetisi dengan mencantumkan harga jual. Profit bersama akan maksimal ketika keduanya menjual bensin dengan harga p = 10, dengan profit besar yang didapat masingmasing adalah π. Meskipun hasil ini merupakan yang terbaik untuk masing-
16
masing, mereka memiliki insentif untuk melakukan penyimpangan. Dengan sedikit menurunkan harga, masing-masing dapat mencuri semua pelanggan, dan profit yang didapat hampir mencapai dua kali lipat. Satu-satunya harga yang bebas dari deviasi yang menguntungkan tersebut adalah jika p = c, dengan profit yang didapat adalah nol. Dengan kata lain, satu-satunya ekuilibrium Nash dalam permainan kompetisi harga adalah hasil yang tidak efisien (bagi pombensin) yaitu ketika harga yang berlaku adalah p = c. Situasi seperti ini cenderung berlaku sebagai aturan, bukan perkecualian: ekuilibrium Nash pada permainan bertahap, adalah hasil yang dapat dicapai pemain dalam satu kali interkasi, yang terkadang tidak efisien bagi pemain tersebut. Hal ini terjadi karena pemain hanya mencari keuntungan sendiri tanpa memperhatikan keuntungan atau biaya aksi yang diambil bagi lawan bermain. Pada kenyataannya, pombensin menikmati keuntungan positif, meskipun terdapat pombensin lain di sekitarnya. Sebuah alasan penting adalah interaksi antar pombensin tersebut bukan hanya satu kali. Secara formal, situasi ini dianggap sebagai permainan berulang, dengan dua pombensin yang memainkan permainan kompetisi harga selama horison waktu tak terbatas t = 0, 1, 2, .... Strategi permainan berulang yang dapat dilakukan adalah sebagai berikut: 1. Mulai dengan harga optimal p = 10. 2. Tetap pada harga p = 10 selama tidak ada pemain (termasuk dirinya sendiri) yang menyimpang dari harga p = 10. 3. Jika ada pemain yang menyimpang (termasuk dirinya sendiri), berlakukan harga p = c untuk seterusnya. Hal ini dapat diinterpretasikan sebagai perjanjian eksplisit atau implisit antar pombensin: berlakukan harga monopoli p = 10, dan setiap deviasi memberikan trigger kompetisi harga (p = c dengan profit 0). Jika tidak ada pemain yang melakukan deviasi, setiap pombensin akan mendapat keuntungan π setiap hari. Seperti telah dibahas sebelumnya, satu pemain dapat meraih hampir dua kali lipat payoff jika menurunkan harga sedikit di bawah p = 10. Maka keuntungan tambahan maksimum jangka pendek yang didapat dari deviasi adalah π. Asumsikan bahwa discount future profit pemain adalah sebesar faktor diskon δ ∈ (0, 1). Angka δ mengukur nilai rupiah pada periode berikutnya. Discounted future
17
loss yang terjadi adalah δπ + δ 2π + ... =
δ 1−δ
π , jika nilainya kurang dari π maka
tidak akan ada yang ingin menyimpang dari harga kolusi p = 10. Kondisi yang diperlukan adalah π ≤
δ 1−δ
π atau ½≤ δ. Dapat disimp ulkan bahwa dengan
strategi seperti yang didefinisikan di atas, pemain akan memilih tanggapan mutual terbaik setelah beberapa tahap permainan yaitu ½ ≤ δ. II.7 Aplikasi Gambit sebagai Perangkat Perhitungan Teori Permainan
Gambit merupakan satu set perangkat lunak untuk melakukan komputasi permainan kooperatif terbatas. Gambit terdiri dari antarmuka grafis untuk membuat dan menganalisis permainan general bentuk ekstensif maupun strategis secara interaktif untuk menghitung ekuilibrium Nash dan konsep solusi lain dalam permainan, dan satu set format data untuk menyimpan dan mengkomunikasikan permainan ke perangkat eksternal. Proyek pembuatan Gambit ini dimulai pada pertengahan tahun 1980 oleh Richard McKelvey di California Institute of Technology. Implementasi awal ditulis dalam bahasa BASIC, dengan antarmuka grafis yang sederhana. Kode ini kemudian diubah ke dalam bahasa C pada tahun 1990 oleh Bruce Bell, dan didistribusikan kepada publik sebagai versi 0.13 pada tahun 1991 dan 1992.
Semua fitur Gambit tersedia melalui antarmuka grafis, yang bisa dijalankan pada berbagai sistem operasi seperti Windows, Linux, Mac, dan OS X. Antarmuka grafis memberikan metode yang fleksibel untuk membuat permainan ekstensif dan strategis, juga memberikan antarmuka untuk menjalankan algoritma perhitungan ekuilibrium Nash, struktur strategi atau aksi dominan, dan untuk menampilkan profil hasil dalam bentuk pohon permainan atau tabel.
Beberapa aplikasi yang lebih tinggi terkadang memerlukan waktu komputasi lebih lama dan atau kemampuan skrip komputasi. Semua algoritma dalam Gambit dibuat dalam paket individual, berupa program dalam command-line, dengan operasi dan output yang dapat dikonfigurasi.
18
Perangkat Gambit membaca dan menulis format data yang tekstual dan terdokumentasi, sehingga bersifat portable antar sistem dan dapat berinteraksi dengan tool eksternal. User dapat dengan langsung memperluas kemampuan Gambit dengan implementasi metode baru perhitungan ekuilibrium, implementasi kembali metode yang sudah ada dengan lebih efisien, atau membuat perangkat untuk membuat, manipulasi, dan transformasi atau analisis ekonometrik permainan.
Selain berbagai kelebihan yang sudah disebutkan di atas, Gambit memiliki beberapa keterbatasan yang cukup berpengaruh dalam beberapa aplikasi. Gambit hanya diaplikasikan untuk permainan terbatas. Struktur matematis dari permainan terbatas dapat ditulis dalam berbagai subrutin analisis yang general. Tetapi permainan yang tidak terbatas yaitu permainan dengan pemain yang memilih serangkaian aksi, atau pemain memiliki serangkaian jenis aksi, tidak memiliki metode yang sama. Selain itu, Gambit hanya digunakan untuk teori permainan non-kooperatif. Gambit memiliki fokus pada cabang teori permainan dengan aturan permainan tertulis secara eksplisit, dan pemain memilih aksi secara independen.
Gambar II. 2 Contoh Tampilan Program Gambit
19
II.8 Lelang dalam Pasar Listrik
Lelang merupakan proses penjualan dan pembelian barang dengan menawarkan barang melalui bidding, memilih penawaran, kemudian menjual barang tersebut ke penawar tertinggi. Dalam teori ekonomi, lelang merupakan metode untuk menentukan nilai sebuah komoditas yang belum ditentukan atau harga variabel. Lelang dapat disertai dengan reserve atau minimum, atau tanpa nilai minimum, atau absolut atau tanpa reserve. Pada reverse auctions, terdapat penawaran minimum atau reserve price; jika bidding tidak mencapai nilai minimum, maka tidak ada penjualan (tetapi orang yang menawarkan barang dalam lelang dapat membayar upah kepada auctioneer). Dalam lelang tanpa reserve atau absolut, penjualan dijamin, dengan harga yang tersisa sebagai penentu. Dalam konteks lelang, bid merupakan harga yang ditawarkan.
Beberapa tipe dasar lelang adalah sebagai berikut: 1. Lelang Inggris: dilakukan secara terbuka, penawaran berikutnya lebih tinggi dibanding penawaran sebelumnya. Lelang akan berakhir jika tidak ada lagi partisipan yang melakukan bidding. 2. Lelang Cina: lelang ini pada dasarnya merupakan raffle (penjualan dengan undian). 3. Lelang Belanda: lelang diawali dengan permintaan harga yang tinggi oleh auctioneer, kemudian harga diturunkan sampai partisipan menyetujui harga dari auctioneer. 4. Sealed-bid first-price auction: semua bidder memasukkan bidding bersama-sama sehingga tidak ada bidder yang mengetahui penawaran partisipan lain. 5. Sealed-bid second-price auction: juga dikenal sebagai Vickrey auction. Lelang ini identik dengan sealed-bid first-price auction, kecuali pemenang bidding membayar harga tertinggi kedua, bukan harga yang mereka tawarkan sendiri. 6. All pay auction: semua bidder harus membayar penawaran mereka meskipun tidak memenangkan lelang. Bidder tertinggi mendapatkan
20
hadiah atau barang yang ditawarkan. Lelang ini sering digunakan untuk memodelkan lobbying (bidding merupakan kontribusi politik), atau kompetisi lain.
Sistem lelang pasar listrik yang berlaku di berbagai negara berbeda-beda. Contoh sistem lelang pasar listrik yang sederhana terdapat di Jepang yaitu terdiri dari dua tahap. Pada lelang tahap pertama, awalnya beberapa perusahaan penjual mengumumkan penjualan listrik. Penjual adalah perusahaan yang memiliki surplus listrik yang merupakan sisa dari listrik sudah disuplai untuk memenuhi permintaan, maka akan lebih ekonomis untuk menjual surplus listrik ini dalam lelang dibandingkan menghentikan atau menurunkan output generator. Setelah itu pembeli akan melakukan bidding untuk membeli listrik. Beberapa pembeli melakukan bidding untuk membeli listrik karena tidak memiliki listrik yang cukup untuk memenuhi permintaan. Pembeli lain memiliki listrik yang cukup untuk memenuhi permintaan, tetapi membeli listrik saat lelang akan lebih ekonomis dibanding memproduksi listrik sendiri. Pengumuman penjual dibuat dengan menyatakan jumlah yang dijual dan harga minimum, dan harga bid pembeli harus lebih tinggi dari harga minimum ini. Kemudian, penjual memilih pembeli berdasarkan harga bidding pembeli, mulai dari harga bid tertinggi sampai harga terendah, sampai jumlah total listrik mencapai jumlah yang diperlukan. Setelah lelang tahap pertama ini selesai, dilakukan lelang tahap kedua yang merupakan kebalikan dari tahap pertama. Pembeli mengumumkan terlebih dahulu jumlah yang dibutuhkan dan harga maksimum. Kemudian pembeli memilih penjual berdasarkan harga bidding penjual, mulai dari harga terendah sampai harga tertinggi.
Untuk mempermudah pemahaman lelang dalam penelitian ini, maka pemodelan yang dilakukan merepresentasikan bentuk lelang pasar listrik Jepang tahap kedua dan diasumsikan hanya satu perusahaan yang mengumumkan untuk membeli listrik.
21