Didownload dari ririez.blog.uns.ac.id
TEORI PERMAINAN I. Pendahuluan Dalam kehidupan sehari-hari sering dijumpai kegiatan-kegiatan yang bersifat kompetitif yang diwarnai persaingan atau konflik. Persaingan atau konflik ini dapat terjadi antara dua orang (dua pihak) atau sejumlah orang (grup). Beberapa contoh kegiatan itu antara lain : 1. Para manajer pemasaran bersaing dalam memperebutkan bagian pasar, 2. permainan catur, 3. dua buah partai politik yang bersaing dalam kampanye untuk memperoleh suara terbanyak, 4. para jenderal tentara yang ditugaskan dalam perencanaan dan pelaksaan perang. Tidak setiap keadaan persingan dapat disebut sebagai permainan (game). Kriteria atau ciri-ciri dari suatu permainan adalah : 1. terdapat persaingan kepentingan di antara pemain, 2. setiap pemain mempunyai sejumlah pilihan, terbatas atau tidak terbatas, yang disebut strategi, 3. aturan permainan untuk mengatur pilihan-pilihan itu disebutkan satu-satu dan diketahui oleh semua pemain, 4. hasil permainan dipengaruhi oleh pilihan-pilihan yang dibuat oleh semua pemain dan hasil untuk seluruh kombinasi pilhan dari pemain diketahui dan didefinisikan secara numerik. Jadi, permainan (game) adalah suatu bentuk persaingan antara antara dua orang atau pihak atau antara dua kelompok atau grup yang saling berhadapan dan menggunakan aturan-aturan yang diketahui oleh kedua belah pihak yang saling berhadapan. Sedangkan teori permainan (game theory) adalah suatu pendekatan matematis untuk merumuskan situasi persaingan dan konflik antara berbagai kepentingan. Teori ini dikembangkan untuk mmenganalisa proses pengambilan keputusan dari situasi-situasi persaingan yang berbeda-beda dan melibatkan dua atau lebih kepentingan. Dalam permainan, pihak pertama disebut dengan pemain baris sedangkan pihak kedua disebut pemain kolom. Anggapannya adalah bahwa setiap pemain (individual atau kelompok) mempunyai kemampuan untuk mengambil keputusan secara bebas dan rasional. Aturan-aturan dalam permainan meliputi : 1. langkah atau strategi yang dapat dipilih oleh tiap-tiap pemain, 2. informasi yang digunakan oleh setiap pemain yang memilih langkah atau strategi, 3. pembayaran, yang didefinisikansecara numerik, yang harus dipenuhi oleh setiap pemain setelah permainan selesai. Unsur-unsur dasar teori permainan sebagai berikut :
Didownload dari ririez.blog.uns.ac.id
1. Angka-angka dalam matriks pay off (matriks permainan), menunjukkan hasil-hasil (pay offs) dari strategi-strategi permainan yang berbeda-beda 2. Strategi permainan, adalah rangkaian kegiatan atau rencana yang menyeluruh dari seorang pemain sebagai reaksi atas aksi yang mungkin dilakukan oleh pemain lain yang menjadi pesaingnya 3. Aturan-aturan permainan, menggambarkan kerangka dengan mana para pemain memilih strategi mereka 4. Nilai permainan, adalah hasil yang diperkirakan per permainan atau pay off rata-rata dari sepanjang rangkaian permainan dimana kedua pemain mengikuti atau mempergunakan strategi mereka yang paling baik atau optimal. 5. Suatu strategi dikatakan dominan bila setiap pay off dalam strategi adalah superior terhadap setiap pay off yang berhubungan dalam suatu strategi alternative 6. Suatu strategi optimal adalah rangkaian kegiatan atau rencana yang menyeluruh yang menyebabkan seorang pemain dalam posisi yang menguntungkan tanpa memperhatikan kegiatan-kegiatan para pesaingnya 7. Tujuan dari model permainan adalah mengidentifikasikan strategi atau rencana optimal untuk setiap pemain Konsep-konsep teori permainan paling tidak sangat penting untuk beberapa hal berikut ini : a. Mengembangkan suatu kerangka untuk analisis pengambilan keputusan dalam situasisituasi persaingan (dan kadang-kadang kerja sama) b. Menguraikan suatu metode kuantitatif yang sistematis yang memungkinkan para pemain yang terlibat persaingan untuk memilih strategi-strategi yang rasional dalam pencapaian tujuan mereka c. Memberikan gambaran dan penjelasan fenomena situasi-situasi persaingan atau konflik II. Klasifikasi Permainan A. Berdasarkan jumlah langkah dan pilihan. 1. Permainan berhingga (finite game), yaitu suatu permainan yang mempunyai sejumlah langkah yang berhingga dengan setiap langkah yang memuat sejumlah pilihan yang berhingga pula. 2. Permainan tak berhingga (infinite game), yaitu permainan selain permainan berhingga. B. Berdasarkan jumlah pemain. 1. Permainan dua orang, yaitu permainan dengan jumlah pemain dua orang. 2. Permainan n orang, yaitu permainan dengan jumlah pemain n orang. C. Berdasarkan jumlah pembayaran. 1. Permainan berjumlah nol (zero sum game), yaitu suatu permainan dengan jumlah kemenangan kedua belah pihak sama dengan nol. Dengan kata lain, jumlah
Didownload dari ririez.blog.uns.ac.id
pembayaran yang diterima pemain yang menang sama dengan jumlah pembayaran yang dilakukan pemain yang kalah. Jika permainan ini dilakukan oleh dua orang maka disebut dengan permainan berjumlah nol dari dua orang (two person zero sum game), sedangkan jika permainan dilakukan oleh n orang maka disebut dengan permainan berjumlah nol dari n orang (n person zero sum game). Misalkan pi . pembayaran untuk pemain Pi ; i = 1, 2, ..., n maka Contoh :
Dalam persaingan perebutan jumlah pendengar antara dua radio swasta ABC dan PQR di kota X dengan asumsi tidak ada pendengar baru. Penambahan jumlah pendengar radio ABC, misalkan sejumlah 200 orang, merupakan kerugian bagi radio PQR karena pendengar radio PQR sejumlah 200 orang, pindah menjadi pendengar radio ABC. 2. Permainan berjumlah tidak nol (non zero sum game), yaitu permainan dengan total pembayaran dari masing-masing pemain pada akhir suatu permainan tidak sama dengan nol. Permainan ini dapat dilakukan oleh dua orang atau lebih. III. Matriks Pembayaran Matriks pembayaran (pay off matrix) adalah suatu tabel berbentuk segi empat dengan elemen-elemennya yang merupakan besarnya nilai pembayaran yang bersesuaian dengan strategi yang digunakan oleh kedua belah pihak. A. Matriks pembayaran untuk permainan bejumlah nol dari dua orang (two person zero sum game). Bentuk umumnya : Pemain Kedua (P2) i
Pemain Pertama (P1)
dengan :
1 2 3 . . . m
j
1
2
3
... ... ...
n
. . . . ...
m = banyak strategi yang dimiliki pemain P1 n = banyak strategi yang dimiliki pemain P2 ; i = 1, 2, ..., m dan j = 1, 2, ..., n = nilai pembayaran (didefinisikan secara numerik yang bersesuaian dengan strategi ke-i bagi pemain P1 dan strategi ke-j bagi pemain P2.
Didownload dari ririez.blog.uns.ac.id
Matriks pembayaran tersebut merupakan matriks pembayaran terhadap pemain pertama (P1) sehingga pemain P1 disebut pemain baris yang berusaha memaksimumkan pembayaran dan pemain P2 disebut pemain kolom yang berusaha meminimumkan pembayaran. Contoh : Terdapat persaingan perebutan pasar barang-barang elektronika dari pengusaha A dan pengusaha B dengan mengadakan kampanye promosi. Pengusaha A menggunakan tiga media promosi yaitu televisi, radio dan surat kabar. Sedangkan pengusaha B hanya menggunakan dua media promosi yaitu televisi dan radio. Dengan menggunakan informasi pasar yang diperoleh dari hasil riset pemasaran diperoleh data sebagai berikut : -
-
-
-
-
Bila pengusaha A melakukan promosi melalui media televisi dan pengusaha B juga melakukan promosi dengan media televisi makan pengusaha A akan memperoleh keuntungan Rp 5 juta. Bila pengusaha A melakukan promosi melalui media radio dan pengusaha B melakukan promosi dengan media televisi maka pengusaha A akan memperoleh keuntungan Rp 6 juta. Bila pengusaha A melakukan promosi melalui media surat kabar dan pengusaha B juga melakukan promosi dengan media televisi maka pengusaha A akan rugi sebesar Rp 5 juta. Bila pengusaha A melakukan promosi melalui media televisi dan pengusaha B melakukan promosi dengan media radio maka pengusaha A maupun B tidak akan menikmati keuntungan ataupun kerugian. Bila kedua pengusaha tersebut sama-sama menggunakan media radio maka pengusaha B akan memperoleh keuntungan sebesar Rp 2 juta. Pengusaha B juga akan memperoleh keuntungan sebesar Rp 3 juta bila berpromosi menggunakan radiodi saat pengusaha A berpromosi menggunakan media surat kabar.
Dari data tersebut dapat disajikan matriks pembayaran sebagai berikut : Pengusaha B
Pengusaha A
Televisi
Radio
Televisi
5
0
Radio
6
-2
Surat Kabar
-10
-3
Keterangan : =5 =6 = -10
berarti keuntungan pengusaha A sebesar Rp 5 juta, berarti keuntungan pengusaha A sebesar Rp 6 juta, berarti keuntungan pengusaha B sebesar Rp 10 juta,
Didownload dari ririez.blog.uns.ac.id
=0 = -2 = -3
berarti tidak yang untung maupun yang rugi, berarti keuntungan pengusaha B sebesar Rp 2 juta, berarti keuntungan pengusaha B sebesar Rp 3juta.
B. Matriks pembayaran untuk permainan berjumlah nol dari n orang (n person zero sum game). Sesuai dengan pengertian dalam teori permainan maka untuk jumlah pemain n>2 dibentuk menjadi 2 kelompok yang juga saling berhadapan (bersaing). Pengelompokan ini dikenal dengan istilah koalisi. Salah satu bentuk penyajian matriks pembayaran dapat dilihat pada contoh berikut ini. Misalkan terdapat tiga pemain yaitu A, B dan C. Pemain A memiliki dua strategi, misalkan A1 dan A2. Pemain B memiliki dua strategi, misalkan B1 dan B2. Pemain C memiliki tiga strategi, misalkan C1, C2 dan C3. Dengan data sebagai berikut :
A A1 A1 A1 A1 A1 A1 A2 A2 A2 A2 A2 A2
Strategi B B1 B1 B1 B2 B2 B2 B1 B1 B1 B2 B2 B2
C C1 C2 C3 C1 C2 C3 C1 C2 C3 C1 C2 C3
A -3 4 0 -6 2 4 1 -1 2 -3 -1 4
Pembayaran B 2 -5 2 4 -4 0 1 2 1 -2 1 -1
C 1 1 -2 2 2 -4 -2 3 -3 5 0 -3
Dengan jumlah pemain n = 3 maka terdapat tiga koalisi yang mungkin yaitu A melawan B dan C; A dan B melawan C; dan B melawan A dan C. Dengan demikian dapat dibuat tiga buah matriks pembayaran yang sesuai koalisi tersebut berdasarkan data diatas sebagai berikut. 1. Matriks pembayaran untuk A melawan B dan C. Pemain A dipandang sebagai pemain baris. Pemain B dan C
Pemain
A1
B1, C1
B1, C2
B1, C3
B2, C1
B 2 , C2
B2, C3
-3
4
0
-6
2
4
Didownload dari ririez.blog.uns.ac.id
A
A2
1
-1
2
-3
-1
4
2.
Matriks pembayaran untuk A dan B melawan C. Pemain A dan B dipandang sebagai pemain baris. Pemain C C1 C2 C3 A1, B1 -1 -1 2 Pemain A1, B2 -2 -2 4 A dan B A2, B1 2 -3 3 A2, B2 -5 0 3 3. Matriks pembayaran untuk B melawan A dan C. Pemain B dipandang sebagai pemain baris. Pemain A dan C
Pemain B
A1, C1
A1, C2
A1, C3
A2, C1
A2, C2
A2, C3
B1
2
-5
2
1
2
1
B2
4
-4
0
-2
1
-1
IV. Nilai Permainan Dari matriks pembayaran, kedua belah pihak yang bersaing dapat menentukan strategi optimum, yaitu strategi yang menjadikan seorang pemain berada dalam posisi terbaik tanpa memperhatikan langkah-langkah yang dipilih pemain pesaingnya. Dengan kaitan ini, yang disebut dengan nilai permainan (value of the game) adalah rata-rata pembayaran (ekspektasi perolehan) per permainan jika kedua pihak atau pemain yang saling bersaing tersebut melakukan strategi optimum (strategi terbaik) mereka. Dengan kata lain, nilai permainan adalah suatu pembayaran yang bersesuaian dengan strategi optimum (strategi terbaik) yang dilakukan oleh kedua pemain tersebut. Nilai permainan dapat dibedakan menjadi dua jenis yaitu : 1. suatu permainan dikatakan adil (fair) jika nilai permainannya sama dengan nol, 2. Suatu permainan dikatakan tidak adil (unfair) jika nilai permainannya tidak sama dengan nol.
PERMAINAN BERJUMLAH NOL DARI DUA ORANG 2.1 Pendahuluan Ada dua macam strategi optimum yang dapat digunakan untuk menentuan solusi optimum bagi kedua pihak yang saling bersaing yaitu :
Didownload dari ririez.blog.uns.ac.id
a. Strategi Murni (Pure Strategy) b. Strategi Campuran (Mixed Strategy) 2.2 Permainan dengan Strategi Murni Permainan dengan straegi murni adalah suatu permainan dengan posisi pilihan terbaiknya bagi setiap pemain dicapai dengan memilih satu strategi tunggal. Jadi strategi murni adalah strategi dimana setiap pemainnya hanya mempunyai tepat satu langkah yang terbaik. Dalam permainan dengan strategi murni, pemain pertama (pemain baris) yaitu pemain yang berusaha memaksimumkan kemenangan (keuntungan) yang minimum sehingga kriteria strategi optimumnya adalah kriteria maximin. Sedangkan pemain kedua (pemain kolom) yaitu pemain yang berusaha meminimumkan kekalahan (kerugian) yang maksimum sehingga kriteria strategi optimumnya adalah kriteria minimax. Apabila nilai maximin sama dengan nilai minimax maka permainan ini dapat diselesaikan dengan strategi murni di mana titik keseimbangan (equilibrium point) telah tercapai. Titik keseimbangan ini dikenal sebagai titik pelana (sadle point). Cara menentukan titik pelana adalah sebagai berikut : a. Untuk pemain pertama (P1) Apabila pemain pertama (P1) memilih strategi i maka dia yakin akan memenangkan apapun strategi yang dipilih atau digunakan oleh pemain kedua P2. Karena pemain pertama (P1) merupakan pemain yang berusaha memaksimumkan kemenangan (keuntungan) yang minimum maka dia akan memilih strategi yang akan memberikan nilai maksimum dari nilai yang minimum itu b. Untuk pemain kedua (P2) Pemain kedua (P2) akan berusaha menekan kemenangan bagi pemain pertama (P1) sampai sekecil mungkin sehingga jika pemain kedua (P2) memilih strategi j maka dia yakin bahwa kemenangan yang diperoleh pemain pertama (P1) tidak lebih dari apapun strategi yang dipilih atau digunakan oleh pemain pertama (P1). Karena pemain kedua (P2) merupakan pemain yang berusaha meminimumkan kekalahan (kerugian) yang
Didownload dari ririez.blog.uns.ac.id
maksimum maka dia akan memilih strategi yang akan memberikan nilai minimum dari nilai yang maksimum itu yaitu
.
Jika dalam suatu matriks pembayaran (aij) sedemikian rupa sehingga berlaku : = ars Maka matriks pembayaran tersebut disebut mempunyai titik pelana pada (r, s) dan elemen ars merupakan nilai permainan yang bersesuaian dengan strategi optimum bagi pemain pertama (P1), yaitu i = r dan strategi optimum bagi pemain kedua (P2), yaitu j = s. Contoh : Diketahui matriks pembayaran di bawah ini : Pemain P2 i Pemain P1
j
1
2
3
4
1
5
-4
-2
-1
2
3
1
-1
2
3
2
3
-3
-2
Tabel 1 Dalam permainan ini pemain P1 mengharapkan untuk memperoleh aij; i = 1, 2, 3 dan j = 1, 2, 3, 4 yang mungkin yang terbesar melalui pemilihan strategi i. Sementara itu pemain P2 berusaha menekan perolehan (kemenangan) pemain P1 menjadi sekecil mungkin dengan melalui pemilihan strategi j. Karena pemain P1 merupakan pemain yang berusaha memaksimumkan sedangkan pemain P2 merupakan pemain yang berusaha meminimumkan maka secara rasional P1 mengatakan : “Jika saya memilih i = 1 maka P2 akan memilih j = 2 sehingga dalam kasus ini saya menang sebesar 4. Bila saya memilih i = 2 maka P2 akan memilih j = 3 sehingga kemenangan saya hanya sebesar -1 dan bila saya memilih i = 3 maka maka P2 juga akan memilih j = 3 sehingga kemenangan saya hanya sebesar -3. Dari ketiga perolehan tersebut (-4, -1, -3) saya harus menentukan yang maksimum dari ketiganya itu dan pilihan terbaik saya adalah i = 2 yang menjadikan kemenangan saya sebesar -1”. Sedangkan pemain P2 akan mengatakan bahwa : “Saya harus membuat kemenangan P1 sekecil mungkin. Bila saya memilih j = 1 maka kemenangan pemain P1 yang paling besar adalah 5.
Didownload dari ririez.blog.uns.ac.id
Begitu juga secara berturut-turut bila saya memilih j = 2, 3, dan 4 maka P1 akan mendapatkan perolehan 3, -1, dan 2. Dengan demikian saya harus memilih j yang dapat meminimumkan perolehan P1 yang maksimum tersebut. Dengan begitu saya harus memilih j = 3 yang membuat kemenangan P1 hanya -1”. = a23 = -1. Jadi permainan dengan matriks pembayaran di atas mempunyai titik pelana pada (2, 3) dengan nilai permainan sebesar -1. Dengan demikian berarti bahwa pemain P2 memenangkan permainan sebesar 1(pemain P1 harus membayar sebesar 1 kepada pemain P2) dan strategi optimum bagi pemain P1 adalah i = 2 dan bagi pemain P2 adalah j = 3. Hal ini menunjukkan bahwa permainan dengan matriks pembayaran tersebut dapat diselesaikan dengan strategi murni. Untuk mempermudah penentuan apakah suatu permainan dengan matriks pembayaran tertentu mempunyai titik pelana atau tidak maka diberikan prosedur di bawah ini. 1. Perhatikan baik-baik matriks pembayaran yang ada 2. Pada setiap barisnya, tentukan nilai yang terkecil 3. Dari nilai-nilai terkecil dari setiap barisnya tersebut (yang dipilih sesuai langkah kedua) pilihlah nilai yang terbesar. 4. Pada setiap kolomnya, tentukan nilai yang terbesar. 5. Dari nilai-nilai terbesar dari setiap kolomnya tersebut (yang dipilih sesuai langkah keempat) pilihlah nilai yang terkecil. 6. Periksalah apakah nilai terbesar yang terpilih (dari langkah ketiga) sama dengan nilai terkecil yang terpilih (dari langkah kelima) -
Apabila sama maka permainan dengan matriks pembayaran tersebut mempunyai titik pelana dan nilai yang merupakan titik pelana tersebut merupakan nilai permainannya. Dari sini strategi dari masing-masing pemain dapat dilihat di mana letak nilai permainannya itu. Dengan demikian permainan ini dapat diselesakan dengan strategi murni.
-
Apabila tidak sama maka permainan dengan matriks pembayaran tersebut tidak mempunyai titik pelana dan harus diselesaikan dengan strategi campuran (mixed strategy)
Didownload dari ririez.blog.uns.ac.id
Contoh: Diberikan matriks pembayaran di bawah ini Pemain P2 i
j
1
2
3
4
Minimum tiap baris
Pemain P1
1
5
-4
-2
-1
-4
2
3
1
-1
2
-1
3
2
3
-3
-2
-3
Max tiap
5
3
-1
2
Maximum dari yang minimum
kolom
Minimum dari yang maximum Tabel 2
Kalau nilai minimum tiap barisnya diperhatikan maka nilai maksimum dari yang minimum tersebut sebesar -1. Demikian juga kalau nilai maksimum dari setiap kolomnya diperhatikan maka nilai minimum dari yang maksimum tersebut sebesar -1 juga. Terlihat bahwa = -1 Jadi permainan itu dapat diselesaikan dengan strategi murni, yaitu : -
Strategi optimum bagi pemain P1 adalah i = 2, dan
-
Strategi optimum bagi pemain P2 adalah j = 3 dengan
-
Nilai permainan sebesar -1.
Definisi dan teorema keberadaan titik pelana sebagai berikut : Definisi 1 Pandang f(X,Y) merupakan fungsi berharga real dari dua vektor X dan
dan Y
masing-masing merupakan ruang Euclid berdimensi n dan m. Suatu titik (
dengan ),
Didownload dari ririez.blog.uns.ac.id
dan f(X,
2.3
) f(
dikatakan ) f(
merupakan
suatu
titik
pelana
dari
f
(X,Y)
jika
Y)
Permainan dengan Strategi Campuran Dalam permainan di mana permainan tersebut tidak mempunyai titik pelana maka para pemain akan bersandar kepada apa yang disebut sebagai strategi campuran. Hal ini berarti pemain pertama akan memainkan setiap strategi baris dengan proporsi waktu (probabilitas) tertentu. Oleh karena itu dalam suatu permainan yang diselesaikan dengan strategi campuran, strategi dari setiap pemain akan mempunyai probabilitas yang menunjukkan proporsi waktu atau banyaknya bagian yang dipergunakan untuk melakukan strategi tersebut. Jadi tugas dari setiu ap pemain adalah menentukan proporsi waktu (probabilitas) yang diperlukan untuk menentukan strateginya. Untuk lebih jelasnya dapat diperhatikan ilustrasi permainan matriks pembayaran 2 x 2 di bawah ini.
Pemain P2 i Pemain P1
j
1
2
1
1
5
2
6
3
Tabel 3
Matriks pembayaran dari permainan berjumlah nol dari dua orang di atas tidak mempunyai titik pelana sehinggaa strategi murni tidak dapat dipergunakan. Dengan demikian tugas para pemain adalah menentukan proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada baris bagi Pemain P1 dan strategi komlom bagi Pemian P2. -
Bagi Pemain P1 Misalnya x, dengan 0 ≤ x ≤ 1 adalah proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada baris pertama maka proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada baris kedua adalah 1-x sehingga jumlah semua proporsi waktu yang diperlukan untuk memainkan strateginya adalah x+1-x =1.
-
Bagi Pemain P2
Didownload dari ririez.blog.uns.ac.id
Misalnya y, dengan 0 ≤ y ≤ 1 adalah proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada kolom pertama maka proporsi waktu (probabilitas) yang diperlukan untuk memainkan strategi pada kolom kedua adalah 1-y sehingga jumlah semua proporsi waktu yang diperlukan untuk memainkan strateginya adalah y+1-y =1. y
1-y
1
2
X
1
1
5
1-x
2
6
3
Tabel 4
Dengan demikian tugas dari masng-masing pemain adalah menentukan besarnya pecahan yang tidak diketahui x dan y dimana pemain pertama P1 menginginkan untuk mencari strategi yang akan memaksimumkan kemenangannya (atau meminimumkan kekalahannya) tanpa memperhatikan langkah yang dilakukan oleh pihak lawan (pesaing), yaitu pemain P2. Secara logika, pemain pertama P1 ingin membagi permainannya di antara baris-barisnya sedemikian rupa sehingga kemenangan atau kekalahan harapannya (expected) di saat pemain kedua. Sudah barang tentu pemain kedua P2 (yang diasumsikan mempunyai kecerdasan yang sama dengan dengan pemain pertama P1) akan mengikuti logika yang serupa di dalam penghitungan proporsi waktu yang diperlukan untuk setiap kolomnya seperti yang dilakukan oleh pemain pertama P1, yaitu pemain kedua P2 akan membagi waktu bermainnya di antara kolom-kolomnya sedemikian rupa sehingga kemenangan atau kekalahan harapannya (expected) di saat pemain P1 memainkan baris kesatu akan sama dengan kemenangan atau kekalahan harapannya (expected) di saat pemain P1 memainkan baris kedua. Jadi strategi campuran adalah strategi dengan setiap pemain menggunakan distribusi probabilitas dalam memilih strateginya. 2.4 Aturan Dominansi Sebelum menyelesaikan suatu permainan perlu dipertinmbangkan apakah ada baris atau kolom dalam matriks pembayarannya yang tidak efektif pengaruhnya di dalam penentuan strategi optimum dan nilai permainan. Bila ada maka baris atau kolom yang seperti itu bisa dihapus atau
Didownload dari ririez.blog.uns.ac.id
tidak dipakai,Hal itu berarti bahwa probabilitas untuk memilih strategi sesuai baris atau kolom tersebut sama dengan nol. Dengan demikian ukuran matriks pembayaran yang tersisa akan lebih kecil. Hal ini akan lebih mempermudah untuk menyelesaikannya. Aturan demikian ini dinamakan aturan dominansi. a. Aturan dominansi bagi pemain pertama P1 (pemain baris). Karena pemain P1 (pemain baris) merupakan pemain yang berusaha untuk memaksimumkan kemenangan/perolehannya maka aturan dominansinya adalah sebagai berikut : bila terdapat suatu baris dengan semua elemen dari baris tersebut adalah sama (sekolom) dari baris yang lain maka baris tersebut dikatakan didominansi dan baris itu telah dihapus. b. Aturan dominansi bagi pemain kedua P2 (pemain kolom). Karena pemain kedua P2 merupakan pemain yang berusaha untuk meminimumkan kekalahan/kerugiannya maka aturan dominansinya adalah sebagai berikut : bila terdapat suatu kolom dengan semua elemen dari kolom tersebut adalah sama atau lebh besar dari elemen dalam posisi yang sama (sebaris) dari kolom yang lain maka kolom tersebut dikatakan didominansi dan kolom itu dapat dihapus. Aturan dominansi ini dapat diulang lagi jika masih ada baris atau kolomnya yang didominansi oleh baris atau kolom yang lain. Dan ini memungkinkan matriks pembayaran semula akan tersisa menjadi matriks pembayaran dengan satu elemen saja. Bila hal ini dapat terjadi maka permainannya dapat diselesaikan dengan strategi murni dengan nilai permainan sesuai dengan elemen yang tersisa tersebut. Tetapi tidak semua permainan yang mempunyai titik pelana dapat diselesaikan dengan aturan dominansi yang berulangulang tersebut. Contoh : Diberikan matriks pembayaran di bawah ini Pemain P2 1
2
3
4
5
1
4
-9
7
-2
1
2
2
-8
4
-4
0
j
i
Pemain P1
Didownload dari ririez.blog.uns.ac.id
3
-2
8
9
2
3
4
5
1
8
0
2
Tabel 5
-
Bagi pemain P1 Perhatikan elemen-elemen pada baris kesatu, kedua, dan keempat. Untuk setiap j ; j = 1, 2, 3, 4, 5 berlaku a1j
2
3
4
5
3
-2
8
9
2
3
4
5
1
8
0
2
j
i Pemain P1
Tabel 6
Sekarang pandang matriks pembayaran tersisa dari tabel di atas. Untuk pemain P1 sudah tidak ada baris yang dapat didominansi oleh baris yang lain. -
Bagi pemain P2 Pada kolom ke 2,3,4, dan 5 untuk setiap i; i = 3, 4 berlaku ai2>ai4, ai3>ai4. Dengan demikian pemain P2 tidak akan memilih strategi sesuai kolom 2, 3, dan 5 apapun pilihan dari P1. Dari sini maka kolom ke 2,3,5 dapat dihapus sehingga matriks pembayarannya menjadi : Pemain P2 1
4
Didownload dari ririez.blog.uns.ac.id
Pemain P1
3
-2
2
4
5
0
Tabel 7
Pada matriks pembayaran tersisa pada tabel di atas dapat diperiksa lagi apakah masih ada baris atau kolom yang memungkinkan untuk didominansi. Ternyata tidak ada maka aturan dominansi tidak dapat diulang lagi. Tampak bahwa matriks pembayaran pada tabel 7 akan lebih mudah untuk diselesaikan karena ukuran matriks pembayaran ini lebih kecil bila dibandingkan dengan ukuran matriks pembayaran semula pada tabel 7. Di dalam memeriksa apakah aturan dominansi dapat digunakan atau tidak, tidak harus dimulai dari pemain P1 dahulu tetapi bisa dimulai sembarang. METODE PENYELESAIAN 1. Metode Aljabar Metode aljabar dapat digunakan untuk menyelesaikan suatu permainan berjumlah nol dari dua orang dengan masing-masing pemain mempunyai dua pilihan strategi (langkah). Matriks pembayaran dari permainan berjumlah nol dari dua orang dengan masing-masing pemain mempunyai dua pilihan strategi sebagai berikut. Tabel 1. Matriks pembayaran dari permainan berjumlah nol dari dua orang Pemain P2 i Pemain P1
j
1
2
1
a11
a12
2
a21
a22
Prinsip untuk menggunakan metode aljabar untuk menyelesaikan permainan ini adalah bahwa kedua pemain P1 dan P2 membagi waktu (sesuai proporsinya) yang diperlukan untuk memilih suatu strategi. Misalkan x = Proporsi waktu yang digunakan oleh pemain P1 untuk memainkan strategi pertama. Berarti bahwa:
Didownload dari ririez.blog.uns.ac.id
1 - x = Proporsi waktu yang digunakan oleh pemain P1 untuk memainkan strategi kedua. Misalkan y = Proporsi waktu yang digunakan oleh pemain P2 untuk memainkan strategi pertama. Berarti bahwa: 1 - y = Proporsi waktu yang digunakan oleh pemain P2 untuk memainkan strategi kedua. Matriks pembayaran menjadi: Tabel 2. Matriks pembayaran Pemain P2
i Pemain P1
•
j
Y
1-y
1
2
X
1
a11
a12
1-x
2
a21
a22
Bagi pemain P1 Karena dasar pemikiran pemain P1 adalah berusaha memaksimumkan kemenangannya memaksimumkan
maka
ia
merancang
kemenangan
suatu
strategi
(meminimumkan
yang
dapat
kekalahan)
tanpa
memperhatikan langkah balasan yang dilakukan oleh pihak lawannya (P2). Kemenangan harapan bagi pemain P1 dapat dilihat pada tabel berikut. Tabel 3. Kemenangan harapan pemain P1 Ketika P2 memainkan Ketika P2 memainkan strategi ke1
strategi ke 2
P1 memainkan strategi P1 memenangkan a11 P1 memenangkan a12 ke 1, x kali
unit, x kali
unit, x kali
----------------
+
+
P1 memainkan strategi P1 memenangkan a21 P1 memenangkan a22 ke 2, (1-x) kali Total
unit, (1-x) kali
kemenangan x a11 + (1-x) a21
harapan bagi P1
unit, (1-x) kali x a12 + (1-x) a22
Didownload dari ririez.blog.uns.ac.id
Besarnya bilai x ditentukan dengan menggunakan prinsip pemikiran pemain P1, yaitu bahwa total kemenangan harapan P1 ketika pemain P2 memainkan strategi ke 1 sama dengan total kemenangan harapan P1 ketika pemain P2 memainkan strategi ke 2. Dari tabel 3 diperoleh bahwa: x a11 + (1-x) a21 = x a12 + (1-x) a22 x (a11 + a22 – a12 – a21) = a22 – a21 x = a22 – a21 = x 1* a11 + a22 + a12 – a21 a 22 − a 21 a11 − a12 1− × = 1− = = ×2 * a11 + a 22 − a12 − a 21 a11 + a 22 − a12 − a 21 Jadi strategi optimum pemain P1 adalah X* = [x1*,x2*] •
Bagi pemain P2 Pemain
P2
bermaksud
memaksimumkan
kemenangan
atau
meminimumkan kekalahannya tanpa memperhatikan strategi yang dimainkan oleh pemain P1. Tabel 4. Kekalahan harapan pemain P2 (rata-rata kekalahan P2) Ketika memainkan
P2 Ketika memainkan
P2 Total kekalahan
strategi ke 1, y strategi ke 2, (1-y) harapan bagi P2 kali
kali
P1
P2 kalah a11 unit, y P2 kalah a12 unit, y a11 + (1-y) a12
memainkan
kali
(1-y) kali
strategi ke 1 P2 kalah a21 unit, y P2 kalah a22 unit, y a21 + (1-y) a22 P1 memainkan strategi ke 2
kali
(1-x) kali
Didownload dari ririez.blog.uns.ac.id
Dari tabel 4 diperoleh bahwa y a11 + (1-y) a12 = y a21 + (1-y) a22 y (a11 + a22 – a12 – a21) = a22 – a12 y = a22 – a12 = y1* a11 + a22 + a12 – a21 a 22 − a12 a11 − a 21 1− y = 1− = = y2 * a11 + a 22 − a12 − a 21 a11 + a 22 − a12 − a 21 Jadi strategi optimum pemain P2 adalah Y* = [y1*,y2*] Dengan demikian strategi optimum bagi masing-masing pemain telah diperoleh, yaitu X* = [x1*,x2*] dan Y* = [y1*,y2*]. Penghitungan nilai permainan dipandang dari pemain P1 maupun P2 a. Jika nilai permainan dihitung menurut pandangan pemain P1 maka perlu diperhatikan: i. Selama pemain P2 menggunakan y1* waktunya untuk memainkan (strategi) kesatu, pemain
P1 menang a11 unit sebanyak x1* kali
dan pemain P1 menang a21 unit sebanyak x2* kali. ii. Selama pemain P2 menggunakan y2* waktunya untuk memainkan kolom (strategi) kedua, pemain P1 menang a12 unit sebanyak x1* kali dan pemain P1 menang a22 unit sebanyak x2* kali. Nilai permainannya sama dengan total kemenangan harapan bagi pemain P1 yaitu: v*=y1* [x1* a11 + x2* a21] + y2* [x1* a12 + x2* a22] b. Jika nilai permainan dihitung menurut pandangan pemain P2 maka perlu diperhatikan: i. Selama pemain P1 menggunakan x1* waktunya untuk memainkan (strategi) kesatu, pemain
P2 akan kalah a11 unit y1* kali dan
pemain P2 kalah a12 unit y2* kali. ii. Selama pemain P1 menggunakan x2* waktunya untuk memainkan kolom (strategi) kedua, pemain P2 akan kalah a12 unit y1* kali dan pemain P2 kalah a22 unit y2* kali.
Didownload dari ririez.blog.uns.ac.id
Nilai permainannya sama dengan total kekalahan harapan bagi pemain P2 yaitu: v*=x1* [y1* a11 +y2* a21] + x2* [y1* a12 +y2* a22] Contoh: Diberikan matriks pembayaran sebagai berikut. Akan dicari strategi optimum untuk P1 dan P2. Tabel 5. Matriks pembayaran Pemain P2 i Pemain P1
j
1
2
1
5
3
2
1
4
Misalkan x = Proporsi waktu yang digunakan oleh pemain P1 yang digunakan untuk memainkan strategi ke 1. y = Proporsi waktu yang digunakan oleh pemain P2 untuk memainkan strategi pertama.
Matriks pembayaran menjadi: Tabel 6. Matriks pembayaran Pemain P2
i Pemain P1
•
j
Y
1-y
1
2
X
1
5
3
1-x
2
1
4
Bagi pemain P1 Tabel kemenangan harapan bagi pemain P1 dapat dilihat pada tabel berikut.
Didownload dari ririez.blog.uns.ac.id
Tabel 7. Kemenangan harapan bagi P1 Ketika P2 memainkan Ketika P2 memainkan strategi ke1 P1 memainkan strategi P1
strategi ke 2
memenangkan
5 P1
memenangkan
ke 1, x kali
unit, x kali
unit, x kali
----------------
+
+
P1 memainkan strategi P1 ke 2, (1-x) kali Total
memenangkan
unit, (1-x) kali
kemenangan 5x + 1(1-x)
1 P1
memenangkan
3
4
unit, (1-x) kali 3x + 4(1-x)
harapan bagi P1 Bagi pemain P1 agar dapat mencapai strategi optimum makaperlu menyamakan kemenangan harapan yang diperoleh ketika pemain P2 memainkan strategi ke 1 yaitu [5x+(1-x)] dengan kemenangan harapan yang diperoleh ketika pemain Dari tabel 3 diperoleh bahwa: 5x + (1-x) = 3x + 4(1-x) 5x – x – 3x+4x = 4-1 5x =3 x = 3/5 = x1* Karena x2* = 1- x maka x2* = 1- 3/5 = 2/5 Jadi strategi optimum bagi pemain P1 dicapai bila ia menggunakan 3/5 waktunya untuk memainkan strategi ke 1 dan 2/5 waktunya untuk memainkan strategi ke 2. Jadi strategi optimum pemain P1 adalah X* = [3/5,2/5] •
Bagi pemain P2 Tabel kekalahan harapan bagi pemain P2 dapat dilihat pada tabel berikut. Tabel 8. Kekalahan harapan pemain P2 (rata-rata kekalahan P2) Ketika memainkan
P2 Ketika memainkan
P2 Total kekalahan
strategi ke 1, y strategi ke 2, (1-y) harapan bagi P2 kali
kali
Didownload dari ririez.blog.uns.ac.id
P1
P2 kalah 5 unit, y P2 kalah 3 unit, (1- 5y + 3(1-y)
memainkan
kali
y) kali
strategi ke 1 P2 kalah 1 unit, y P2 kalah 4 unit, (1- y + 4(1-y) P1
kali
x) kali
memainkan strategi ke 2 Agar pemain P2 dapat mencapai strategi optimum ia perlu menyamakan rata-rata kekalahan (kekalahan harapan) yang dideritanya ketika pemain P1 memainkan strategi ke 1, yaitu [5y+3(1-y)] dengan rata-rata kekalahan yang diderita ketika pemain P1 memainkan strategi ke 2 yaitu [y+4(1-y)]. Dari tabel 4 diperoleh bahwa 5y + 3(1-y)= y + 4(1-y) 5y – 3y – y + 4y = 4 – 3 5y = 1 y = 1/5 = y1*. Karena y2* = 1- y maka y2* = 1 – 1/5 = 4/5. Jadi strategi campuran optimum bagi pemain P2 dicapai bila ia menggunakan 1/5 waktunya untuk memainkan strategi ke 1 dan 4/5 waktunya untuk memainkan strategi ke 2. Jadi strategi optimum pemain P2 adalah Y* = [1/5,4/5] Dengan demikian strategi optimum bagi masing-masing pemain telah diperoleh, yaitu X* = [3/5,2/5] dan Y* = [1/5,4/5]. Penghitungan nilai permainan dipandang dari pemain P1 maupun P2 a. Jika nilai permainan dihitung menurut pandangan pemain P1 maka perlu diperhatikan: i. Selama pemain P2 menggunakan 1/5 waktunya untuk memainkan strategi kesatu, pemain P1 menang 5 unit sebanyak 3/5 kali dan 1 unit sebanyak 2/5 kali.
Didownload dari ririez.blog.uns.ac.id
ii. Selama pemain P2 menggunakan 4/5 waktunya untuk memainkan strategi kedua, pemain P1 menang 3 unit sebanyak 3/5 kali dan 4 unit sebanyak 2/5 kali. Nilai permainannya sama dengan total kemenangan harapan bagi pemain P1 yaitu: v*= 1/5 [5(3/5) + 1(2/5)] + 4/5[3(3/5) + 4(2/5)] = 1/25 [15 + 2 + 36 + 32] = 85/25 = 17/5 = nilai permainan Ini berarti bahwa bila pemain P1 bermain dengan menggunakan strategi optimumnya maka ia dapat mengharapkan kemenangan harapan sebesar 17/5 unit per permainan. b. Jika nilai permainan dihitung menurut pandangan pemain P2 maka perlu diperhatikan: i. Selama pemain P1 menggunakan 3/5 waktunya untuk memainkan strategi kesatu, pemain P2 akan kalah 5 unit 1/5 kali dan 3 unit 4/5 kali. ii. Selama pemain P1 menggunakan 2/5 waktunya untuk memainkan strategi kedua, pemain P2 akan kalah 1 unit sebanyak 1/5 kali dan 4 unit 4/5 kali. Nilai permainannya sama dengan total kekalahan harapan bagi pemain P2 yaitu: v*= 3/5 [5(1/5) + 3(4/5)] + 2/5[1(1/5) + 4(4/5)] = 1/25 [ 15 + 36 + 2 + 32] = 85/25 = 17/5 = nilai permainan. Karena nilai permainan bertanda positif maka pemain P1 dinyatakan sebagai pemenang dengan rata-rata kemenangan per permainan sebesar 17/5 unit. c. Prosedur penghitungan nilai permainan dapat disederhanakan menjadi: • Pemain P1 memainkan strategi yang telah dibentuk sedemikian rupa sehingga kemenangan yang diperoleh ketika pemain P2 memainkan strategi kesatu sama
Didownload dari ririez.blog.uns.ac.id
dengan kemenangan yang diperolehnya ketika pemain P2 memainkan strategi kedua. • Alasan tersebut juga dapat diterapkan pada harapan kemenangan pemain P2. Tabel 9. Kemenangan harapan pemain P2 Pemain P2 3
Pemain P1
1
y1*
y2*
x1*
a11
a12
x1*
x2*
a21
a22
x2*
y1*
y2*
2
4 Dengan X* = [x1*, x2*] adalah strategi optimum pemain P1. Y* = [y1*, y2*] adalah strategi campuran optimum pemain P2. Dari tabel 8 terdapat 4 pasang perkalian yang mungkin akan memberikan nilai sama dan merupakan nilai permainan adalah: 1. v* = x1* a11 + x2* a21
berdasarkan kemenangan harapan bagi pemain P1
2. v* = x1* a12 + x2* a22 3. v* = y1* a11 + y2* a21
berdasarkan kemenangan harapan bagi pemain P2
4. v* = y1* a21 + y2* a22 contoh: Pemain P2 3
Pemain P1
1
3/8
5/8
1/4
-2
4
1/4
3/4
3
1
3/4
3/8
5/8
2
4 terdapat 4 pasang perkalian yang mungkin akan memberikan nilai sama dan merupakan nilai permainan adalah:
Didownload dari ririez.blog.uns.ac.id
5. v* = 1/4 (-2) + 3/4 (3) = 7/4 berdasarkan kemenangan harapan bagi pemain P1 6. v* = 1/4 (4) + 3/4 (1) = 7/4
ketika pemain P2 memainkan kolom 1 atau kolom 2.
7. v* = 3/8 (-2) + 5/8 (4) = 7/4
berdasarkan kemenangan harapan bagi pemain P2
8. v* = 3/8 (3) + 5/8 (1) = 7/4
ketika pemain P1 memainkan baris 1 atau baris 2.
d. Menghitung nilai permainan dengan menggunakan probabilitas dan nilai harapan permainan Pemain P2
Pemain P1
y1*
y2*
i j
1
2
X1*
1
a11
a12
X2*
2
a21
a22
Probabilitas bagi pemain P1 adalah [x1*,x2*] dan probabilitas P2 adalah [y1*,y2*] Penghitungan probabilitas untuk setiap pembayaran: Strategi penghasil
Probabilitas
Nilai
pembayaran
pembayaran
harapan
a11
Baris 1, kolom 1
P11= x1* x y1*
a11 x P11
a12
Baris 1, kolom 2
P12= x1* x y2*
a12 x P12
a21
Baris 2, kolom 1
P21= x2* x y1*
a21 x P21
a22
Baris 2, kolom 1
P22= x2* x y2*
a22 x P22
Jumlah
1
v*
Pembayaran
Nilai harapan permainan v* =
2 2 ∑ ∑ a P ij ij i =1 j =1
= a11P11+a12P12+a21P21+a22P22 Contoh:
Didownload dari ririez.blog.uns.ac.id
Pemain P2
Pemain P1
3/8
5/8
1/4
-2
4
3/4
3
1
Penghitungan probabilitas untuk setiap pembayaran: Strategi penghasil
Probabilitas
pembayaran
pembayaran
-2
Baris 1, kolom 1
P11= 1/4 x 3/8 = 3/32
a11 x P11= -6/ 32
4
Baris 1, kolom 2
P12= 1/4 x 5/8 = 5/32
a12 x P12 = 20/32
3
Baris 2, kolom 1
P21= 3/4 x 3/8 = 9/32
a21 x P21= 27/32
1
Baris 2, kolom 1
P22= 3/4 x 5/8 =15/32
a22 x P22 = 15/32
Jumlah
1
7/4
Pembayaran
Nilai harapan
Nilai permainan = nilai harapan permainan v* = 7/4
METODE GRAFIK Yaitu metode penyelesaian permainan dengan menggunakan grafik. Metode grafik ini dapat digunakan untuk menyelesaikan kasus permainan di antaranya adalah sebagai berikut: a. Matriks berukuran 2 x n Matriks pembayaran dari permainan berukuran 2 x n adalah Pemain P2
j
y1
y2
1
2
… …
yn n
i
Pemain P1 x1
1
a11
a12
…
a1n
Didownload dari ririez.blog.uns.ac.id
x2 = 1 – x1
2
dan
Dengan
a21
a22
…
a2n
, xi ≥ 0 dan y1 ≥ 1 untuk setiap i, j.
Pembayaran harapan yang berkaitan dengan strategi murni pemain P2. Strategi murni
Pembayaran harapan pemain 1
pemain 2 1
a11.x1 + a21.(1 – x1) = (a11 – a21).x1 + a21 a12.x1 + a22.(1 – x1) = (a12 – a22).x1 + a22
2
a1n.x1 + a2n.(1 – x1) = (a1n – a2n).x1 + a2n
n
Tabel di atas menunjukkan bahwa pembayaran harapan (rata-rata pembayaran) bagi pemain P1 bervariasi secara linear dengan x1. Berdasarkan kriteria minimax untuk pemain P1 harus memilih nilai x1 yang akan memaksimalkan pembayaran harapan (rata-rata pembayaran) minimumnya (prinsip maximin). Hal ini dapat dilakukan dengan cara menggambarkan garisgaris lurus di atas sebagai fungsi dari x1. Sumbu vertikal menunjukkan pembayaran harapan (rata-rata pembayaran) dan sumbu horizontal menunjukkan variasi dari x1 (0 ≤ x1 ≤ 1). Dalam grafik ini dicari titik maximinnya. Contoh: Diberikan matriks pembayaran sebagai berikut. Akan dicari strategi optimum untuk P1 dan P2. P2 P1
y1
y2
y3
-1 5
1 3
3 -3
j i x1 x2 = 1-x1 Penyelesaian
Didownload dari ririez.blog.uns.ac.id
x1 = probabilitas pemain 1 memainkan strategi kesatu x2 = probabilitas pemain 2 memainkan strategi kedua yj = probabilitas pemain 2 memainkan strategi ke-j maka pembayaran harapan bagi pemain P1 yang berkaitan dengan strategi murni P2 adalah Strategi murni
Pembayaran harapan P1
P2 1
-x1 + 5(1-x1) = -6.x1 + 5
2
x1 + 3(1- x1) = -2. x1 + 3
3
3. x1 - 3(1-x1) = 6. x1 - 3
Ketiga garis lurus fungsi dari x1 tersebut dapat digambarkan pada grafik 6 5 4 3 2
garis 1
1
garis 2
0 -1 0
garis 3 0.2
0.4
0.6
0.8
1
1.2
-2 -3 -4
Menurut kriteria minimax P1, harus memilih nilai x1 yang akan memaksimalkan pembayaran harapan minimumnya yaitu v* = max(x1) { min (-6x1 + 5, -2x1 + 3
, 6x1 - 3)}
karena hanya garis (1) dan (3) yang melalui titik maximin maka v* = max(x1) { min (-6 x1 + 5, 6 x1 - 3)} dari sini nilai optimum x1 titik potong garis (1) dengan garis (3) -6 x1 + 5 = 6 x1 – 3 12 x1 = 8 x1 = x1* = 2/3 x2* = 1- x1* = 1/3
Didownload dari ririez.blog.uns.ac.id
jadi strategi campuran optimum P1 X* = [2/3, 1/3] Nilai permainan yang diperoleh v*= -6x1* + 5 = -6. 2/3 + 5 = 1 atau v* = 6x1* – 3 = 1 selanjutnya akan dihitung strategi optimum pemain P2 . Nilai yang optimum bagi pemain pembayaran P2 dapat diperoleh dari nilai pembayaran harapan permainan, yaitu: m
v* = ∑ sehingga
i =1
n
∑a x j =1
ij 2
* yj *
y1*(-6x1* + 5 ) + y2* (-2x1* + 3) + y3* (6x1*-3) = v* y1* + 5/3 y2* + y3* = 1 y1* + y3* = 1 (y2* = 0 karena tidak melalui titik maximin dimana v* > 1) Jadi strategi kedua pemain P2 tidak dimainkan, sehingga matriks pembayarannya menjadi P1 P2
j
y1
y3=1-y1
i x1 x2
-1 5
3 -3
maka pembayaran harapan bagi pemain P2 yang berkaitan dengan strategi murni P1 adalah
Strategi murni P1
Pembayaran harapan P2
1
-y1 + 3(1-y1) = 3 - 4y1
2
5y1 - 3(1-y1) = 8x1 - 3
Kedua garis lurus fungsi dari y1 tersebut dapat digambarkan pada grafik
Didownload dari ririez.blog.uns.ac.id
Karena P2 menginginkan untuk meminimumkan kekalahan yang maksimum maka pemain P2 harus memilih nilai y1 yang akan meminimumkan pembayaran harapan yang maksimum, yaitu: v* = min(y1) { max (3 – 4y1, 8y1 - 3)} karena kedua garis (1) dan (2) melalui titik minimax maka nilai optimum y1* adalah titik potong kedua garis tersebut, diperoleh y1 = y1* = ½ karena y1 + y3 = 1 maka y3* = 1 – y1* = ½ jadi strategi optimum P2 y* = [ ½ , 0, ½], dan nilai permainan v* = 1
CONTOH 15 b. Matriks berukuran m x 2 Matriks pembayaran dari permainan berukuran 2 x n adalah Pemain P2
J
y1
y2 = 1 – y1
1
2
i Pemain P1
x1
1
a11
a12
x2
2
a21
a22
.
.
.
.
Didownload dari ririez.blog.uns.ac.id
.
.
.
xm
m
am1
. am2
Pembayaran harapan yang berkaitan dengan strategi murni pemain P2 Strategi murni pemain 1
Pembayaran harapan pemain 2 (P2)
1 2 . . . M
(a11 – a21)y1 + a12 (a12 – a22)y1 + a22 . . . (am1 – am2)y1 + am2
Tabel di atas menunjukkan bahwa pembayaran harapan (rata-rata pembayaran) bagi pemain P2 bervariasi secara linear dengan y1. Berdasarkan kriteria minimax untuk pemain P2 harus memilih nilai y1 yang akan meminimumkan pembayaran harapan (rata-rata pembayaran) maksimumnya (prinsip minimax). Hal ini dapat dilakukan dengan cara menggambarkan garisgaris lurus di atas sebagai fungsi dari y1. Sumbu vertikal menunjukkan pembayaran harapan (rata-rata pembayaran) dan sumbu horizontal menunjukkan variasi dari y1 (0 ≤ y1 ≤ 1). Dalam grafik ini dicari titik minimaxnya. Teori Dualitas Yaitu salah satu metode penyelesaian yang dapat digunakan untuk menghitung strategi optimum pemain yang mempunyai lebih dari dua pilihan strategi. Matriks pembayarannya dapat disajikan sebagai berikut y1
y2
…
yn
Didownload dari ririez.blog.uns.ac.id
x1 x2 . . . xm
a11 a12 …. a1n a21 a22 …. a2n am1 am2 …. amn
v
v
v v v
v
Hal ini berdasarkan pada: a. Prinsip pemain P1 Memaksimumkan v (nilai permainan) sedemikian rupa sehingga ≥ v ; j = 1, 2, …, n Dengan
, xi ≥ 0 ; untuk setiap i dan
b. Prinsip pemain P2 Meminimumkan v (nilai permainan) sedemikian rupa sehingga ≥ v ; i = 1, 2, …, n Dengan
, yj ≥ 0 ; untuk setiap j dan
Permainan Berjumlah Nol dari n Orang Ada dua asumsi yang dipakai di dalam pembahasan permainan berjumlah nol dari n orang ini, yaitu: 1. Setiap pemain dalam permainan ini dapat berkomunikasi dan berunding dengan pemain yang lain untuk membuat suatu perjanjian yang mengikat. Jika suatu kelompok menyatakan untuk bekerja sama maka mereka membentuk koalisi. Suatu koalisi adalah persetujuan di antara beberapa pemain untuk mengkoordinasikan strategi mereka yang ada di dalam suatu cara sedemikian sehingga seluruh anggota koalisi itu beruntung.
Didownload dari ririez.blog.uns.ac.id
2. Para pemain dapat membuat pembayaran sampingan (side payment) yaitu transfer pembayaran di antara pemain. Setelah koalisi memaksimumkan total pembayarannya, pembayaran untuk para koalisi itu diatur dengan pembuatan pembayaran sampingan. Banyak cara yang mungkin untuk mengelompokkan ke dalam koalisi adalah 2n-1 Contoh : Diberikan permainan berjumlah nol dari 3 orang (A, B, C) masing-masing pemain mempunyai 2 pilihan strategi. A mempunyai strategi : X1, X2 B mempunyai strategi : Y1, Y2 C mempunyai strategi : Z1, Z2 Diperoleh matriks pembayaran Strategi
Pembayaran
A
B
C
A
B
C
X1 X1 X1 X1 X2 X2 X2 X2
Y1 Y1 Y2 Y2 Y1 Y1 Y2 Y2
Z1 Z2 Z1 Z2 Z1 Z2 Z1 Z1
-1 -3 0 3 -2 0 -1 2
1 2 2 -2 0 -1 -2 1
0 1 -2 -1 -2 1 3 -3
koalisi yang mungkin terbentuk adalah grup I
grup II
1. A
BC
2. B
AC
3. C
AB
Diperoleh matriks pembayaran dari tiap koalisi sebagai berikut
Didownload dari ririez.blog.uns.ac.id
•
Matriks pembayaran A melawan B, C
X1 X2
•
Y1, Z1
Y1, Z2
-1 -2
-3 0
0 -1
Y2, Z2 3 -2
Matriks pembayaran B melawan A, C X1, Z1 Y1 Y2
•
Y1, Z1
1 2
X1, Z2 2 -2
X2, Z1 0 -2
X2, Z2 -1 1
Matriks pembayaran C melawan A, B X1, Y1 Z1 Z2
0 1
X1, Y2 -2 -1
X2, Y1
X2, Y2
2 1
3 -3
Dengan metode grafik didapatkan : 1. Nilai permainan untuk A yaitu V(A) = -3/2 dan V(BC)= 3/2 2. Nilai permainan untuk B yaitu V(B) = -1/2 dan V(AC)= 1/2 3. Nilai permainan untuk C yaitu V(C) = -9/7 dan V(AB)= 9/7