Strategi Teori Permainan Tingkat Lanjut untuk Pengambilan Keputusan

Pelatihan problem solving manual, Teknik memecahkan masalah, pelatihan handling problem (November 2024)

Pelatihan problem solving manual, Teknik memecahkan masalah, pelatihan handling problem (November 2024)
Strategi Teori Permainan Tingkat Lanjut untuk Pengambilan Keputusan

Daftar Isi:

Anonim

Teori permainan, studi pengambilan keputusan strategis, menyatukan disiplin ilmu yang berbeda seperti matematika, psikologi dan filsafat. Teori permainan ditemukan oleh John von Neumann dan Oskar Morgenstern pada tahun 1944 dan telah datang jauh sejak saat itu. Pentingnya teori permainan untuk analisis modern dan pengambilan keputusan dapat diukur dengan fakta bahwa sejak tahun 1970, sebanyak 12 ekonom dan ilmuwan terkemuka telah dianugerahi Hadiah Nobel dalam Ilmu Ekonomi atas kontribusinya terhadap teori permainan.

Teori permainan diterapkan di sejumlah bidang termasuk bisnis, keuangan, ekonomi, ilmu politik dan psikologi. Memahami strategi teori permainan - yang populer dan beberapa tipu muslihat yang relatif kurang dikenal - penting untuk meningkatkan penalaran dan keterampilan pengambilan keputusan seseorang di dunia yang kompleks.

Dilema Tawanan - Singkatnya

Salah satu strategi teori permainan yang paling populer dan utama adalah Dilema Tawanan. Konsep ini mengeksplorasi strategi pengambilan keputusan yang diambil oleh dua individu yang, dengan bertindak sesuai kepentingan masing-masing individu, berakhir dengan hasil yang lebih buruk daripada jika mereka telah bekerja sama satu sama lain.

Dalam Dilema Tawanan, dua tersangka yang telah ditangkap karena melakukan kejahatan ditahan di ruangan terpisah dan tidak dapat saling berkomunikasi satu sama lain. Jaksa memberi tahu masing-masingnya secara terpisah bahwa jika dia (memanggilnya Tersangka 1) mengaku dan bersaksi melawan yang lain, dia dapat bebas, tapi jika dia tidak bekerja sama dan dicurigai, Suspect akan dijatuhi hukuman tiga tahun penjara. Jika keduanya mengaku, mereka akan mendapat hukuman dua tahun, dan jika keduanya tidak mengakuinya, mereka akan dijatuhi hukuman satu tahun penjara.

Sementara kerjasama adalah strategi terbaik untuk kedua tersangka, ketika dihadapkan pada dilema semacam itu, penelitian menunjukkan bahwa kebanyakan orang rasional lebih memilih untuk mengaku dan bersaksi melawan orang lain daripada tetap diam dan mengambil kesempatan. yang diakui pihak lain.

Strategi Teori Permainan

Dilema Tawanan meletakkan dasar untuk strategi teori permainan lanjutan yang mana yang populer meliputi:

Matching Pennies : Ini adalah permainan zero-sum yang melibatkan dua pemain (sebut mereka Player A dan Player B) sekaligus menempatkan satu sen di atas meja, dengan hadiah tergantung pada apakah uang seninya sesuai. Jika kedua sen itu adalah kepala atau ekor, Player A menang dan mempertahankan pena Player B. Jika mereka tidak cocok, Player B menang dan mempertahankan nilai Pemain A.

Deadlock : Ini adalah skenario dilema sosial seperti Dilema Tawanan karena dua pemain dapat bekerja sama atau cacat (i.e. tidak bekerja sama). Dalam Deadlock, jika Player A dan Player B keduanya bekerja sama, masing-masing mendapat hadiah 1, dan jika keduanya cacat, mereka masing-masing mendapatkan hadiah 2. Tapi jika Player A bekerja sama dan cacat Pemain B, maka A mendapat hadiah dari 0 dan B mendapatkan hasil dari 3. Pada diagram hasil di bawah ini, angka pertama di sel (a) sampai (d) mewakili hasil Pemain A, dan angka kedua adalah bahwa dari Player B:

Deadlock Payoff Matrix < Pemain B

Bekerjasama

Cacat

Pemain A

Bekerjasama

(a) 1, 1

(b) 0, 3

Cacat

(c) 3 , 0

(d) 2, 2

Kebuntuan berbeda dengan Dilema Tawanan karena tindakan saling menguntungkan terbesar (yaitu kedua cacat) juga merupakan strategi yang dominan. Strategi dominan untuk pemain didefinisikan sebagai strategi yang menghasilkan imbalan tertinggi dari strategi yang ada, terlepas dari strategi yang digunakan oleh pemain lainnya.

Contoh Deadlock yang sering dikutip adalah dua kekuatan nuklir yang berusaha mencapai kesepakatan untuk menghapus persenjataan nuklir mereka dari bom nuklir. Dalam hal ini, kerja sama menyiratkan mengikuti kesepakatan, sementara pembelotan berarti diam-diam mengingkari kesepakatan dan mempertahankan persenjataan nuklir. Hasil terbaik untuk kedua negara, sayangnya, adalah mengingkari kesepakatan tersebut dan mempertahankan opsi nuklir sementara negara lain menghilangkan arsenalnya, karena ini akan memberi keuntungan tersembunyi yang luar biasa bagi yang kedua jika perang terjadi di antara keduanya. Pilihan terbaik kedua adalah baik untuk cacat atau tidak bekerja sama, karena ini mempertahankan status mereka sebagai kekuatan nuklir. Kompetisi Cournot

: Model ini juga secara konseptual mirip dengan Dilema Tawanan, dan diberi nama berdasarkan matematikawan Prancis Augustin Cournot, yang mengenalkannya pada tahun 1838. Penerapan model Cournot yang paling umum adalah dalam menggambarkan duopoli atau dua utama produsen di pasar Misalnya, anggap dua perusahaan A dan B menghasilkan produk yang sama dan bisa menghasilkan jumlah yang tinggi atau rendah. Jika mereka berdua bekerja sama dan setuju untuk berproduksi pada tingkat rendah, maka persediaan terbatas akan diterjemahkan ke dalam harga tinggi untuk produk di pasar dan keuntungan besar bagi kedua perusahaan. Di sisi lain, jika mereka mengalami kerusakan dan produksi pada tingkat tinggi, pasar akan terbengkalai dan menghasilkan harga yang rendah untuk produk tersebut dan akibatnya menurunkan keuntungan. Tetapi jika seseorang bekerja sama (menghasilkan pada tingkat rendah) dan cacat lainnya (biasanya menghasilkan pada tingkat tinggi), maka yang pertama hanya mengalami break even sementara yang kedua menghasilkan keuntungan yang lebih tinggi daripada jika keduanya bekerja sama.

Matriks pembayaran untuk perusahaan A dan B ditunjukkan (gambar mewakili keuntungan dalam jutaan dolar). Jadi, jika A bekerja sama dan menghasilkan pada tingkat rendah sementara B cacat dan menghasilkan pada tingkat tinggi, hasilnya adalah seperti yang ditunjukkan pada sel (b) - impas untuk keuntungan perusahaan A dan $ 7 juta untuk perusahaan B. Cournot Payoff Matrix

Perusahaan B

Bekerjasama

Cacat

Perusahaan A

Bekerjasama

(a) 4, 4

(b) 0, 7

Cacat

(c ) Koordinasi

: Dalam koordinasi, pemain mendapatkan imbalan lebih tinggi saat mereka memilih tindakan yang sama.Sebagai contoh, pertimbangkan dua raksasa teknologi yang memutuskan antara mengenalkan teknologi baru yang radikal dalam chip memori yang bisa menghasilkan ratusan juta keuntungan, atau versi revisi dari teknologi yang lebih tua yang akan memberi mereka lebih sedikit. Jika hanya satu perusahaan yang memutuskan untuk terus maju dengan teknologi baru ini, adopsi pasar oleh konsumen akan turun secara signifikan, dan akibatnya, akan menghasilkan lebih sedikit daripada jika kedua perusahaan memutuskan tindakan yang sama. Matriks payoff ditunjukkan di bawah ini (angka merupakan keuntungan dalam jutaan dolar).

Jadi, jika kedua perusahaan memutuskan untuk mengenalkan teknologi baru, mereka akan memperoleh $ 600 juta masing-masing, sambil memperkenalkan versi revisi dari teknologi yang lebih tua akan menghasilkan $ 300 juta masing-masing, seperti yang ditunjukkan pada sel (d). Tetapi jika Perusahaan A memutuskan sendiri untuk mengenalkan teknologi baru, perusahaan hanya akan memperoleh $ 150 juta, meskipun Perusahaan B akan memperoleh $ 0 (mungkin karena konsumen mungkin tidak mau membayar teknologi sekarang yang sudah usang). Dalam kasus ini, masuk akal bagi kedua perusahaan untuk bekerja sama daripada mereka sendiri.

Koordinasi Matriks Payoff

Perusahaan B

Teknologi baru Teknologi lama

Perusahaan A

Teknologi baru

(a) 600, 600

(b) 0, 150 < Teknologi lama

(c) 150, 0

(d) 300, 300

Game Lipan

: Ini adalah permainan bentuk ekstensif dimana dua pemain bergantian mendapatkan kesempatan untuk mengambil yang lebih besar. berbagi simpanan uang yang perlahan meningkat. Permainan Lipan berurutan, karena para pemain bergerak satu demi satu daripada secara bersamaan; Setiap pemain juga tahu strategi yang dipilih oleh pemain yang bermain di depan mereka. Permainan diakhiri segera setelah pemain mengambil setumpuk, dengan pemain itu mendapatkan porsi yang lebih besar dan pemain lainnya mendapatkan porsi yang lebih kecil. Sebagai contoh, jika Player A dan Player B memainkan game Centipede, asumsikan Player A lebih dulu dan harus memutuskan apakah dia harus "Take" atau "Pass" stash, yang saat ini berjumlah $ 2. Jika dia mengambilnya, maka A dan B mendapatkan $ 1 masing-masing, tapi jika A lolos, keputusan untuk "Take or Pass" sekarang harus dilakukan oleh Player B. Jika B mengambil, dia mendapat $ 3 (yaitu simpanan sebelumnya sebesar $ 2 + $ 1 ) dan A mendapatkan $ 0. Tapi jika B lewat, A sekarang harus memutuskan apakah akan mengambil atau lulus, dan seterusnya. Jika kedua pemain selalu memilih untuk lulus, mereka masing-masing mendapat hadiah sebesar $ 100 di akhir permainan.

Inti permainan adalah bahwa jika A dan B keduanya bekerja sama dan "lulus" ke akhir permainan, mereka mendapatkan hasil maksimal masing-masing $ 100. Tetapi jika mereka tidak mempercayai pemain lain dan mengharapkan mereka untuk "mengambil" pada kesempatan pertama, maka ekuilibrium Nash memprediksi bahwa pemain akan mengambil klaim serendah mungkin ($ 1 dalam kasus ini). Studi eksperimental menunjukkan, bagaimanapun, bahwa perilaku "rasional" ini (seperti yang diprediksi oleh teori permainan) jarang dipamerkan dalam kehidupan nyata. Ini tidak secara intuitif mengejutkan mengingat ukuran kecil dari hasil awal dalam kaitannya dengan yang terakhir. Perilaku serupa oleh subjek eksperimental juga telah dipamerkan dalam Dilema Traveler.

Dilema Traveller

: Ini adalah permainan zero-zero sum dimana kedua pemain berusaha memaksimalkan hasil mereka sendiri tanpa memperhatikan yang lain. Dikembangkan oleh ekonom Kaushik Basu pada tahun 1994, di Dilemma Traveler, sebuah perusahaan penerbangan setuju untuk membayar dua kompensasi bagi para korban untuk barang-barang yang identik. Namun, kedua pelancong secara terpisah diminta untuk memperkirakan nilai barang tersebut, dengan minimum $ 2 dan maksimum $ 100. Jika keduanya menuliskan nilai yang sama, maskapai penerbangan akan mengganti masing-masing jumlah tersebut. Tapi jika nilainya berbeda, maskapai penerbangan akan membayar mereka dengan harga lebih rendah, dengan bonus $ 2 untuk traveler yang menuliskan nilai yang lebih rendah ini dan denda sebesar $ 2 untuk traveler yang menuliskan nilai yang lebih tinggi.

Tingkat ekuilibrium Nash, berdasarkan induksi ke belakang, adalah $ 2 dalam skenario ini. Tapi seperti dalam game Lipan, percobaan laboratorium secara konsisten menunjukkan bahwa sebagian besar peserta - secara naif atau sebaliknya - memilih angka yang jauh lebih tinggi dari $ 2.

Dilema Traveller dapat diterapkan untuk menganalisis berbagai situasi kehidupan nyata. Proses induksi ke belakang, misalnya, dapat membantu menjelaskan bagaimana dua perusahaan yang terlibat dalam kompetisi kejam dapat dengan mantap menurunkan harga produk di bawah untuk mendapatkan pangsa pasar, yang dapat menyebabkannya menimbulkan kerugian yang semakin besar dalam prosesnya.

Strategi Teori Permainan Tambahan Pertempuran Seks

: Ini adalah bentuk lain dari permainan koordinasi yang dijelaskan sebelumnya namun dengan beberapa asimetri pembayaran. Ini pada intinya melibatkan pasangan yang mencoba mengoordinasikan acara malam mereka. Sementara mereka sepakat untuk bertemu di salah satu permainan bola (preferensi pria) atau pada permainan (preferensi wanita), mereka telah melupakan apa yang telah mereka putuskan, dan untuk menggabungkan masalahnya, tidak dapat berkomunikasi satu sama lain. Kemana mereka harus pergi? Matriks pembayaran adalah seperti yang ditunjukkan - angka di dalam sel mewakili tingkat kenikmatan relatif dari kejadian tersebut untuk wanita dan pria. Misalnya, sel (a) mewakili hasil (dalam hal tingkat kenikmatan) untuk wanita dan pria, masing-masing, pada permainannya (dia sangat menikmatinya daripada yang dilakukannya). Sel (d) adalah hasil jika keduanya berhasil mencapai bola (dia menikmati lebih dari yang dia lakukan). Cell (c) mewakili ketidakpuasan jika keduanya pergi tidak hanya ke lokasi yang salah, tapi juga pada acara yang paling mereka minati - wanita ke permainan bola dan pria yang bermain.

Pertempuran Matrix Payoff Seks

Man Mainkan

Permainan bola

Wanita

Mainkan

(a) 6, 3 (b) 2, 2 > Game dictator

(c) 0, 0

(d) 3, 6

Game Diktator

: Ini adalah permainan sederhana dimana Pemain A harus memutuskan bagaimana membagi hadiah uang dengan Player B , yang tidak memiliki masukan terhadap keputusan Pemain A. Meskipun ini bukan strategi teori permainan

per se

, ini memang memberikan beberapa wawasan menarik tentang perilaku orang. Percobaan mengungkapkan bahwa sekitar 50% menyimpan semua uang untuk dirinya sendiri; 5% membaginya sama, dan 45% lainnya memberi peserta lain porsi yang lebih kecil. Permainan diktator sangat erat kaitannya dengan permainan ultimatum, di mana Player A diberi sejumlah uang, yang sebagian harus diberikan kepada Player B, yang dapat menerima atau menolak jumlah yang diberikan.Hasil tangkapannya adalah jika pemain kedua menolak jumlah yang ditawarkan, A dan B sama sekali tidak mendapatkan apa-apa. Permainan diktator dan ultimatum memegang pelajaran penting untuk isu-isu seperti pemberian amal dan filantropi.

Perdamaian-Perang

: Variasi Dilema Tawanan di mana keputusan "Bekerja Sama atau Cacat" digantikan oleh "Perdamaian atau Perang. "Analogi bisa jadi dua perusahaan yang bergerak dalam perang harga. Jika keduanya menahan diri dari pemotongan harga, mereka menikmati kemakmuran relatif (sel a), namun perang harga akan mengurangi hasil secara dramatis (sel d). Namun, jika A terlibat dalam pemotongan harga (perang) tapi B tidak melakukannya, A akan mendapatkan hasil yang lebih tinggi dari 4 karena mungkin dapat meraih pangsa pasar yang substansial, dan volume yang lebih tinggi ini akan mengimbangi harga produk yang lebih rendah.

Matrix Payoff Perdamaian

Perusahaan B

Perdamaian

Perang Perusahaan A Perdamaian (a) 3, 3

(b) 0, 4 > Perang (c) 4, 0

(d) 1, 1

Dilema Relawan

: Dalam dilema relawan, seseorang harus melakukan pekerjaan atau pekerjaan untuk kepentingan bersama. Hasil terburuk mungkin terwujud jika tidak ada relawan. Misalnya, pertimbangkan perusahaan di mana kecurangan akuntansi merajalela namun manajemen puncak tidak menyadarinya. Beberapa karyawan junior di departemen akuntansi mengetahui kecurangan tersebut namun ragu untuk memberi tahu manajemen puncak, karena akan mengakibatkan karyawan terlibat dalam kecurangan yang dipecat dan kemungkinan besar dituntut. Dilabeli sebagai "whistleblower" mungkin juga memiliki beberapa dampak di telepon. Tetapi jika tidak ada sukarelawan, kecurangan skala besar dapat mengakibatkan kebangkrutan perusahaan dan hilangnya pekerjaan semua orang.

The Bottom Line

Teori permainan dapat digunakan dengan sangat efektif sebagai alat untuk pengambilan keputusan apakah dalam situasi ekonomi, bisnis atau pribadi.