Site icon ENLIGHTENTH

ทฤษฎีเกม (Game Theory)

กระบวนการตัดสินใจ ที่ไม่ซับซ้อนมันได้อยู่ใน Common Sense ของเราอยู่แล้ว แต่ในบางสถานการณ์ ที่มีความสลับซับซ้อนสูง ทฤษฎีเกม หรือ Game Theory จะเป็นกระบวนการที่มาช่วยวิเคราะห์ เรียบเรียง และทำให้การตัดสินใจดีขึ้น และแม่นยำ

ทฤษฎีเกม (Game Theory)

สงครามย่อยๆ ที่ตะวันออกกลางซึ่งอิสราเอลได้ทิ้งระเบิดถล่มเลบานอน หรือการที่เกาหลีเหนือซ้อมยิงขีปนาวุธเขย่าขวัญญี่ปุ่น หรืออเมริกาจะตัดสินใจ คว่ำบาตรอิหร่าน ล้วนเป็นการตัดสินใจ ที่อิงกับการประยุกต์ทฤษฎีเศรษฐศาสตร์ ที่ชื่อว่า “ทฤษฎีเกม” หรือ “Game Theory” เป็นอย่างมาก

ท่านผู้อ่านหลายท่านอาจจะเคยสงสัยว่า การตัดสินใจทำอะไรลงไปซักอย่าง ของเราในชีวิตประจำวัน ของผู้บริหารต่างๆ หรือของมหาอำนาจแบบอเมริกา หรือรัสเซีย หรือจีน ทำไมจึงจำเป็นต้อง มีทฤษฎีอะไร มากำหนดกระบวนการตัดสินใจด้วย จริงๆ แล้วกระบวนการตัดสินใจ ที่ไม่ซับซ้อนมันได้อยู่ใน Common Sense ของเราอยู่แล้ว แต่ในบางสถานการณ์ที่มีความสลับซับซ้อน ทฤษฎีเกม หรือ Game Theory จะเป็นกระบวนการที่มาช่วยวิเคราะห์ เรียบเรียง และทำให้การตัดสินใจดีขึ้น และแม่นยำ โดยเฉพาะประเทศที่ศัตรูเยอะ และการตัดสินใจที่มีผลกับความเป็นไปของโลก เช่น สหรัฐอเมริกาได้มีการศึกษา และวิจัยทฤษฎีเกม กันอย่างจริงจังในระดับชาติ เพื่อช่วยให้การตัดสินใจ ในการปกป้องผลประโยชน์ของประเทศตัวเอง ให้มากที่สุด

นอกจากการประยุกต์ใช้ทฤษฎีเกม ในการวิเคราะห์การตลาด และเพิ่มความสามารถ ในการแข่งขันของธุรกิจแล้ว

ทฤษฎีเกม เป็นทฤษฎีทางเศรษฐศาสตร์ ที่มีชื่อเสียงมาก แม้ว่าจะเป็นทฤษฎีทางเศรษฐศาสตร์ แต่ก็ถูกคิดค้นขึ้นมาครั้งแรก ร่วมกันโดย นักคณิตศาสตร์ ชื่อ Von Neumann และนักเศรษฐศาสตร์ชื่อ Oskar Morgenstern ในปี 1944

จนอีก 50 ปีต่อมา (ปี 1994) ทฤษฎีเกมมาโด่งดังอีกครั้ง เมื่อนักเศรษฐศาสตร์ และเป็นศาสตราจารย์ ที่มหาวิทยาลัยพรินซ์ตัน (Princeton University) ประเทศสหรัฐอเมริกา ชื่อ จอห์น เอฟ. แนช (John F. Nash) ซึ่งมีโรคประจำตัวคือโรคจิตเภท ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ ร่วมกับนักเศรษฐศาสตร์อีกสองท่าน ในด้านทฤษฎีเกี่ยวกับ Non-Cooperative Games ซึ่งหลายท่านอาจจะเคยได้ชมภาพยนต์เรื่อง Beautiful Mind กันมาแล้ว ซึ่งเป็นภาพยนต์ที่ถ่ายทอดเรื่องราวของ จอห์น เอฟ. แนช ดังกล่าว

อย่างไรก็ตามทฤษฎีเกม มีความสลับซับซ้อนมาก การถ่ายทอดทฤษฎีเกม จึงทำได้ค่อนข้างลำบาก อย่างไรก็ตาม ผมได้พยายามอธิบาย ในบทความนี้ดังต่อไปนี้…..

หน้าที่ 2 – การใช้งาน Game Theory

หลักการพื้นฐานของวิชาเศรษฐศาสตร์ จะสมมติว่า ตลาดสินค้า มีการแข่งขันกันอย่างเสรี เพราะมีจำนวนผู้ซื้อ และผู้ขายมากราย (เข้าสู่ Infinity) รวมทั้งมีข้อมูลครบถ้วน ที่ทำให้ผู้ซื้อและผู้ขาย สามารถตัดสินใจซื้อ – ขาย ได้ในกรอบของความแน่นอน และไม่ต้องคำนึงถึงว่า ผู้ซื้อ – ผู้ขายคนอื่นๆ จะตัดสินใจอย่างไร เพราะการตัดสินใจ หรือการกระทำใดๆ จะถูกกำหนดโดยกลไกตลาด ท่ามกลางข้อมูลที่โปร่งใส และถูกต้อง

ซึ่งจะแตกต่างจากการเล่นเกม เช่น หมากรุก ที่ผู้เล่นต้องกำหนดกลยุทธ์ในการเล่น และต้องคาดเดาพฤติกรรมการเดิน และการตัดสินใจ ของผู้เล่นฝ่ายตรงข้าม หรือการจีบสาว ที่ชายหนุ่มจะต้องเดาพฤติกรรม และการตอบสนองของสาวเจ้า รวมไปถึงคู่แข่งด้วย

ตัวอย่างง่ายๆ ที่ใช้อธิบายทฤษฎีเกม

คือในกรณีที่มีคนร้ายสองคน ถูกตำรวจจับได้ และมีหลักฐานการทำความผิดในระดับหนึ่ง ที่สามารถสั่งจำคุกได้ แต่ยังไม่สามารถระบุความผิด ของทั้งสองคนได้ ดังนั้นตำรวจจึงแยกกันสอบสวน และให้โอกาสสารภาพ และซัดทอดซึ่งกันและกัน โดยตั้งเกณฑ์ไว้ว่า หาก นาย ก สารภาพและซัดทอด นาย ข แต่ นาย ข ไม่สารภาพและไม่ซัดทอด นาย ก แล้ว นาย ก จะได้เข้าคุก 2 ปี และนาย ข จะถูกจำคุกนาน 10 ปี ทั้งนี้โทษจำคุก ก็จะกลับกันหาก นาย ข สารภาพและซัดทอด นาย ก โดยนาย ก ไม่ปริปากใดๆ แต่หากทั้งสองคนไม่ยอมให้การใดๆ ที่มีประโยชน์ ตำรวจจะทำได้เพียงจำคุกทั้งคู่คนละ 1 ปี แต่หากทั้งสองคน ปรักปรำซึ่งกันและกันก็จะถูกจำคุกคนละ 5 ปี

 

หากท่านเป็น นาย ก ท่านจะทำอย่างไร ?

 

จากโจทย์ข้างต้น เราสามารถตีตารางเพื่อวิเคราะห์ พฤติกรรมได้ดังนี้

 

 

นาย ข

 

 

สารภาพและซัดทอด

ไม่ปริปาก

นาย ก

สารภาพและซัดทอด

(5,5)

(2,10)

ไม่ปริปาก

(10,2)

(1,1)

ตัวเลขในวงเล็บคือจำนวนปีที่ติดคุก ตัวเลขแรกในวงเล็บคือตัวเลขของ นาย ก และตัวเลขหลังของ นาย ข

จะเห็นได้ว่า ทั้งนาย ก และ นาย ข ควรจะร่วมมือกัน โดยไม่ปริปากใดๆ เพื่อให้ทั้งสองได้รับโทษสถานเบาคือ (1,1) แต่ในความเป็นจริง ด้วยความกลัวที่จะถูกอีกคนหนึ่งทรยศ โดยการปรักปรำ ทำให้ทั้งสองฝ่ายจะร่วมมือกับตำรวจ ซึ่งทำให้ติดคุกคนละ 5 ปี (5,5) พฤติกรรมที่เกิดขึ้นที่ไม่ใช่จุดที่ทั้งสองฝ่ายได้ประโยชน์สูงสุด เนื่องจากตำรวจจับแยกห้องขัง ทำให้คนร้ายทั้งสองไม่สามารถร่วมมือกัน หรือแจ้งข้อมูลซึ่งกันและกันได้ ซึ่งต่างจากตลาดสินค้าเสรี ที่ผู้เล่นทุกฝ่ายมีข้อมูลครบถ้วน ดังที่กล่าวมาข้างต้น ซึ่งหากคนร้ายทั้งสอง ได้มีโอกาสแลกเปลี่ยนข้อมูลซึ่งกันและกัน จะทำให้ทั้งคู่ได้รับประโยชน์สูงสุดคือ (1,1)

ตัวอย่างข้างต้นเป็นเกมขั้นพื้นฐาน ที่มีผู้เล่นเพียงสองคน แต่ก็สามารถสรุปได้ว่า มนุษย์ที่มักจะต้องการความเสี่ยงน้อยที่สุด จะเลือกแนวทางที่ทำให้เกิดความเสียหาย กับตนเองน้อยที่สุด ในกรณีที่เกิดสถานการณ์เลวร้ายน้อยที่สุด สำหรับในกรณีตัวอย่างข้างต้นนั้น สถานการณ์ที่เลวร้ายที่สุดคือ การถูกเพื่อนซัดทอด จึงต้องเลือกระหว่างติดคุก 10 ปี หรือติดคุก 5 ปี จึงต้องเลือกสารภาพ และซัดทอดให้เพื่อน เพื่อให้ตัวเองติดคุกเพียง 5 ปี

 

หรือในอีกกรณีที่มีข่าวดังในบ้านเรา และศาลท่านไม่อนุญาตให้ละเมิดอำนาจศาล โดยการวิพากษ์วิจารณ์คำตัดสิน แต่ศาลท่านได้กรุณาอนุญาต ให้ทำการวิเคราะห์ และอธิบายในเชิงวิชาการได้ ซึ่งผมคงไม่กล่าวถึงในจุดนั้น แต่จะขอย้อนกลับไป ถึงการวิเคราะห์การตัดสินใจของ กลุ่ม ก2ต และ พรรคเก่า ว่าทำไมผลลัพธ์จึงออกมาเช่นนี้ โดยใช้ทฤษฎีเกม ดังนี้…..

หน้าที่ 3 – ทฤษฎีเกม อธิบายปรากฎการณ์ที่ยุ่งเหยิง

 

หรือในอีกกรณีที่มีข่าวดังในบ้านเรา และศาลท่านไม่อนุญาตให้ละเมิดอำนาจศาล โดยการวิพากษ์วิจารณ์คำตัดสิน แต่ศาลท่านได้กรุณาอนุญาต ให้ทำการวิเคราะห์ และอธิบายในเชิงวิชาการได้ ซึ่งผมคงไม่กล่าวถึงในจุดนั้น แต่จะขอย้อนกลับไป ถึงการวิเคราะห์การตัดสินใจของ กลุ่ม ก2ต และ พรรคเก่า ว่าทำไมผลลัพธ์จึงออกมาเช่นนี้ โดยใช้ทฤษฎีเกม ดังนี้

 

หลังจากที่มีเหตุการณ์ทางการเมืองที่วุ่นวายในบ้านเรา พรรคเก่าแก่ ได้ประกาศว่า กลุ่ม ก2 ต ได้ทำผิดกฎหมายเลือกตั้ง และให้ กลุ่ม ก2ต ลาออกเสีย มิฉะนั้นแล้วจะส่งเรื่องฟ้องศาล ให้มีความผิดทางอาญา ซึ่งกลุ่ม ก2ต เชื่อมั่นว่า ตนเองได้ปฏิบัติตามกรอบของกฎหมาย และไม่มีความผิด และมีความชอบธรรมที่จะปฏิบัติหน้าที่ต่อ

ซึ่งหากท่านเป็น กลุ่ม ก2ต และพรรคเก่าแก่ ท่านจะตัดสินใจอย่างไร ?

เราจะใช้ทฤษฎีเกมวิเคราะห์ ซึ่งในกรณีนี้จะเป็นแบบ Sequential Move คือมีคนใดคนหนึ่งตัดสินใจก่อน ในกรณีนี้ กลุ่ม ก2ต จะเป็นผู้ตัดสินใจก่อน โดยเราต้องเขียนตารางคะแนนประโยชน์ อันเกิดมาจากการตัดสินใจ ในมุมมองของทั้งสองฝ่าย โดยกรณีที่มีคะแนนมาก หมายถึงได้ประโยชน์กับตนเองมากกว่า ดังต่อไปนี้

มุมมองของ กลุ่ม ก2ต

 

การตัดสินใจของ ก2ต

การตัดสินใจของพรรคเก่าแก่

คะแนน

1

ไม่ลาออก

ไม่ฟ้องร้อง

4

2

ไม่ลาออก

ฟ้องร้อง

3

3

ลาออก

ไม่ฟ้องร้อง

2

4

ลาออก

ฟ้องร้อง

1

มุมมองของพรรคเก่าแก่

สถานการณ์

การตัดสินใจของ ก2ต

การตัดสินใจของพรรคเก่าแก่

คะแนน

1

ลาออก

ไม่ฟ้องร้อง

4

2

ไม่ลาออก

ฟ้องร้อง

3

3

ไม่ลาออก

ไม่ฟ้องร้อง

2

4

ลาออก

ฟ้องร้อง

1

 

จากตารางข้างต้น เรามาเขียนแผนภาพ Decision Tree ของกรณีทั้งสองได้ดังนี้

 

โดยตัวเลขในวงเล็บตัวแรกคือคะแนนของ กลุ่ม ก2ต และตัวหลังคือคะแนนของพรรคเก่าแก่ จากแผนภาพข้างต้น กลุ่ม ก2ต จะต้องเลือกไม่ลาออกแน่นอน เพราะมีประโยชน์กับตนเองมากกว่า และไม่เสียศักดิ์ศรี โดยเชื่อมั่นในความชอบธรรมของตนเอง จะเห็นว่าได้คะแนน ไม่ 3 ก็ 4

 

เมื่อ กลุ่ม ก2ต ตัดสินใจไม่ลาออกแล้ว ก็ถึงตาพรรคเก่าแก่ต้องตัดสินใจบ้าง ทีนี้พรรคเก่าแก่ ก็จะต้องเลือกการตัดสินใจที่ตัวเอง ได้คะแนนสูงสุดเหมือนกัน หลังจากที่กลุ่ม ก2ต ตัดสินใจไม่ลาออก จากแผนภาพข้างต้น เราจะเห็นได้ว่าพรรคเก่าแก่ต้องเลือกฟ้องร้องแน่นอน เพราะว่าได้คะแนน 3 ซึ่งมากกว่า 1 คือไม่ฟ้องร้อง ผลลัพธ์จึงออกมา ดังเช่นที่เราทราบข่าวกันตามหน้าหนังสือพิมพ์ คือ ก2ต ถูกพรรคเก่าแก่ฟ้องร้อง จุด (3,1) ในแผนภาพข้างต้นเราเรียกว่า จุดดุลยภาพ

 

จากกรณีดังกล่าวข้างต้นทั้งสองกรณี มีผู้เล่นเพียงสองฝ่ายเท่านั้น แต่ Thesis ปริญญาเอกของ จอห์น แนช ที่เขียนขึ้นสมัยเรียน ที่มหาวิทยาลัยพรินซ์ตัน เมื่ออายุเพียง 25 ปีนั้น ได้พัฒนาทฤษฎีเกม โดยแยกแยะกรณี ที่ผู้เล่นสามารถร่วมมือกัน เพราะสามารถทำความตกลงระหว่างกันได้ กับกรณีที่ผู้เล่นไม่สามารถร่วมมือกัน เพราะไม่สามารถ หรือไม่ควรทำข้อตกลงระหว่างกันได้ เช่น ในกรณีของการแข่งขันในตลาดที่มีผู้ผลิตน้อยราย ที่ไม่ต้องการทำสัญญาฮั้วกันระหว่างผู้ผลิต

 

ทฤษฎีของ จอห์น แนช มีความสำคัญ เพราะเขาได้พิสูจน์ว่า เกม ที่ไม่มีการร่วมมือระหว่างผู้เล่นหลายคนนั้น จะสามารถดำเนินไปสู่จุดดุลยภาพ (Nash Equilibrium) ได้ อย่างไรก็ตาม แม้ว่าในบางกรณีจะมีจุดดุลภาพหลายจุด เช่น เป่ายิ๊งฉุบ แต่การค้นคว้าพบว่า เราสามารถหาจุดดุลภาพได้ และมีจุดดุลยภาพจำนวนจำกัด

 

ซึ่งทำให้เราสามารถวิเคราะห์ คาดการณ์ผลลัพธ์ ที่จะเกิดขึ้น ว่ามีความเป็นไปได้ในลักษณะใดได้บ้าง

ทฤษฎีเกมของ จอห์น แนช ได้กลายเป็นเครื่องมือหลัก ในการศึกษาวิเคราะห์การแข่งขันระหว่างผู้ผลิต และการวิเคราะห์โครงสร้างอุตสาหกรรม และในบางกรณีก็ถูกนำไปใช้ในการวิเคราะห์ นโยบายเศรษฐกิจมหภาค การเจรจาการค้าระหว่างประเทศ ตลอดจนนโยบายทางด้านการเมืองต่างๆ รวมไปถึงการจะยิงขีปนาวุธ ของประเทศมหาอำนาจ

 

ทฤษฎีเกมนั้นมีความสลับซับซ้อนมาก เพราะการกระทำ หรือกลยุทธ์ของผู้เล่นคนใดคนหนึ่ง หรือหลายคน จะมีผลกระทบต่อผู้เล่นคนอื่นๆ ในระบบ ทำให้เกิดการปรับตัวไปสู่อีกภาวะหนึ่ง โดยอาจจะทำให้เกิด การตอบโต้จากคู่แข่ง ที่อาจจะไม่มีสุดสิ้นสุด ดังนั้นการที่ จอห์น แนช สามารถใช้ทฤษฎีเกม อธิบายว่าปรากฎการณ์ไม่ว่าจะยุ่งเหยิงเพียงใด ย่อมจะสามารถนำไปสู่จุดดุลยถาพได้ จึงได้กลายเป็นประโยชน์ต่อมนุษยชาติมาถึงทุกวันนี้ เหมาะสมกับรางวัลโนเบลที่ได้รับเป็นยิ่งนัก