คำเตือน: โปรดใช้ Game theory ในการตัดสินใจ

Pakhapoom Sarapat
2 min readAug 26, 2018

--

รูปที่ 0 ก็อปมาจาก https://associationsnow.com/2017/12/association-decision-making-path-better-decisions/

หลายต่อหลายครั้งที่เราต้องเผชิญกับสภาวะที่ต้องตัดสินใจเลือกอะไรบางอย่าง ไม่ว่าจะเป็นเย็นนี้กินไรดี จะซื้อรองเท้าสีขาวหรือน้ำเงิน หรือว่าถ้ากลับบ้านตอนนี้จะนั่งรถเมล์ดีหรือว่ารถไฟฟ้าแทน ทั้งหมดนี้รวมถึงเหตุการณ์อื่นๆ ที่เกิดขึ้นอีกมากมายในหนึ่งวันที่เราต่างต้องตัดสินใจเลือกสักอย่าง บางการตัดสินใจก็เป็นไปอย่างง่ายดายโดยแทบไม่รู้สึกว่าต้องคิดอะไร แต่บางครั้งก็ยากเย็นเสียเหลือเกินจนต้องเอาเท้าขึ้นมาก่ายหน้าผากกันเลยทีเดียว และเช่นเคย ในบทความนี้จะขออนุญาตพูดถึงเครื่องมือทางคณิตศาสตร์ที่ใช้ในการตัดสินใจ(ได้อย่างมีประสิทธิภาพ!?) ซึ่งเรียกว่า ทฤษฎีเกม หรือ game theory

ต้องบอกก่อนว่าคำว่า เกม (game) ในทางคณิตศาสตร์ไม่ได้หมายถึง “เกม” ตามที่รับรู้ในชีวิตประจำวันว่าเป็น rov หรือ pubg เพียงอย่างเดียว แต่เกมในที่นี้จะสื่อถึงสถานการณ์หรือเหตุการณ์อะไรก็ได้ กว้างๆ เลย โดยมีคนหรือกลุ่มคนพร้อมกับทางเลือกมากมายของพวกเขาเข้ามาเกี่ยวข้อง แล้วเราจะเรียกคนเหล่านั้นว่าผู้เล่น (player) และตัวเลือกต่างๆ ว่ากลยุทธ์ (strategy)

เป้าหมายหลักของผู้เล่นแต่ละคนก็คือการทำให้ตัวเอง (หรือกลุ่มพรรคพวกของตัวเอง) ได้ผลประโยชน์มากที่สุดภายใต้เงื่อนไขว่าผู้เล่นแต่ละคนมีเหตุผลและมีความฉลาดเหมือนกัน เช่นใน rov จะสามารถมองว่าเป็นเกมสำหรับผู้เล่น 10 คน แต่เพื่อความง่ายกว่านั้นอาจมองว่าเป็นผู้เล่น 2 คน (เล่น 2 ทีม 2 ฝ่ายไรงี้) โดยที่แต่ละฝ่ายมีจุดมุ่งหมายคือการสร้างความได้เปรียบในเกมให้กับตัวเองได้มากที่สุดในแต่ละไฟต์หรือในแต่ละมูฟเลยก็ว่าได้ เพื่อที่จะได้ไปตีป้อมตีบ้านของอีกฝ่ายให้แตกก่อนจะได้ชนะ ได้ดาว ได้ไรก็ว่ากันไป

แต่การยกตัวอย่างเกมให้เป็น rov ตั้งแต่แรกอาจเป็นตัวอย่างที่เข้าถึงยาก เพราะเกมนี้มีไดนามิคเยอะไป ลองมาดูตัวอย่างง่ายๆ อย่างเช่น เกม “มื้อเย็นกินไรดี” เกม “ซื้อรองเท้าสีไรดี” หรือเกม “จะกลับบ้านยังไงดี” ทั้งสามเกมนี้อาจถูกเรียกว่าเป็นเกมที่มีผู้เล่นคนเดียว* โดยภายใต้ตัวเลือกที่สนใจ (หลังจากนี้จะเรียกว่า “กลยุทธ์” แล้วนะ) เราต้องให้คะแนนความพึงพอใจในแต่ละตัวเลือก ซึ่งคะแนนดังกล่าวจะเรียกว่า ผลตอบแทน (payoff)

รูปที่ 1 ตัวอย่างผลตอบแทนในแต่ละกลยุทธ์ของผู้เล่น A และ B (นามสมมติ)

ยกตัวอย่างเช่นในเกม “กลับบ้านยังไงดี” เราก็มาดูว่าในแต่ละกลยุทธ์มันทำให้เราฟินในระดับไหน ซึ่งความพึงพอใจหรือผลตอบแทนที่ว่าเนี่ย มันจะเป็นเท่าไหร่ ยังไงก็ตามใจผู้เล่นแต่ละคนเลย** เช่น A เล่นเกมนี้ก็อาจจะมีค่าผลตอบแทนแบบนึง ถ้า B เล่นก็อาจมีอีกแบบนึง ตามที่แสดงในรูปที่ 1 ซึ่งในกรณีนี้จะเห็นได้ชัดว่าในความคิดของ A การใช้รถเมล์จะตอบโจทย์ชีวิตเค้ามากที่สุด ในขณะที่มุมมอง B คิดว่าความพึงพอใจจากการใช้รถไฟฟ้าจะมีเยอะกว่าที่ได้จากรถเมล์

ทั้งนี้ทั้งนั้นมันเลยไม่มีการกระทำที่ถูกต้องหรือที่ถูกใจในมุมมองของเราเสมอไป เพราะคนอื่นไม่ได้มีเงื่อนไขชีวิตหรือประสบการณ์เหมือนกับเราเสมอไปไง

ใน section ที่แล้วจะมีเครื่องหมายดอกจัน 1 และ 2 อันอยู่ ขอแวะพักขยายความสำหรับดอกจันเหล่านั้นกันสักหน่อย

  • สำหรับดอกจันอันเดียว จริงๆ แล้วนิยามของเกมจะเริ่มจากผู้เล่นตั้งแต่ 2 คนขึ้นไป มันไม่มีเกมที่มีผู้เล่นคนเดียวหรอก เพราะแบบนั้นจะกลายเป็นอีกวิชาซึ่งเรียกว่า decision analysis เพียงแต่คิดว่าถ้าหยิบยกมาคร่าวๆ น่าจะไล่ลำดับความคิดได้ดีกว่า แต่หากว่าทำให้สับสนขอให้คอมเม้นต์ความสับสนนั้นไว้นะครับ แล้วผมจะพยายามอย่างเต็มที่ในการคลี่คลายข้อข้องใจให้เองครับ
  • สำหรับดอกจันสองอัน เป็นอีกครั้งที่มันไม่ถูกต้องทั้งหมด แต่เพื่อความลื่นไหลในการแนะนำแนวคิดของทฤษฎีเกมแล้วให้ยอมรับกันไปก่อน ถ้ายังไงสนใจไปลุยต่อด้วยคีย์เวิร์ด utility ได้เลย

จากตรงนี้ ขอเพิ่มความเร้าใจด้วยการขยับความสนใจไปที่เกมสำหรับผู้เล่น 2 คนกันบ้าง ขอยกตัวอย่างเป็นเรื่องที่เป็นข่าวเร็วๆ นี้เกี่ยวกับการขึ้นค่าปรับในการไม่พกใบขับขี่เป็น 50,000 บาทละกัน สมมติให้มีผู้เล่นเป็นตัวเราเองกับตำรวจ โดยที่เกมนี้จะสนใจไปที่ช่วงเวลาก่อนออกจากบ้านโดยที่จำเป็นต้องขับรถออกไป และก่อนที่เราจะก้าวออกประตูบ้านไปเราจะมี 2 ตัวเลือกคือจะพกใบขับขี่หรือไม่พกใบขับขี่ไปด้วย บางทีการเดินทางครั้งนั้นก็ไม่เจอด่านตำรวจให้รู้สึกเสียวไส้แต่อย่างใด เลยมองการเจอด่านเป็นอีกผู้เล่นหนึ่งในนามของตำรวจว่าจะมีการตรวจใบขับขี่หรือไม่มีการตรวจแต่อย่างใด

สำหรับผลตอบแทนในแต่ละทางเลือก อาจลองสมมติไว้คร่าวเป็นว่า

  • กรณีที่ 1: ถ้าเราพกใบขับขี่ แล้วมีการตรวจ แบบนี้เราจะรู้สึกโชคดีที่ได้พกใบขับขี่มาจะได้ไม่ต้องเสียเงินค่าปรับ ส่วนตำรวจก็ได้ออกมาทำหน้าที่จับคนทำผิดกฎก็จริงแต่ยังไม่ได้ตังค์ เลยสมมติว่าผลตอบแทนของเราเป็น 30 ผลตอบแทนของตำรวจเป็น 0
  • กรณีที่ 2: ถ้าเราพกใบขับขี่ แล้วไม่มีการตรวจ แบบนี้เราก็ไม่ได้เสียอะไรมากมายแค่พกบัตรเพิ่มมาอีกใบนึง ส่วนตำรวจก็ไม่ต้องทนร้อนอะไร สบายๆ กันไป เลยให้ผลตอบแทนของเราเป็น 0 ส่วนผลตอบแทนของตำรวจเป็น 0
  • กรณีที่ 3: ถ้าเราไม่ได้พกใบขับขี่ แล้วมีการตรวจ แบบนี้เรียกซวยครับ โดนค่าปรับ 50,000 บาทแน่นอนถ้ามีการบังคับใช้กฎหมายใหม่นี้ ส่วนตำรวจก็รู้สึกได้ทำหน้าที่จับคนที่ทำผิดกฎหมายแล้วก็อาจจะฟินหน่อยๆ เลยให้ผลตอบแทนของเราเป็น -100 และผลตอบแทนของตำรวจเป็น 50
  • กรณีที่ 4: ถ้าเราไม่ได้พกใบขับขี่ แล้วไม่มีการตรวจ แบบนี้เราเหมือนจะได้กำไร เพราะบางทีเราก็ลืมเอาใบขับขี่มาโดยไม่ได้ตั้งใจ ขับรถไปด้วยความกังวลว่าจะซวยโดนเรียกตรวจรึเปล่า แต่สุดท้ายก็ไม่โดนตรวจ รอดไป ส่วนตำรวจก็เหมือนจะพลาดโอกาสที่จะจับเราไป หรือหมายถึงการปล่อยให้คนทำผิดลอยนอล ทำให้ผลตอบแทนของเราในกรณีนี้จะเป็น 50 และของตำรวจเป็น -30

ต้องบอกก่อนว่าตัวเลขที่กำหนดขึ้นมาไม่ได้มีความสำคัญเท่ากับความแตกต่างระหว่างในแต่ละกรณี หมายถึงว่าผลตอบแทนของเราในแต่ละกรณีจะเป็นอะไรก็ได้เพียงแต่ผลตอบแทนกรณีที่ 4 > กรณีที่ 1 > กรณีที่ 2 > กรณีที่ 3 ส่วนของตำรวจ ผลตอบแทนกรณีที่ 3 > กรณีที่ 2 = กรณีที่ 1 > กรณีที่ 4 และก็ต้องบอกกันอีกทีว่าความสัมพันธ์ของผลตอบแทนทั้งหมดนี้ก็สมมติขึ้นมาตามความคิดของผู้เขียน ซึ่งอาจจะไม่เหมือนกับผู้อ่านก็ได้ ไม่ต้องแปลกใจไป

แต่อย่างไรก็ตามการเขียนเป็นข้อความที่ยืดยาวแบบนี้บางทีก็รู้สึกขี้เกียจเขียนแถมยังขี้เกียจอ่านตามอีกต่างหาก เลยใช้ตารางมาช่วยในการแสดงข้อมูลดังกล่าว โดยค่าในแต่ละตารางจะสื่อถึงผลตอบแทนของแต่ละคน และโดยทั่วไปแล้วตัวเลขแรกที่อยู่หน้าเครื่องหมายคอมม่าจะเป็นผลตอบแทนของผู้เล่นในแนวนอน (ซึ่งในตัวอย่างนี้คือ ตัวเรา) ส่วนตัวเลขที่อยู่หลังคอมม่าจะสื่อถึงผลตอบแทนของผู้เล่นในแนวตั้ง (ซึ่งในตัวอย่างนี้คือ ตำรวจ) ทำให้ได้ว่า

ทีนี้ก็มาสู่กระบวนการการตัดสินใจแล้วว่าเราจะเลือกพกหรือไม่พกใบขับขี่ก่อนออกจากบ้านดีนะ แต่เมื่อดูจากตารางด้านบนมันจะไม่ได้ดูได้ง่ายๆ แบบกรณีของเกมที่มีผู้เล่นคนเดียวอย่างเกมกลับบ้านยังไงดีที่กล่าวไปข้างต้นแล้ว เราต้องมาแบ่งกรณีขึ้นกับความเป็นไปได้ ดังนี้

ในมุมมองของตัวเรา

  • ความเป็นไปได้ที่ 1: สมมติว่าวันนี้ต้องโดนตรวจแน่นอน เราก็มาพิจารณาที่คอลัมน์ของกลลยุทธ์ “ตรวจ” แล้วดูว่ากลยุทธ์ของเราอันไหนให้ผลตอบแทนเยอะกว่ากัน ก็จะได้ว่ากลยุทธ์ที่เหมาะสมที่สุดสำหรับความเป็นไปได้นี้คือการพกใบขับขี่ไปด้วย
  • ความเป็นไปได้ที่ 2: สมมติว่าวันนี้ไม่โดนตรวจหรอก ก็ทำในทำนองเดียวกันโดยดูที่คอลัมน์ของกลยุทธ์ “ไม่ตรวจ” พบว่าผลตอบแทนของการไม่พกใบขับขี่มีมากกว่า ดังนั้นสำหรับกรณีนี้จะเลือกไม่พกใบขับขี่ไปดีกว่า

ในมุมมองของตำรวจ

เนื่องจากเป็นเกมของผู้เล่น 2 คน เราจึงต้องพิจารณาของอีกผู้เล่นด้วย นั่นก็คือตำรวจ จะได้ว่า

  • ความเป็นไปได้ที่ 1: สมมติว่าคนที่ขับรถบนท้องถนนมีใบขับขี่ทุกคนเลย ก็มาดูที่แถวของกลยุทธ์ “พกใบขับขี่” ทำให้ได้ว่าตำรวจจะเลือกตรวจหรือไม่ตรวจก็ได้ผลตอบแทนเหมือนกัน อันนี้ก็ขึ้นอยู่กับความขยันหรือความว่างของตำรวจแล้วว่าจะตรวจหรือไม่ตรวจ
  • ความเป็นไปได้ที่ 2: สมมติว่าจะมีคนที่ไม่พกใบขับขี่มาแน่นอน เลยมาดูที่แถวของกลยุทธ์ “ไม่พกใบขับขี่” แทนจะได้ว่าการเลือกออกไปตรวจจะให้ผลตอบแทนกับตำรวจมากกว่าเลือกไม่ตรวจ ดังนั้นตำรวจจะเลือกตรวจ

เนื่องจากในความเป็นไปได้ที่ 1 ของฝ่ายตำรวจทำให้ตำรวจจะเลือกกลยุทธ์ไหนก็ไม่เกิดความแตกต่าง เลยสมมติว่าในความเป็นไปได้นี้ตำรวจเลือกที่จะไปตรวจเช่นกัน ทำให้ได้ว่าไม่ว่าจะพกหรือไม่พกใบขับขี่มา ตำรวจก็ตรวจเสมอ เลยย้อนกลับไปในความเป็นไปได้ในมุมมองของตัวเราบ้าง เพราะตำรวจจะตรวจเสมอเราเลยใช้ผลลัพธ์จากความเป็นไปได้ที่ 1 เพื่อสรุปว่าเราก็ควรพกใบขับขี่ก่อนออกจากบ้านไปด้วยนะ

โดยเราเรียกผลลัพธ์ที่สมเหตุสมผลที่สุดที่ได้จากการเปรียบเทียบผลตอบแทนของแต่ละฝ่ายว่าจุดสมดุล (equilibrium) และสำหรับเกมนี้จุดสมดุลจะอยู่ที่ (พกใบขับขี่, ตรวจ) ซึ่งหมายถึงว่าการที่ผู้เล่นคนแรก (ตัวเรา) เลือกพกใบขับขี่ และผู้เล่นคนที่สอง (ตำรวจ) เลือกตรวจ เป็นวิธีการที่ดีที่สุดสำหรับทุกฝ่าย

จริงๆ แล้วมีวิธีสำหรับการหาจุดสมดุลที่อาจง่ายกว่านี้ คือการพิจารณาแบบต่อเนื่องกันไปเลยโดยสลับบทบาทของผู้เล่น ยกตัวอย่างเช่น สุ่มจุดเริ่มต้นในการพิจารณามาก่อน เช่นเริ่มจาก

  1. สมมติว่าถ้าเราไม่พกใบขับขี่แล้วตำรวจจะทำยังไง จากตารางก็พบว่าตำรวจก็เลือกที่จะตรวจ
  2. เมื่อตำรวจเลือกที่จะตรวจ แล้วเราควรเลือกอะไร จากตารางก็ได้ว่าเราก็น่าจะเลือกพกใบขับขี่ดีกว่า เพราะได้ผลตอบแทนมากกว่า
  3. ถ้าเราพกใบขับขี่แล้ว ตำรวจจะเลือกกลยุทธ์ไหนที่ได้ผลตอบแทนดีกว่า แต่สำหรับเกมนี้ผลตอบแทนได้เท่ากันเลย ตำรวจก็จะเลือกอะไรก็ได้ ซึ่งถ้าเลือกตรวจมันก็จะวนกลับไปที่ข้อ 2 อีกครั้งแล้วเราจะได้ข้อสรุปว่า (พกใบขับขี่, ตรวจ) คือจุดสมดุลของเกมนี้
  4. แต่ก็มีความเป็นไปได้ว่าตำรวจจะเลือกที่จะไม่ตรวจ ซึ่งถ้าตำรวจไม่ตรวจ เราควรเลือกอะไรเป็นกลยุทธ์ที่เหมาะสมดี จากตาราง เราก็น่าจะเลือกที่จะไม่พกใบขับขี่ดีกว่า ด้วยเหตุผลเดิมที่ว่ามันให้ผลตอบแทนที่ดีกว่า
  5. พอเราเลือกที่จะไม่พกใบขับขี่ ในมุมมองตำรวจควรทำยังไง จากตารางก็สรุปได้ว่าตำรวจจะเลือกกลยุทธ์ตรวจแทน
  6. เมื่อตำรวจเลือกที่จะตรวจ ก็จะวนกลับไปที่ข้อ 2 อีกครั้ง ทำให้สรุปได้สักทีว่า (พกใบขับขี่, ตรวจ) คือจุดสมดุลของเกมนี้

หรือสรุปกระบวนการทั้งหมดเป็นตารางดังต่อไปนี้

ไม่ว่าจะใช้วิธีการคิดแบบไหนเราจะพบว่าจุดสมดุลหรือตัวเลือกที่ดีที่สุดสำหรับทั้งสองฝ่ายระหว่างเราและตำรวจก็คือการที่เราพกใบขับขี่ไปด้วยทุกครั้งที่ต้องใช้รถ และตำรวจก็ออกมาตรวจคนที่ทำผิดกฎจราจร คือมันไม่จำเป็นต้องไปอ้างถึงระบบชนชั้นหรือทำให้เป็นเรื่องราวดราม่าแต่อย่างใดเลย ใช้ทฤษฎีเกมสิครับ มันช่วยให้ตัดสินใจได้ดีขึ้นเยอะเลยนะ!

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

No responses yet

Write a response