Minimum point ตอนที่ 2: Differentiation คือคำตอบ

2 min readDec 3, 2022

การหาจุดต่ำสุดของฟังก์ชันมันจะเป็นเรื่องราวที่ง่ายขึ้นมากเลยหากรู้ว่าฟังก์ชันนั้นมีลักษณะเป็นยังไง ยกตัวอย่างว่าเป็นฟังก์ชัน f(x) = x ^ 2 ที่มีลักษณะเป็นแบบรูปที่ 1 ก็แทบจะบอกได้ในทันทีว่าจุดต่ำสุดนั้นอยู่ในบริเวณจุดสีแดงอย่างแน่นอน

**รูปที่ 1:** ตัวอย่างของจุดต่ำสุดของฟังก์ชัน x ^ 2

แต่ในการพล็อตกราฟแต่ละกราฟได้นั้นแสดงว่า สำหรับที่แต่ละค่าของ x เราต้องคำนวณ y ที่สอดคล้องเตรียมรอไว้อยู่แล้ว แล้วบางทีกว่าจะหาได้ครบก็กินเวลานานจนเกินรอ ยิ่งในยุคที่ทุกอย่างต้องไว slow life ไม่ใช่คำตอบอีกต่อไป จึงเกิดคำถามว่าทำไมถึงต้องพล็อตกราฟทุกครั้งเพียงเพื่อที่จะระบุตำแหน่งของจุดต่ำสุดจุดเดียวเท่านั้น มันคุ้มค่าแล้วหรอ

มันมีวิธีไหนอื่นบ้างอีกรึเปล่าที่สามารถหาจุดต่ำสุดได้โดยไม่จำเป็นต้องรู้ค่าของฟังก์ชันทั่วทั้งขอบเขตที่สนใจ

Differentiation คือคำตอบ

หากพูดถึงในทางทฤษฎี ความเป็นไปได้ในการหาจุดต่ำสุดของฟังก์ชันโดยที่ไม่ต้องคำนวณค่าของฟังก์ชันในแต่ละจุดนั้นยังมีอยู่ แต่จำเป็นที่จะต้องมีเงื่อนไขเพิ่มเติม นั่นคือว่า

เราต้องรู้ก่อนว่าฟังก์ชันมีหน้าตา (explicit form) เป็นยังไง อย่างเช่นว่าฟังก์ชันนั้นมีหน้าตาเป็น x ^ 2
ฟังก์ชันนั้นต้อง smooooooooooth ในระดับหนึ่ง ซึ่งหมายความคร่าว ๆ ได้ว่ามีความต่อเนื่อง นุ่มนวล กราฟไม่มีการขึ้นลงอย่างฉับพลัน

ภายใต้เงื่อนไขนี้ เราสามารถหาจุดต่ำสุดได้ด้วยความรวดเร็สจากการใช้ second derivative test ซึ่งวิธีนี้ได้รับแรงบันดาลใจมาจากการสังเกตลักษณะพฤติกรรมของจุดบริเวณรอบ ๆ จุดต่ำสุดว่าทำตัวน่าสงสัยยังไงบ้าง

ยกตัวอย่างเช่น มีฟังก์ชัน f(x) = x ^ 2 โดยที่จะสนใจในช่วงของ x ตั้งแต่ -10 ถึง 10 จากในบทความนี้ เรารู้มาแล้วว่าจุดต่ำสุดของฟังก์ชันดังกล่าวอยู่ที่ (0, 0) แสดงว่าเพื่อให้เกิดจุดต่ำสุดเมื่อ x มีค่าเท่ากับ 0 แสดงว่า ถ้าเราค่อย ๆ เพิ่มค่า x ไปเรื่อย ๆ จากตั้งแต่ -10 ในช่วงที่ยังไม่เจอจุดต่ำสุด ลักษณะกราฟจะดิ่งลงเรื่อย ๆ (เหมือนราคาหุ้นในพอร์ต) จนเมื่อไหร่ก็ตามที่เจอจุดต่ำสุดและผ่านพ้นจุดนี้ไปได้แล้ว ลักษณะกราฟก็จะเปลี่ยนทิศทางเป็นขาขึ้น

**รูปที่ 2:** พฤติกรรมของกราฟบริเวณจุดต่ำสุด (a) ก่อนถึงจุดต่ำสุด, (b) ณ จุดต่ำสุด, และ (c) เมื่อผ่านจุดต่ำสุด.

ด้วยข้อสังเกตนี้เลยกลายเป็นว่าถ้ามาดูความชันของแต่ละจุดในกราฟมันก็น่าจะเป็นไปได้ที่จะพอระบุตำแหน่งของจุดต่ำสุดได้ เพราะจุดต่ำสุดจะทำตัวเหมือนเป็นการวกกลับของทิศทางกราฟ หากระบุได้ว่าความชันของกราฟที่จากเดิมดิ่งลงมาก ๆ แล้วอยู่ ๆ ก็เริ่มดีขึ้นจนเหมือนยูเทิร์น บริเวณตรงนั้นแหล่ะที่น่าจะมีจุดต่ำสุดอยู่

ซึ่งในทางคณิตศาสตร์ก็มีการศึกษาอย่างละเอียดในการอธิบายความชัน (slope, gradient) ของฟังก์ชันที่จุดต่าง ๆ ทั่วทั้งขอบเขตที่สนใจ มีลักษณะบางจุดที่สามารถหาความชันได้ บางจุดก็หาไม่ได้ ซึ่งสามารถอ่านเพิ่มเติมได้ที่บทความนี้ (แต่ตอนนี้ยังกดไปอ่านไม่ได้)

โดยแนวคิดคร่าว ๆ ของความชันจะเป็นว่าให้ลากเส้นมาสัมผัสกับฟังก์ชันที่จุดที่สนใจแล้ว (เหมือนเส้นสีแดงในรูปที่ 2) ความชันของเส้นตรงนั้นมีค่าเท่าไหร่ ก็จะเป็นเป็นความชันของฟังก์ชันที่จุดนั้นเลย โดยถ้ากราฟเส้นตรงที่มาสัมผัสนี้เฉียงลงค่าความชันจะมีค่าเป็นลบ และในทางกลับกันค่าความชันจะกลายเป็นค่าบวกเมื่อกราฟเส้นเตรงที่มาสัมผัสเฉียงขึ้น

แล้วอย่างนั้น ความชันที่จุดต่ำสุดควรมีค่าเป็นเท่าไหร่ ในเมื่อโซนทางซ้ายที่ก่อนจะถึงจุดต่ำสุดมีความชันเป็นลบไปแล้ว ส่วนโซนทางขวาก็มีความชันเป็นบวก

**รูปที่ 3:** ความชันของแต่ละช่วงในฟังก์ชัน f(x) = x ^ 2

ด้วยความนุ่มนวลของกราฟที่เป็นหนึ่งในเงื่อนไขของการใช้กระบวนการนี้ในการหาจุดต่ำสุดของฟังก์ชัน จะเป็นการการันตีว่าถ้าทางซ้ายมีความชันเป็นลบและทางขวาเป็นบวก แล้วตรงที่จุดต่ำสุดจะมีความชันเป็นอื่นใดเลยไม่ได้นอกจากต้องมีค่าเป็นศูนย์เท่านั้น หรือก็คือ

ความชันที่จุดต่ำสุดมีค่าเป็นศูนย์

มากกว่านั้น ถ้าให้ความสนใจไปที่ความชันอีกจะได้ว่าจากความชันทางซ้ายของจุดต่ำสุด, ความชันที่จุดต่ำสุด, และความชันทางขวาของจุดต่ำสุด ค่อย ๆ มีการเพิ่มขึ้นจากที่เป็นค่าลบ ก็เริ่มมาเป็น 0 และก็เพิ่มขึ้นเป็นค่าบวกในท้ายที่สุด ข้อเท็จจริงตรงนี้จะสามารถสรุปได้ว่าการเปลี่ยนแปลงของความชันนี้จะต้องมีทิศทางที่เพิ่มขึ้นบริเวณจุดต่ำสุดด้วย หรือก็คือ

ความชันของความชันที่จุดต่ำสุดต้องมีค่าเป็นบวก

และนี่เองก็เป็นที่มาของการตั้งชื่อกระบวนการนี้ว่า second derivative test เพราะว่าเราสามารถหาความชันได้จาก differentiation เพื่อหา derivative ของฟังก์ชัน แต่คราวนี้เราสนใจไปที่ความชันของความชัน เลยกลายเป็นว่าต้อง differentiate 2 รอบจนได้เป็น second derivative

differentiation คือกระบวนการ ส่วน derivative คือผลของการทำ differentiation

หน้าที่ของเราที่เหลือก็คือไปทดสอบดูว่ามีจุดไหนในขอบเขตที่สนใจที่มันเข้าข่ายกับข้อมูลอมูลที่ได้จากพฤติกรรมของจุดต่ำสุดทั้ง 2 ข้อนี้รึเปล่า

จากทฤษฎีสู่การนำไปใช้งาน

การจะให้ทดสอบกับทุกจุดในขอบเขตที่สนใจเลยมันอาจจะโหดร้ายเกินไป จึงมีการใช้ประโยชน์จากข้อมูลแรกที่เราได้มาว่า “ความชันที่จุดต่ำสุดเป็นศูนย์” ในการคัดกรองเบื้องต้นเพื่อเหลือเฉพาะจุดที่มีแนวโน้มว่าใช่ ต้องใช่แน่ ๆ เท่านั้นเพื่อไปทดสอบใน second derivative test ต่อไป

แต่ด้วยตัวข้อความที่อาจกำกวมอย่าง “ความชันที่จุดต่ำสุดเป็นศูนย์” นี้เองสามารถถูกถอดความมาได้ว่า “ถ้าจุดนั้นเป็นจุดต่ำสุดแล้วความชันที่จุดนั้นจะมีค่าเท่ากับศูนย์” ซึ่งพอเมื่อเป็นประโยค “ถ้า…แล้ว” แบบนี้ อาจทำให้เข้าใจผิดได้ว่าความเป็นไปได้ในทางกลับกันก็ต้องเป็นจริงด้วย

ซึ่งบนโลกที่เต็มไปด้วยอุปสรรคที่ไม่เคยปราณีใครนี้ การบอกในทางกลับกันว่า “ถ้าจุดนั้นมีความชันเป็นศูนย์แล้ว จุดนั้นนั่นแหล่ะคือจุดต่ำสุด” จะไม่จริงเสมอไป เพราะตัวอย่างที่ยกมาค้านได้ก็คือจุดสูงสุดที่มีพฤติกรรมคล้าย ๆ กับจุดต่ำสุดเลย เพียงแต่กลับด้านกันเท่านั้น หมายความว่าความชันทางด้านซ้ายของจุดสูงสุดจะเป็นบวกแล้วค่อยกลายเป็นลบเมื่อผ่านจุดสูงสุดไปแล้ว

ยกตัวอย่างในรูปที่ 4 ถ้าได้ลองลากเส้นตรงเพื่อสัมผัสจุดสีแดงทั้งสองจะพบว่าความชันของเส้นตรงเหล่านั้นจะเป็น 0 หรือก็คือเส้นตรงเหล่านั้นเป็นเส้นแนวนอนแบนราบเลย แต่ว่าจุดสองจุดนี้อาจจะมีจุดที่เป็นจุดต่ำสุดจริง ๆ ก็ได้ หรือบางทีอาจจะเป็นจุดที่แอบเนียนมาก็ได้เช่นกัน

**รูปที่ 4:** ตัวอย่างของจุดที่มีความชันเป็น 0 (จุดสีแดง) จะพบว่ามันอาจจะไม่ใช่จุดต่ำสุดก็ได้

ถึงแม้ว่าผลมันจะมีตัวที่แอบเนียนมาอยู่บ้าง แต่ก็เป็นประโยชน์อย่างมากในการช่วยระบุจุดต่าง ๆ ที่มีแววว่าจะเป็นจุดต่ำสุดได้ เพราะแทนที่จะต้องไปไล่ดูทุกจุดที่เป็นไปได้ในขอบเขตที่สนใจ เราก็สามารถลดเวลาลงมาดูเฉพาะจุดที่มันมีความชันเป็น 0 ก็เพียงพอแล้ว แต่ต้องไม่ลืมว่าจุดที่ได้มานั้น ไม่ใช่ว่าทุกจุดจะเป็นจุดต่ำสุดได้เสมอไป

มาถึงตรงนี้จะเห็นว่าจุดที่มีความชันเป็น 0 นั้นเริ่มมีบทบาทขึ้นมาแล้ว พอสปอตไลท์เริ่มส่งไปถึง น้องก็เดบิวต์ด้วยชื่อที่เท่ขึ้นว่า critical point หรือ stationary point นั่นเอง

แต่ก็ไม่ต้องกังวลใจไป เพราะเราจะตรวจสอบจุดที่มีแววเหล่านี้อีกทีด้วยการดูไปที่ความชันของความชัน (second derivative) ว่ามีค่าเป็นบวกรึเปล่า ถ้าใช่แสดงว่าจุดนั้นแหล่ะที่เป็นจุดต่ำสุดจริง ๆ แต่ถ้ามันจะไม่ใช่ก็คือไม่ใช่ ก็ต้องทำใจมูฟออนกันต่อไป

ความน่าเศร้าของ second derivative test

อย่างไรก็ตาม วิธีการ second derivative test นี้จะเป็นการระบุตำแหน่งของจุดต่ำสุดในลักษณะของ local minimum เท่านั้น เพราะฉะนั้นในการที่จะไปถึง global minimum ก็อาจจะนำค่า x จาก local minimum ที่ได้มาจากการทดสอบนี้กลับไปแทนในตัวฟังก์ชันดูเพื่อเปรียบเทียบค่าว่าในบรรดา local minimum เหล่านั้นตัวไหนให้ค่าต่ำสุดของต่ำสุดอีกที

และบางทีในความโชคร้ายของจุดต่ำสุดของต่ำสุดที่เฟ้นหามาจาก local minimum นั้น อาจจะต้องมาดูค่าที่ขอบของโดเมน (boundary value) ด้วย เพราะว่าบางทีลักษณะฟังก์ชันที่เราสนใจมันอาจจะไม่ได้เอื้ออำนวยให้หาจุดต่ำสุดได้อย่างตรงไปตรงมาด้วยวิธีการนี้ และจุดต่ำสุดแบบ global minimum ดันไปอยู่ที่ค่าขอบของโดเมนแทน

จะเห็นว่าวิธีการของ second derivative test นั้นเป็นวิธีการที่ทรงพลังมาก ๆ เพียงแค่รู้ว่าฟังก์ชันถูกเขียนให้อยู่ในรูปแบบไหน และสามารถหาความชันของความชันได้ทุกจุดในโดเมน ก็จะสามารถใช้หาตำแหน่งของ local minimum ได้เลย และถ้าอยากได้ global minimum ก็อาจจะมีรายละเอียดนิดหน่อยให้ต้องคิดเพิ่มเติม แต่ประเด็นหลัก ๆ เลยคือในหลาย ๆ เหตุการณ์ เราไม่สามารถรับรู้ได้เลยว่าฟังก์ชันที่เราต้องการรู้จุดต่ำสุดมันมีหน้าตาเป็นยังไงกันแน่ และไม่ต้องถามว่ามัน smooth มั้ย ซึ่งก็ไม่สามารถตอบได้

ในเมื่อเงื่อนไขที่จำเป็นไม่สามารถถูกยืนยันได้ จะฝืนใช้ second derivative test ต่อไปดูจะดันทุรังไปเปล่า ๆ แล้วคำถามคือ ในเคสแบบนี้ เรามีวิธีการหาจุดต่ำสุดของฟังก์ชันได้ยังไงในเมื่ออะไร ๆ ก็ดูไม่เป็นใจขนาดนี้ ติดตามต่อได้ในบทความนี้ครับ

Minimum point ตอนที่ 2: Differentiation คือคำตอบ

Differentiation คือคำตอบ

จากทฤษฎีสู่การนำไปใช้งาน

ความน่าเศร้าของ second derivative test

Sign up to discover human stories that deepen your understanding of the world.

Free

Membership

Written by Pakhapoom Sarapat

No responses yet