Category: การศึกษา

The Minard Map – “The best statistical graphic ever drawn”

The Minard Map – “The best statistical graphic ever drawn” แผนภาพที่ Visualize ข้อมูลที่ถูกยกย่องว่าดีที่สุดที่เคยทำมา เพราะภาพเดียวสามารถ represent เนื้อหาได้ถึง 6 แกน เป็นการอธิบายถึงการรุกรานรัสเซียของฝรั่งเศสโดยกองทัพนโปเลียน
1. ภูมิศาสตร์ ชื่อแม่น้ำ, เมือง และสมรภูมิที่เกิดขึ้นในสงคราม
2. เส้นทางของกองทัพนโปเลียน (สังเกตมีเส้นแยก คือทหารหลงทาง)
3. ทิศทางของกองทัพ สีแดงคือขาไป สีดำคือขากลับ
4. จำนวนทหารที่คงเหลือ แสดงด้วยขนาดของเส้น (ไป 422,000 เหลือกลับมา 10,000)
5. อุณหภูมิ สงครามรัสเซีย กองทัพนโปเลียนเสียเปรียบเพราะความหนาวเย็น จึงเป็นปัจจัยที่สำคัญมาก
6. เวลา ว่าเกิดเหตุการณ์ใดขึ้นในเวลาใด

แผนภาพหรือ Infographic ที่ดีไม่ได้แปลว่าสวย แต่แปลว่าข้อมูลถูกต้องเชื่อถือได้ และมองแค่ภาพเดียว “จบ”

ทำไมการตัดคำไทยในประโยคถึงมีความสำคัญนัก ?

ความสำคัญของการตัดคำไทยอยู่ตรงที่ปัจจุบันธุรกิจมีการรับข้อมูลจากลูกค้าในหลายรูปแบบ อาจจะเป็นข้อความ text, message หรือข้อความใน Social Media ข้อความที่ถูกแปลงมาจากเสียง Call Center ซึ่งเราคงไม่สามารถให้คนมานั่งอ่านและแปลความหมายได้ทั้งหมด เนื่องจากปริมาณข้อมูลที่เข้ามาในปัจจุบันมีมหาศาล หรือที่ชอบเรียกกันว่า Big Data นั่นแหละครับ เราจึงสามารถให้เครื่องทำการตัดคำและนำคำที่ได้รวมถึงจำนวนคำและตำแหน่งที่คำปรากฏในประโยคมาทำการวิเคราะห์เพื่อเข้าใจบริบทของข้อความนั้นๆ ซึ่งการที่เราสามารถให้คอมพิวเตอร์เข้าใจและแปลผลออกมาได้เองนั้นมีความสำคัญอย่างยิ่งยวดในการหา Insight ที่เป็นประโยชน์กับธุรกิจ หรือในทุกๆ วงการเลยก็ว่าได้

ตั้งแต่อดีตที่ผ่านมา การตัดคำไทยเป็นเรื่องที่ยากเย็นเมื่อเทียบกับหลายๆ ภาษา (ง่ายสุดอาจจะเป็นภาษาอังกฤษ) เนื่องจากความซับซ้อนของไวยากรณ์ สระ และลักษณะการต่อคำแบบไม่มีช่องไฟ เช่น

นั่งตากลม >> “นั่ง” “ตาก” “ลม”

อาจจะถูกตัดออกเป็น

นั่งตากลม >> “นั่ง” “ตา” “กลม”

ความยากนี้คงได้รับการแก้ไขไปแล้ว ถ้าภาษาไทยเป็นภาษาที่มีคนนิยมใช้ทั่วโลก แต่เนื่องจากมันไม่ใช่ คนที่ให้ความสำคัญกับการตัดคำไทยจึงมักเป็นคนไทยเรานี่แหละ แต่เนื่องด้วยขีดจำกัดทางความสามารถ จึงทำให้ปัญหายังไม่ถูกแก้ไขได้เสียที จนช่วงหลังที่เรื่อง Machine Learning ที่สามารถทำความเข้าใจเชิงลึกได้ (Deep Learning) เข้ามามีบทบาทมากขึ้น Google ได้ทำการเปิด Library (เครื่องมือที่นักพัฒนาเอาไปใช้ต่อยอดได้) ที่ชื่อว่า Tensorflow ออกมา นักพัฒนาจึงสามารถต่อยอดจนเกิดการนำ Deep Learning ไปใช้แก้ปัญหาในหลากหลายรูปแบบ

ซึ่งล่าสุดนักวิทยาศาสตร์ข้อมูล (Data Scientist) จาก True คุณ Rakpong Kittinaradorn ก็ได้ทำการคิดค้น Library ที่ต่อยอดจากการใช้งาน TensorFlow ในชื่อ Deepcut และเปิดให้คนทั่วไปใช้ได้ ดูรายละเอียดเพิ่มเติมที่นี่ครับ วันนี้เลยเอามาลองตัดคำเล่นดูตามภาพด้านล่างครับ

ซึ่งถ้าดูคร่าวๆ แล้วผลก็เป็นที่น่าพอใจมากที่เดียว มีบางจุดที่เค้ายังไม่ได้ cover เช่นภาษาวิบัติ “ก็” >> “ก้อ” ซึ่งเชื่อว่า Algorithm คงมีวิวัฒนาการไปพร้อมกับภาษาอยู่แล้ว ซึ่งถือเป็นนิมิตรหมายที่ดีในการใช้ประโยชน์ของศาสตร์ด้าน Machine Learning กับภาษามนุษย์ครับ

 

(เพิ่มคะแนน TOEIC) แนะนำวีดีโอฟังง่าย เหมาะแก่การฝึก Listening

ไม่ได้เขียนเรื่อง TOEIC มาพักใหญ่ๆ วันนี้เลยจะมาแนะนำเพิ่มเติมในส่วนของ Listening ซึ่งโดยปกติแล้วเป็น Part ที่เก็บคะแนนได้ง่ายยิ่งกว่า Reading ในหลายๆ เหตุผล (ส่วนตัวผมก็ได้ Listening มากกว่า Reading) เพราะจริงๆ แล้วเท่าที่รับฟังปัญหาของคนที่สอบได้คะแนนไม่เป็นที่น่าพึงพอใจ เพราะทำไม่ทัน มากกว่าที่จะบอกว่ามันยาก และเจ้าส่วน Listening โดยปกติมันจบในตัวของมันในเวลาที่กำหนดอยู่แล้ว แต่สิ่งที่เป็นปัญหาคือ การฟังไม่ทัน ซึ่งจริงๆ แล้วเมื่อเทียบกับการใช้งานภาษาอังกฤษปกติ ต้องบอกว่า Listening ของ TOEIC นั้นถือว่า “ช้าและชัด” “ถามกันตรงๆ ไม่มีอ้อมค้อม”

เมื่อรู้อย่างนี้แล้วสิ่งที่เราควรทำก็คือ การฝึกฟังเยอะๆ แต่การจะฝึกฟังเยอะๆ โดยที่ไม่ทำให้เกิดอาการเบื่อหน่ายนี้ก็ยากอยู่ โดยเฉพาะกับการเอาเทปเสียงที่ใช้เตรียมตัวสอบมาฟัง เพราะมันน่าเบื่อมากกกก หรือครั้นจะไปหยิบหนังมาฝึก ไอ้เจ้าตัวละครในหนังหลายๆ ตัวก็พูดเร็วยังกะร้องเพลงแร๊พ (แถมสำเนียงยังแปลกๆ อีก) บางคนก็เหมือนบ่นพึมพำอะไรไม่รู้ในลำคอ วันนี้ก็เลยหยิบเอาวีดีโอที่คัดสรรมาเป็นอย่างดีแล้ว เพราะเปิด subtitle ภาษาอังกฤษ ได้โดยตรงจาก Youtube มาแนะนำกัน

ขอให้จำไว้ว่าการฝึกครั้งนี้ เน้นไปที่การจับสำเนียงให้ได้ (รู้ว่า words ออกเสียงอย่างไร) มากกว่าการฟังรู้เรื่องนะครับ แต่ผมจะสรุปคร่าวๆ ว่าวีดีโอนี้มันเกี่ยวกับอะไรให้

วีดีโอที่ 1: The Lost Interview by Steve Jobs

Steve Jobs ถือเป็นการที่พูดภาษาอังกฤษได้ชัดมากๆๆ คนนึง และนอกจากนั้นเทคนิคการพูดของเขายังทำให้คนฟังไม่หลับอีกด้วย ในวีดีโอนี้จะเป็นการบอกเล่าเรื่องราวที่ไม่ค่อยได้ปรากฏในหนังสือเล่มไหน

วีดีโอที่ 2: CONTAGIOUS: WHY THINGS CATCH ON BY JONAH BERGER | ANIMATED REVIEW

วีดีโอนี้เป็นหนึ่งใน Channel ที่ผมแนะนำให้ ไปดูทั้งหมด เพราะเจ้านี้เค้าจัดการเอาหนังสือที่น่าสนใจเป็นจำนวนมากมาย่อยให้อยู่ในรูปที่เป็นแอนิเมชั่นและจบภายในเวลาไม่กี่นาที ที่สำคัญพูดชัดมาก และฝัง subtitle โดยเฉพาะ (ไม่ได้เกิดจาก Youtube แปลงเสียงเป็นคำ) ใครอยากอ่านหนังสือเยอะๆ แต่ไม่มีเวลา ห้ามพลาด

วีดีโอที่ 3:Guy Kawasaki: The Top 10 Mistakes of Entrepreneurs

คนทั่วไปอาจจะไม่รู้จัก Guy Kawasaki แต่ชื่อนี้ถือเป็นชื่อที่ดังมากในหมู่คนทำ Startup เพราะถือเป็นคนที่มีประสบการณ์การทำงานกับ Steve Jobs และโด่งดังในรูปแบบการทำการตลาดแบบ Evangelist และเช่นเคยที่สำคัญ พูดชัดมาก

วีดีโอที่ 4: Al Gore: The Case for Optimism on Climate Change (TED 2016)

Al Gore เป็นหนึ่งในคนที่พูดภาษาอังกฤษได้ชัดและคล้าย บทสนทนาที่เราจะเจอในข้อสอบมาก เสียงทุ้มๆ พูดชัดๆ ซึ่งถ้าใครชอบเรื่องภาวะโลกร้อน ก็จะเพลิดเพลินไปกับการฝึกฟังกับวีดีโอนี้มากๆ

จริงๆ แล้วยังมีวีดีโอแนะนำอีกมากครับ ซึ่งถ้าใครสนใจต่อก็สามารถมาคุยกันได้ที่ Kongwiz’s Blog (ขายของ เพจเพิ่งเปิด อิอิ)

ขอปิดท้ายด้วยตัวอย่างสำเนียงที่ไม่ควรเอามาฝึกฟังเป็นอย่างยิ่ง เพราะจะทำให้ท่านเสียเวลาโดยเปล่าประโยชน์ …..

แถมอีกนิด…