การแปะข้อมูล (Label) เพื่อใช้ในการสอน Machine Learning หรือ Deep Learning เป็นหนึ่งในขั้นตอนที่ใช้ทรัพยากรมนุษย์เป็นอย่างมากในการสร้าง AI ดังนั้นการลดการพึ่งพาการแปะข้อมูลโดยมนุษย์ลงได้จะสามารถทำให้เกิด AI ใหม่ ๆ ได้รวดเร็วมากขึ้น Self Supervised Learning แนวคิดของ Deep Learning แบบใหม่ที่สามารถสร้างทำความเข้าใจและแปะข้อมูลด้วยตัวเองได้ จะมีความแม่นยำแค่ไหน แล้วมันจะเปลี่ยนขั้นตอนการสร้าง AI ในตอนนี้และอนาคตกันได้อย่างไร
บนโลกนี้มีแนวคิดของการสอน Deep Learning ให้ทำความเข้าใจกับรูปแบบของข้อมูลอยู่ทั้งหมด 3 รูปแบบ คือ Supervised Learning, Unsupervised Learning และ Reinforcement Learning ซึ่งทั้งสามนี้ออกแบบขึ้นมาเพื่องานที่แตกต่างกัน โดยหลักคือ Supervised Learning จะเป็นรูปแบบที่มนุษย์ต้องสอนผ่านกระบวนการแปะข้อมูล (Label) กำกับว่าข้อมูลหรือรูปภาพนี้คืออะไร Unsupervised Learning เป็นรูปแบบที่ตัว Deep Learning จะเรียนรู้รูปแบบของข้อมูลจาก Input ที่ได้มา จับกลุ่มของข้อมูลและสร้างเป็น Output ขึ้นมาเอง และสุดท้าย Reinforcement Learning คือตัว Deep Learning จะลงเข้าไปมีปฏิสัมพันธ์กับสิ่งแวดล้อมเองโดยที่ตัวมันเองจะคอยเรียนรู้ระบบและการทำงานผ่านระบบลองผิดลองถูกด้วยตัวเอง ซึ่งงานหลาย ๆ งานของ AI ในทุกวันนี้ไม่สามารถที่จะทำความเข้าใจรูปแบบของข้อมูลเองได้ ดังนั้นหลาย ๆ งาน เช่น งานตรวจจับวัตถุในภาพ จำเป็นต้องใช้ Supervised Learning เพื่อความชัดเจนของการสอน AI ให้เข้าสู่จุดที่ AI สามารถนำมาใช้งานได้เร็วที่สุด
แต่ปัญหาหนึ่งคือเมื่อข้อมูลที่ใช้ในการสอน AI นั้นต้องผ่านการแปะข้อมูลโดยมนุษย์ก่อนที่จะนำไปสอน AI หมายความว่าในขั้นตอนการสอน AI ก็จะเกิดคอขวดในกระบวนการแปะข้อมูล ซึ่งขั้นตอนเตรียมข้อมูลจากการแปะข้อมูลโดยมนุษย์เป็นหนึ่งในขั้นตอนที่เสียเวลาและทรัพยากรมากที่สุดขั้นตอนหนึ่งในการสร้าง AI ทำให้ในวงการ AI เกิดแนวคิดหนึ่งขึ้นมานั้นก็คือ ทำไมเราไม่ให้ AI เป็นคนเรียนรู้ ทำความเข้าใจข้อมูลและเป็นผู้แปะข้อมูลเองเสียเลย เพื่อที่จะประหยัดเวลาในการทำงาน ลดคอขวดจากขั้นตอนแปะข้อมูลโดยมนุษย์ เราเรียกวิธีการนี้ว่า Self Supervised Learning
Self Supervised Learning แม้ว่าชื่อของมันคือ ตัวคอมพิวเตอร์สามารถเรียนรู้และแปะข้อมูลได้ด้วยตัวเอง แต่มันไม่ได้เกิดและต่อยอดจากแนวคิดของ Unsupervised Learning แต่เป็นการต่อยอดจาก Supervised Learning ที่ใช้แนวคิดคือให้ Deep Learning เป็นทั้งตัวประมวลผลข้อมูลและสร้างข้อมูลใหม่ขึ้นมาเอง
ยกตัวอย่างการทำงานของ Deep Learning ที่ใช้โครงสร้าง Self Supervised Learning ประเภทประมวลผลรูปภาพเพื่อให้เข้าใจได้ง่ายขึ้น
ตัว Deep Learning เริ่มต้นจะเป็นตัวโครงข่ายประสาทสองฝั่ง คือโครงข่ายประสาทเฉพาะเพื่อทำการประมวลผลภาพและโครงข่ายประสาทที่ใช้ในการสร้างภาพ โดยหลักการคือให้โครงข่ายประสาทประมวลผลภาพอ่านภาพและให้โครงข่ายประสาทสร้างภาพสร้างภาพที่อ่านแล้วให้กลับมาให้มีหน้าตาที่เหมือนเดิม เมื่อมองเผิน ๆ เราจะคิดว่าเป็นกระบวนการที่ดูไร้สาระ ราวกับมันคัดลอกรูปอย่างไรอย่างนั้น แต่เมื่อเรามองเข้าไปในกระบวนการทำงาน Deep Learning ส่วนที่ทำหน้าที่ไว้สำหรับการประมวลผลภาพนั้นถูกออกแบบให้แยกออกจากตัวที่ทำหน้าที่สร้างภาพอย่างชัดเจน โดยเราเรียกส่วนประมวลผลภาพว่า Encoder ส่วนสร้างภาพเราเรียกว่า Decoder ทั้งสองสื่อสารกันผ่านชุดข้อมูลที่อยู่ในรูปแบบของเมทริกซ์ (Matrix) เมื่อเราสอนทั้งหมดเสร็จสิ้น เราจะแบ่งส่วน Encoder ออกมาและทำความเข้าใจกับรูปแบบข้อมูลของเมทริกซ์นั้นออกมาเพื่อนำมาใช้ในการแยกแยะข้อมูลต่อไป ซึ่งไม่น่าเชื่อว่ากระบวนการที่ให้ตัว Deep Learning เรียนรู้ข้อมูลด้วยตัวเองด้วยวิธีนี้กลับสามารถทำให้ Deep Learning มีประสิทธิภาพการทำงานที่เทียบเท่าหรือมากกว่าวิธีการดั้งเดิมแบบ Supervised Learning
ซึ่งบางโครงสร้างที่เรียกว่า Semi Supervised Learning ก็ใช้แนวคิดเดียวกับ Self Supervised Learning ที่ให้ตัว Deep Learning ทำการเรียนรู้ข้อมูลด้วยตัวเอง แต่เราสามารถเพิ่มข้อมูลที่แปะป้ายไว้เรียบร้อยแล้วปริมาณหนึ่ง (1-10%) เข้าไปในตัว Deep Learning ด้วย จากนั้นตัว Deep Learning จะทำการเรียนรู้และแปะป้ายข้อมูลโดยอัตโนมัติ ทำให้สามารถเพิ่มความแม่นยำในการเรียนรู้และความเร็วได้ โดยที่ไม่ต้องให้คนแปะป้ายข้อมูลทั้งหมดเหมือนเดิม
Deep Learning ที่ใช้แนวคิด Self Supervised Learning นั้นไม่ได้ถูกนำมาประยุกต์ใช้กับงานด้านวิเคราะห์ผลภาพเท่านั้นแต่ยังถูกนำมาใช้สำหรับโมเดลภาษาขนาดใหญ่อย่าง GPT-3 และ GPT-4o อีกด้วย ในตอนนี้ AI ที่ใช้งาน Self Supervised Learning นั้นมีมากมาย ตัวอย่างเช่น GPT-3 ของ OpenAI Bidirectional Encoder Representations from Transformers (BERT) ของ Google หรือ Segment Anything Model 2 (SAM2) ของ Meta (Facebook) ซึ่งราวกับว่าตอนนี้หลาย ๆ โมเดลในตอนนี้สามารถลดการพึ่งพาข้อมูลที่ถูกแปะข้อมูลสำหรับการสอนลดลงไปได้มาก ซึ่งทำให้เกิด Pre-trained หรือโมเดลใหม่ ๆ ได้มากและเร็วยิ่งขึ้น ซึ่งทำให้ผู้คนสามารถนำโมเดลเหล่านี้ไปสร้างชิ้นงานหรือโมเดลเฉพาะงานสำหรับตัวเองได้เพิ่มมากยิ่งขึ้นไปอีก เช่น โมเดลสำหรับการตรวจหาวัณโรคปอดจากภาพเอกซเรย์ได้รวดเร็วและแม่นยำยิ่งขึ้น
แม้ประโยชน์ของ Self Supervised Learning ในตอนนี้ดูเหมือนจะมีมากมายพร้อมกับความแม่นยำที่เพิ่มขึ้น แต่สิ่งหนึ่งที่เป็นข้อด้อยของมันคือการที่ตัวโมเดลต้องพึ่งพาทรัพยากรคอมพิวเตอร์สมรรถนะสูงในการประมวลผลและสอนโมเดล และใช้เวลาในการเรียนรู้ที่ค่อนข้างมาก จึงมาพร้อมกับการบริโภคไฟฟ้าที่สูงมากในการประมวลผลแต่ละครั้ง แต่เมื่อเทียบกับระยะเวลาในการพึ่งพาการแปะข้อมูลโดยมนุษย์ก็นับว่าเป็นวิธีการที่เร็วกว่าและเป็นอนาคตสำหรับอีกหลาย ๆ โมเดลที่กำลังพัฒนาอยู่ในเวลานี้
เรียบเรียงโดย จิรสิน อัศวกุล
พิสูจน์อักษร ศุภกิจ พัฒนพิฑูรย์
อัปเดตข้อมูลแวดวงวิทยาศาสตร์ เทคโนโลยี รู้ทันโลกไอที และโซเชียลฯ ในรูปแบบ Audio จาก AI เสียงผู้ประกาศของไทยพีบีเอส ได้ที่ Thai PBS
“รอบรู้ ดูกระแส ก้าวทันโลก” ไปกับ Thai PBS Sci & Tech