Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
EKH เดินหน้าเข้าร่วมโครงการ “JUMP+”
MAI
MMM ลุยโรดโชว์ก่อนขายหุ้น PO 64.2 ล้านหุ้น
IPO
MMM เคาะราคา 5.5 บาท/หุ้น เปิดจอง 28-30 ต.ค.นี้
บล./บลจ
“โกลเบล็ก” ระบุราคาทองคำยังน่าจับตา!
เศรษฐกิจ-การเงิน-การคลัง
SCB EIC ส่องศก.อ่อนแรง ส่งออกชะลอตัว – เงินฝืดพุ่ง
การค้า - พาณิชย์
พาณิชย์ดันข้าวไทยในงาน Anuga 2025 พร้อมลุยตลาดยุโรป
พลังงาน - อุตสาหกรรม
FSMART จับมือ JPARK เปิดจุดชาร์จ ‘กิ้งก่า EV’ ในลานจอดรถ
คมนาคม - โลจิสติกส์
TRUE คลอดหุ้นกู้ 4 ชุดใหม่ รองรับแผนลงทุนในอนาคต
แบงก์ - นอนแบงก์
กสิกรไทย เปิดตัวโครงการนำร่อง Carbon Credit Tokenization
ไฟแนนซ์ - ลิสซิ่ง
กรุงศรี ออโต้ หนุนสินเชื่อรถยนต์ไฟฟ้า ส่งข้อเสนอพิเศษส่งท้ายปี
SMEs - Startup
SCBX จับมือ สกมช. เสริมแกร่งความมั่นคงไซเบอร์ไทย
ประกันภัย - ประกันชีวิต
อลิอันซ์ อยุธยา ลั่นกลองรบตลาดยูนิตลิงค์ เปิดตัว 5 กองทุนใหม่
รถยนต์
PTG จัดศึก “PT MAXNITRON RACING SERIES 2025: SONGKHLA GRANDPRIX”
ท่องเที่ยว
GCAP เปิดตัวโดรนโดยสารไร้คนขับครั้งแรกในไทย เจาะตลาดการท่องเที่ยว
อสังหาริมทรัพย์
TOA รายแรก! เปิดตัวสีพร้อมใช้ 2in1 ทนสูงสุด 15 ปี
การตลาด
CardX ผนึก 9 โรงพยาบาลชั้นนำ ส่งแคมเปญ “มั่นใจทุกการรักษา”
CSR
SCBX จับมือ สกมช. เสริมแกร่งความมั่นคงไซเบอร์ไทย
Information
SMO จับมือ “APM–FSS” โรดโชว์ จ.สุราษฎร์ธานี
Gossip
MPJ หุ้นโลจิสติกส์ อนาคตไกล
Entertainment
BBL จัดพิธีพุทธาภิเษก ‘พระมงคลมิ่งเมือง’ วัตถุมงคลที่ระลึกงานพระกฐินพระราชทาน
สกุ๊ป พิเศษ
ATLAS หุ้นเด่น! LPG นวัตกรรมสุดล้ำ
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
348
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
EKH เดินหน้าเข้าร่วมโครงการ “JUMP+”
MASTEC เทรดวันแรก ราคาเปิดเหนือจอง 22.76%
SPREME ไฟเขียวงบลงทุน 1.3 พันล. - BAY งัดแคมเปญพิเศษท้ายปี ลุยสินเชื่อรถยนต์ไฟฟ้า
SPREME ทุ่ม 1.3 พันลบ.ลุย IT Solution ภาครัฐ เสริมแกร่งรายได้
ATLAS '5 กูรูหุ้น' เคาะเป้าสูงสุด 5 บ./หุ้น - IDG ดีเดย์เทรด mai 24 ต.ค.นี้
ATLAS ยันหุ้นไอพีโอ 3 บาทไม่แพง! ราคานี้พีอีแค่ 15 เท่า