Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
BBIK ปักธงปีม้า! ผลงานโต 20% - QTC รุก Green Energy Solution
MAI
NCP ปักธงรายได้ปี 69 โต 20-25%
IPO
ก.ล.ต. นับหนึ่งไฟลิ่ง UNIX จ่อขายไอพีโอ 180 ล้านหุ้น
บล./บลจ
กบข. เปิดดาวน์โหลด e-Statement ชวนสมาชิกเช็กสถานะเงินออม
เศรษฐกิจ-การเงิน-การคลัง
โกลบอลมาร์เก็ตส์ กรุงศรี ประเมินกรอบเงินบาท 30.70-31.30
การค้า - พาณิชย์
SME D Bank ลุยมาตรการ ‘ช่วยเหลือ-เยียวยา-ฟื้นฟู’ พยุงธุรกิจภาคใต้
พลังงาน - อุตสาหกรรม
SCB EIC แนะอุตฯอิเล็กทรอนิกส์ไทยรับมือความเสี่ยงภาษีชิป AI ของสหรัฐฯ
คมนาคม - โลจิสติกส์
“พิพัฒน์” ลุยดึง “ดิสนีย์แลนด์” ปักหมุดลงทุนพื้นที่ EEC
แบงก์ - นอนแบงก์
ออมสิน แต่งตั้ง “ทรงพล ชีวะปัญญาโรจน์” นั่งแท่นผู้อำนวยการคนใหม่
ไฟแนนซ์ - ลิสซิ่ง
SAWAD แกร่ง! ฟิทช์คงอันดับเครดิตที่ระดับ ‘A-(tha)’
SMEs - Startup
TECHLEAD เข้าลงทุน Nestifly ยกระดับแพลตฟอร์มฟินเทค
ประกันภัย - ประกันชีวิต
พรูเด็นเชียลฯ จับมือเครือ รพ.พญาไท-เปาโล ยกระดับสิทธิประโยชน์ด้านสุขภาพ
รถยนต์
GPI ลุย “Bangkok International Motor Show” หวังรายได้พุ่ง 20 ล.
ท่องเที่ยว
TAGTHAi จับมือ BEM หนุนเส้นทางท่องเที่ยวเชิงวัฒนธรรม
อสังหาริมทรัพย์
SPALI กางแผนปีม้า ลุย 28 โครงการใหม่ ดันยอดขาย 4.5 หมื่นล.
การตลาด
COCOCO เดินหน้ารับซื้อมะพร้าวในราคาเป็นธรรม
CSR
TECHLEAD เข้าลงทุน Nestifly ยกระดับแพลตฟอร์มฟินเทค
Information
กรุงเทพประกันภัย จัดงานแสดงความขอบคุณพนักงานที่ร่วมเป็นวิทยากรแบ่งปันความรู้และประสบการณ์
Gossip
เกษตรแฟร์ปีนี้ ก๊าซหุงต้มพีที พากิน – ช้อปยาว 9 วันเต็ม!
Entertainment
ThaiCBN จับมือกรมลดโลกร้อน เร่งเครื่อง NDC 3.0
สกุ๊ป พิเศษ
ภาวะธุรกิจที่อยู่อาศัยปี 2568-2569
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
394
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
BBIK ปักธงปีม้า! ผลงานโต 20% - QTC รุก Green Energy Solution
BBIK กางแผนปี 69 ผลงานโต 20%
NER กูรูประสานเสียงเชียร์ “ซื้อ” เคาะเป้าปี 69 ที่ 6.10 บ./หุ้น
QTC ลุยสู่ Green Energy Solution ปั้นรายได้ปี 69 แตะ 2 พันล.
SPALI ปีม้า! ยอดขายรวม 4.5 หมื่นล. - ITEL รายได้ปี 69 โต 15%
ITEL กางแผนปี 69 โชว์ Backlog แน่น 2.2 พันล.