Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
COCOCO ติดอันดับดัชนี SET 100 ปักธงรายได้แตะหมื่นล. - DEMCO Backlog ทะลุ 3.6 พันล.
MAI
LEO ส่งซิกผลงาน Q4/67 สดใส มั่นใจสร้างผลตอบแทนผถห.ต่อเนื่อง
IPO
PIS จัดทัพโรดโชว์ จ่อขายไอพีโอ Q1/68
บล./บลจ
ศาลแพ่งกรุงเทพใต้ ไฟเขียวผู้เสียหายจาก STARK ดำเนินคดีแบบกลุ่ม
เศรษฐกิจ-การเงิน-การคลัง
กรุงศรี ชี้เงินบาทเคลื่อนไหว 34.25 บ. หลัง กนง. ตรึงดอกเบี้ย
การค้า - พาณิชย์
พาณิชย์หนุน SME ใช้ FTA ลดเสี่ยง “ทรัมป์ 2.0”
พลังงาน - อุตสาหกรรม
TSE ชนะประมูลโรงไฟฟ้าสีเขียวเฟส 2 รวม 136.1 MW
คมนาคม - โลจิสติกส์
“สุริยะ” สั่งเฝ้าระวังเหตุน้ำท่วมภาคใต้ 6 จังหวัด
แบงก์ - นอนแบงก์
KBANK หนุนงานวิจัยหาแนวทางสู่ธุรกิจคาร์บอนต่ำ
ไฟแนนซ์ - ลิสซิ่ง
‘มันนี่ทันเดอร์’ คว้ารางวัล Prime Minister’s Export Award 2024
SMEs - Startup
บีคอน วีซี เดินหน้ากองทุน Beacon Impact Fund
ประกันภัย - ประกันชีวิต
เมืองไทยประกันชีวิต ชูแบบประกันพิเศษ - โปรโมชันเด่น ตอบโจทย์ทุกไลฟ์สไตล์
รถยนต์
กระหึ่มโลก! “เปิดฤดูกาล MotoGP2025” ครั้งแรกในไทย
ท่องเที่ยว
ทีทีบี ชวนเที่ยว “พิพิธภัณฑ์ครุฑ” ช่วงเทศกาลปีใหม่
อสังหาริมทรัพย์
ORN เปิดรอบพิเศษในงาน EXCLUSIVE AGENT DAY
การตลาด
EURO ขึ้นแท่นตัวแทนจำหน่าย Bang & Olufsen
CSR
บีคอน วีซี เดินหน้ากองทุน Beacon Impact Fund
Information
EXIM BANK ยกระดับขีดความสามารถในการแข่งขันของไทย-ออสเตรเลีย
Gossip
SINO คาดผลงาน Q4/67 แข็งแกร่ง
Entertainment
IMET MAX สานต่อการสร้างผู้นำรุ่นใหม่ปีที่ 7 เสริมทัพอุทยานผู้นำ
สกุ๊ป พิเศษ
CHAYO รุกซื้อหนี้เติมพอร์ต อัพผลงานโตเกิน 20%
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
230
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
COCOCO ติดอันดับดัชนี SET 100 ปักธงรายได้แตะหมื่นล. - DEMCO Backlog ทะลุ 3.6 พันล.
MEDEZE ทุ่มงบ 100 ลบ. ตั้งบ.ย่อยลุยธุรกิจ ‘Health and Wellness’
PCC คว้า 3 โครงการ มูลค่า 273.67 ลบ.
COCOCO ปลื้ม! ติดอันดับคำนวณดัชนี SET 100
DEMCO ปิดดีล! ลุยสร้างสถานีไฟฟ้า มูลค่า 270 ล้านบ.
GUNKUL โบรกฯ เคาะเป้า 5.40 บ./หุ้น - NER ออกหุ้นกู้ อายุ 5 ปี จ่ายดอกเบี้ย 3.41%