Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
A5 ประกาศ Sold Out ‘แซงค์ รอยัล กรุงเทพกรีฑา’ มูลค่ากว่า 3.5 พันล.
MAI
MPJ รุกเปิดพื้นที่ลานตู้คอนเทนเนอร์ 'ลาดกระบัง-แหลมฉบัง'
IPO
6 โบรกฯ ฟันธง! ATLAS หุ้นเด่นอนาคตไกล เคาะเป้าสูง 5.20 บ.
บล./บลจ
InnovestX คงเป้า SET ที่ 1,250 จุด ชี้ตลาดหุ้น Q3 ผันผวนสูง
เศรษฐกิจ-การเงิน-การคลัง
BAY วางกรอบเงินบาท 32.10-32.75 มองภาษีทรัมป์กดดันตลาดการเงินโลก
การค้า - พาณิชย์
บสย. ผนึก “เงินดีดี” หนุน Micro SMEs รายย่อย-อาชีพอิสระ เข้าถึงแหล่งทุน
พลังงาน - อุตสาหกรรม
TSE คว้ารางวัลพลังงานยอดเยี่ยม Thailand Energy Award 2 ปีซ้อน
คมนาคม - โลจิสติกส์
SJWD ชูโซลูชันโลจิสติกส์ รับมือปิดด่านเขมร
แบงก์ - นอนแบงก์
KTB ปลื้ม ‘KTWC-INCOME-A’ ยอดจองทะลุ 1.3 พันล.
ไฟแนนซ์ - ลิสซิ่ง
กรุงศรี ออโต้ เปิดพฤติกรรมผู้ใช้รถใหม่ทั่วภูมิภาคของไทย
SMEs - Startup
SCB TechX ตั้ง ‘สุทธิพงศ์’ นั่งแท่น CEO คนใหม่
ประกันภัย - ประกันชีวิต
เมืองไทยประกันชีวิต มอบรางวัลเกียรติยศ รพ.คู่สัญญา
รถยนต์
นิสสัน ปรับปรุงสายการผลิตในไทย เสริมแกร่งการแข่งขันด้านต้นทุน
ท่องเที่ยว
VRANDA ชี้ท่องเที่ยวส่งสัญญาณฟื้นตัว เด้งรับ ‘เที่ยวคนละครึ่ง’
อสังหาริมทรัพย์
SA เตรียมขายหุ้นกู้ 2 ชุดใหม่ ดอกเบี้ยสูงสุด 7.25% ต่อปี
การตลาด
Shopee ผนึกพันธมิตร คว้าวง ENHYPEN เขย่าหัวใจแฟนคลับชาวไทย
CSR
SCB TechX ตั้ง ‘สุทธิพงศ์’ นั่งแท่น CEO คนใหม่
Information
ธพว. บันทึกเทปถวายพระพรชัยมงคล สมเด็จพระบรมราชชนนีพันปีหลวง
Gossip
PTG หุ้นคุณภาพดี ครบเครื่อง!
Entertainment
เมืองไทย Smile Trip : เที่ยว กิน ฟิน มู @นครศรีธรรมราช
สกุ๊ป พิเศษ
PTG แกร่งทุกมิติ ชู Non-Oil เรือธง
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
315
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
A5 ประกาศ Sold Out ‘แซงค์ รอยัล กรุงเทพกรีฑา’ มูลค่ากว่า 3.5 พันล.
BJC ปลื้ม! ยอดจองหุ้นกู้เกินเป้ากว่า 5.5 เท่า
PLUS มั่นใจภาษีนำเข้าสหรัฐฯ ไม่กระทบออเดอร์
GBS ชี้เป้าหุ้นหลบภัย 'ทรัมป์' TISCO - BGRIM เด่น - CH ธุรกิจครึ่งปีหลังยังดี ลุย EXPO - เพิ่มฐานลูกค้า
KBANK เปิดบริการสแกนจ่าย QR ครอบคลุมกลุ่มอาเซียน - ADVANC โบรกฯ เคาะเป้า 315 บ.
ตลท. ดัชนีหุ้นไทยเดือน มิ.ย. 68 ปิดที่ 1,089.56 จุด