Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
BCPG ปลื้ม! วินด์ฟาร์ม 'มอนซูน' COD - ETL เพิ่มเส้นทางจีน–เวียดนาม ดัน Gross Margin 12%
MAI
TPCH ลุย COD โซลาร์ฟาร์ม สปป.ลาว 100 MW ภายใน Q4/68
IPO
HANN ไอพีโอ 160 ล้านหุ้น เคาะราคาหุ้นละ 0.70 บาท
บล./บลจ
XSpring Digital ขึ้นแท่น ICO Portal ผลักดัน ‘G Token’
เศรษฐกิจ-การเงิน-การคลัง
SCB EIC หวั่นศก.ไทยเข้าสู่ Technical recession ฉุดจีดีพีโตต่ำกว่า 1%
การค้า - พาณิชย์
คต. เปิดฉากเวทีสัมมนา ‘World Tapioca Conference 2025’
พลังงาน - อุตสาหกรรม
PQS จับมือญี่ปุ่น พัฒนาโครงการ ‘แป้งมันสำปะหลังคาร์บอนต่ำ'
คมนาคม - โลจิสติกส์
ETL ชี้ Q3 เข้าไฮซีซั่น รับดีมานด์ขนส่งแน่น
แบงก์ - นอนแบงก์
BBL ประกาศจ่ายปันผลระหว่างกาล 2.00 บาท
ไฟแนนซ์ - ลิสซิ่ง
กรุงศรี ออโต้ ปักธง “GO Auto Station” หนุนสินเชื่อครึ่งปีหลังเร่งตัว
SMEs - Startup
KGP ผนึกกำลังพันธมิตร เปิดตัวแพลตฟอร์ม ‘FareOK’
ประกันภัย - ประกันชีวิต
กลุ่มพรูเด็นเชียล ครึ่งปีแรก มีผลกำไรธุรกิจใหม่เติบโต 12%
รถยนต์
“กรุงศรี ออโต้” เปิดเทคนิคตรวจเช็กรถมือสอง เช็กจุดสำคัญก่อนตัดสินใจ
ท่องเที่ยว
พรูเด็นเชียลฯ ร่วมสนับสนุน ซีนิคฮาล์ฟมาราธอนระยอง
อสังหาริมทรัพย์
BKA เล็งรีโนเวทบ้านเพิ่มเป็น 400-500 หลังต่อปี เสริมรายได้
การตลาด
Smarthome ฉลองครบรอบ 12 ปี ปั๊มยอดขายสู่ 2พันล.
CSR
KGP ผนึกกำลังพันธมิตร เปิดตัวแพลตฟอร์ม ‘FareOK’
Information
เมืองไทยประกันชีวิตคว้า 2 รางวัลจากเวที Asia Pacific Enterprise Awards 2025
Gossip
รีบเก็บ NCP ก่อนขึ้น XD
Entertainment
ตลท. จัดโครงการ ESG DNA ปีที่ 2
สกุ๊ป พิเศษ
"รุ่ง-วิทัย" ใครจะเข้าวิน ผู้ว่าฯ แบงก์ชาติ
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
327
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
BCPG ปลื้ม! วินด์ฟาร์ม 'มอนซูน' COD - ETL เพิ่มเส้นทางจีน–เวียดนาม ดัน Gross Margin 12%
ASIA เตรียมขายหุ้นกู้อายุ 2 ปี ชูดอกเบี้ย 6.50–6.75%
NER โบรกฯ เชียร์ 'ซื้อ' เป้า 6.25 บ. -TPCH COD ภายใน Q4/68 โซลาร์ฟาร์ม สปป.ลาว 100MW
PLUS โวผลงานครึ่งปีหลังเด้งรับไฮซีซั่น - ออเดอร์ตปท.พุ่ง
WICE ไตรมาส 3/68 เดินหน้าเต็มสูบ หนุนผลงานทั้งปีโต 15%
8 โบรกฯ เชียร์ "ซื้อ" NER ราคาเป้าหมายสูงสุด 6.25 บาท