Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
GUNKUL โชว์ไตรมาส 1/69 รายได้รวม 2,587 ลบ. กำไรโต 24%
MAI
FLOYD รับอานิสงส์ Data Center ขยายตัว รุกกลุ่มโรงแรม - ศูนย์การค้า
IPO
ก.ล.ต. นับหนึ่งไฟลิ่ง “QUICK” ลุยแผนเข้า mai
บล./บลจ
ตลท. LiVEx ครบรอบ 4 ปี มุ่งผลักดัน New Economy
เศรษฐกิจ-การเงิน-การคลัง
กรุงศรี ชี้เงินบาทซื้อขายในกรอบ 32.00-32.70
การค้า - พาณิชย์
บสย. จัดงาน ‘Town Hall’ ปลุกพลังพนักงาน ย้ำภารกิจ SMEs Financial Gateway
พลังงาน - อุตสาหกรรม
GULF ไตรมาส 1/69 กำไรโต 9,326 ล้าน
คมนาคม - โลจิสติกส์
WICE กางแผน JUMP+ ชู AI-ดิจิทัล เสริมบริการโลจิสติกส์ครบวงจร
แบงก์ - นอนแบงก์
ออมสิน ส่ง “สินเชื่อต้อนรับเปิดเทอม” ลดภาระผู้ปกครอง
ไฟแนนซ์ - ลิสซิ่ง
TIDLOR โชว์กำไร Q1/69 นิวไฮ 1,613.7 ล.
SMEs - Startup
SCB 10X ลุยจัดงาน “REDeFiNE TOMORROW 2026”
ประกันภัย - ประกันชีวิต
วิริยะประกันภัย-ขนส่งทางบก จัดอบรมใบขับขี่ปี 69
รถยนต์
PT MAXNITRON RACING SERIES 2026 พร้อมระเบิดความมันส์
ท่องเที่ยว
KBANK สะกิดธุรกิจโรงแรมเร่งปรับตัวรับ ศก.ผันผวน
อสังหาริมทรัพย์
ศุภาลัย เปิดตัว “ไพร์ม วิลล่า แจ้งวัฒนะ” บ้านหรูสไตล์ Tropical Modern
การตลาด
EnCo จับมือ i-Store เปิดสาขาเอนเทอร์ – ดอนเมือง
CSR
SCB 10X ลุยจัดงาน “REDeFiNE TOMORROW 2026”
Information
กรุงเทพประกันชีวิต จัดพิธีมอบรางวัล Bangkok Life Agency Annual Awards 2025
Gossip
SA ส่ง “เพสโต” สาขา 3 บุกพระราม 9
Entertainment
ศุภาลัย ปลุกกระแส Wonderful Living คอนโดฯ
สกุ๊ป พิเศษ
PTG เดินหน้าธุรกิจปีม้าไฟ รุกพัฒนา Max World Ecosystem
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
441
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
GUNKUL โชว์ไตรมาส 1/69 รายได้รวม 2,587 ลบ. กำไรโต 24%
TEGH ผนึกภาครัฐ-เอกชน ดันไทยสู่เศรษฐกิจคาร์บอนต่ำ
QTC ไตรมาส 1/69 รายได้โต 65%
NER Q1/69 โกยกำไรสุทธิ 254 ล. - WASH รุกเปิดเพิ่ม 100 สาขา
SSP เปิดงบ Q1/69 กำไร 251.3 ลบ. เพิ่มขึ้น 10.7%
ตลท. ดัชนีหุ้นไทยเดือน เม.ย. 69 ปิดที่ 1,493.69 จุด