首批通過!最高評級!學(xué)而思九章大模型通過中國信通院教育大模型評估
2024-06-27
隨著教育行業(yè)數(shù)字化轉(zhuǎn)型、智能化升級呈現(xiàn)加速發(fā)展態(tài)勢,教育大模型持續(xù)探索與教育各環(huán)節(jié)進行全面深度融合,全面賦能智能學(xué)習(xí)、智能教學(xué)、智能閱卷等各個核心場景。為推動產(chǎn)業(yè)健康持續(xù)發(fā)展,中國信息通信研究院(以下簡稱“中國信通院”)人工智能研究所聯(lián)合業(yè)界單位共同編制了教育大模型標準。
近期,在中國信通院組織的首輪教育大模型評估中,學(xué)而思“九章大模型”順利完成了教育大模型評估,獲得4+級證書,成為國內(nèi)首批通過該項評估并獲得當(dāng)前最高評級的企業(yè)。教育大模型評估依據(jù)《面向行業(yè)的大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法 第3部分:教育大模型》標準,共計3個能力域,6個能力子域,30余個能力項。標準聚焦教育行業(yè)核心需求,形成教育大模型應(yīng)用成熟度評價方法,便于各方衡量教育大模型的應(yīng)用能效,助推教育大模型產(chǎn)品升級優(yōu)化。
【學(xué)而思九章大模型介紹】
學(xué)而思九章大模型(MathGPT)是好未來自主研發(fā)的,以解題和講題算法為核心的大模型。九章大模型具有四大核心功能,即數(shù)學(xué)學(xué)科的自動解題、復(fù)雜應(yīng)用題的批改,語文英語的作文批改,個性化的AI分步驟講題。大模型強大的生成、理解能力,既能針對性解決學(xué)生的個性化問題,從其不懂的題目映射出相應(yīng)知識點,并加以補充講解,使得學(xué)生融會貫通,又能在內(nèi)置大量優(yōu)質(zhì)教學(xué)資源的同時,向更廣泛的學(xué)生普及。
圖1 學(xué)而思“九章大模型”界面
【評估介紹】
教育大模型評估指標覆蓋場景豐富度、能力支持度、應(yīng)用成熟度三大維度,在促進產(chǎn)業(yè)發(fā)展、提升技術(shù)影響力和服務(wù)規(guī)范等方面具有重要作用。
(1)場景豐富度:關(guān)注教育大模型產(chǎn)品覆蓋廣度,包括學(xué)科支持度(數(shù)學(xué)、語文、物理、化學(xué)等)、場景支持度(知識檢索、知識問答、自主學(xué)習(xí)、測評考試等);
(2)能力支持度:關(guān)注教育大模型任務(wù)支持度和性能優(yōu)越度,包括計算、問答、分析、創(chuàng)作、總結(jié)等能力;
(3)應(yīng)用成熟度:關(guān)注教育大模型安全性、學(xué)習(xí)性、啟發(fā)性、記憶性等,包括服務(wù)多樣性、服務(wù)成熟度兩個維度。
圖2 評估范圍
本內(nèi)容轉(zhuǎn)載自“可信AI評測”,https://mp.weixin.qq.com/s/WpT_IqDih-5pztuaGcq4MQ?scene=25#wechat_redirect