全球首個全學科智適應教育大模型誕生!百億學習數據訓練,9年研發算法突破式迭代
分類: 最新資訊
日志詞典
編輯 : 日志大全
發布 : 01-10
閱讀 :129
新智元報道編輯:好困 桃子【新智元導讀】大模型如火如荼發展的一年,也為教育科技帶來很大的想象空間。1月5日,國內首個教育智適應多模態大模型發布。大模型革新教育,同樣能夠做到千人千面,為學生提供個性化的學習服務。過去的一年,大模型一躍成為時代的新寵,強大的泛化和通用能力,為AI應用打開全新的想象空間。我們見證了,大模型在材料加速發現,數學定理證明等方面有著巨大的潛力。而教育也是大模型一直備受關注的落地場景之一。 那么 ,我們如何利用大模型來創造更好的教育體驗?1月5日,在AIAED智適應教育大模型學術研討會上,國內科技創新型獨角獸企業「松鼠Ai」,正式發布全球第一個智適應教育大模型,并在會上首次公開分享了應用落地大模型技術的思考與實踐。據介紹,松鼠Ai智適應教育大模型,是全球范圍內首次將智適應技術與多模態大模型結合的探索,在個性化學習服務方面,實現了突破式迭代。這也意味著,松鼠Ai對大模型的探索已率先從技術研發階段進階至應用及行業布局階段。除此之外,會議還正式宣布——組建IEEE人工智能教育大模型標準工作組(P3428)。其中,松鼠Ai創始人栗浩洋任該工作組主席, 第一批專家 工 作組包括 北京師范大學黃榮懷教授、清華大學許斌教授、華東師范大學顧小清教授。后續還將邀請全球的科學家、高校學者、人工智能及教育行業專家、科技教育企業代表等諸多專業人士共同參與,旨在進一步推動人工智能、大模型技術在教育領域的落地和創新,助推教育行業升級與創新發展。全球首個「智適應大模型」來襲過去一年,大模型技術快速迭代,AI應用的可能性也在不斷拓寬,全球各大科技巨擘競相圍繞其展開布局。席卷全球的「百模大戰」之中,教育企業的身影并不少見。例如「可汗學院」推出了人工智能助教Khanmigo,另一方面,Duolingo推出了使用GPT-4技術的 Duolingo Max。作為創新學習工具,這兩款產品增加了如語音識別、實時反饋的功能。國內企業也紛紛開啟了利用人工智能技術提升教育質量的嘗試。在此次會議上,松鼠Ai也帶來了自己的最新的技術成果——全球第一個全學科智適應教育大模型,這也是國內首個將智適應教育技術與多模態大模型結合,運用于教育的垂直領域大模型。作為國內第一家將人工智能自適應學習技術應用在教育領域的科技創新型獨角獸企業,松鼠Ai是國內較早布局人工智能的先行者。回溯其在人工智能領域的投入,已經超過9年。自成立以來,不僅與斯坦福研究中心進行聯合技術開發,還曾與卡耐基梅隆大學成立聯合實驗室,開發人工智能、機器學習、認知科學和人機界面技術的新方法。如今,松鼠Ai在技術實力、數據積累、應用場景研究等多個維度均已做到了國內頂級、全球領先。據介紹,松鼠Ai智適應大模型主要實現了三個突破:一是產品性能實現突破式迭代,在個性化教育服務方面,多項能力實現超越。松鼠Ai創始人、董事長栗浩洋表示,松鼠Ai通過將智適應技術和大模型結合,已順利完成產品性能的全面升級,讓技術賦能效果,實現了質的飛躍。基于松鼠Ai獨有的、過去所積累的2400萬學生的100億學習行為全流程數據「喂養」大模型,在超大規模數據量訓練后,松鼠Ai推薦算法、深度知識追蹤等AI技術都已實現突破式迭代。AI大模型是「大數據+大算力+強算法」結合的產物,因此訓練數據的質量與數量至關重要。相較其他行業大模型,及缺乏個人學習數據的ChatGPT,「松鼠Ai智適應大模型」擁有松鼠Ai多年積累的場景、數據、算法等方面的技術與行業經驗優勢,在充足的教育訓練數據下能夠保障模型的生成能力及精度。目前,松鼠Ai智適應大模型,能夠更好地捕獲數據中的復雜關系和模式,能夠更快速發現知識點和知識點之間,知識點和題目之間,題目和孩子能力之間的關系,能夠更高效地繪制學生的學習畫像,為學生提供針對性的個性化服務,從而進一步提高學生學習效率。二是推動五育并舉、關注學生情感需求,在大模型落地應用實現領先性嘗試。相較公有數據的大模型的通用底座,松鼠Ai的不同之處在于,基于獨有的知識圖譜和MCM(學習的思想、能力、方法)圖譜,松鼠Ai能夠真正提高教學效率,并且把每個孩子的個性、特長、潛在優勢充分發揮出來,真正做到以AI賦能教育生產力高效釋放,深度賦能因材施教和五育并舉。通過多種AI技術在產品中的應用落地,松鼠Ai在給學生提供輔導時,能夠覆蓋預習、復習、備考、作業輔導等多場景,在社會情感及人際互動方面給予學生更多準確的回應與激勵。例如,松鼠Ai可以根據孩子在學習過程中反應,給予其正面的反饋與激勵改善學生的情緒,幫助解決孩子的一些心理問題,有效解決孩子學業提升慢、提升難,良好學習習慣養成等問題,幫助每個孩子成為最好的自己,把每個人的個性、特長、潛在優勢充分發揮出來。L3:戰略鎖定隔離池,知識點重新排序三是加快商業化進程,實現大模型技術在教育領域落地應用、發展及推廣。當技術與教育的結合越來越緊密之時,教育行業也有望成為大模型技術的最佳落地場景。目前,松鼠Ai持續探索大模型技術應用,希望進一步賦能教育生產力高效釋放。據栗浩洋介紹,松鼠Ai 2023年已經完成2000家線下智能學習機門店業務布局,是全國零售店規模最大的AI學習機品牌,整體業務增長率達300%。同時,松鼠Ai還計劃在今年年底推出全新的國際版本產品,面向全球學生提供產品與服務,更好地服務全球用戶,提升中國教育科技品牌的國際影響力。不僅如此,目前松鼠Ai已經開始嘗試將大模型技術應用于打造虛擬老師。 通過生成更多視頻講解,助力社會需求的創新人才培養。可以預見,此舉將拓 展大模型在教育領域的商業模式寬度,也將為大模型在更多行業的落地提供借鑒和參考。松鼠Ai牽頭成立人工智能教育大模型標準工作組作為聚焦新技術、新產品、新平臺與新見解的行業盛會,AIAED智適應教育大模型學術研討會邀請了來自政府、高校、企業等各方代表齊聚一堂,就AI大模型的熱點技術和垂直教育行業的創新應用展開深入分享與交流。出席活動并作學術交流和報告分享的有:- 加拿大工程院及加拿大皇家學院院士、國際人工智能聯合會IJCAI理事會前主席、微眾銀行首席人工智能官香港科技大學楊強教授; - 中國科學院自動化研究所復雜系統管理與控制國家重點實驗室主任、前中國科學院自動化研究所副所長、IEEE Fellow王飛躍教授; - 北京師范大學「長江學者」特聘教授、北京師范大學智慧學習研究院院長黃榮懷教授; - 教育部教育信息化專家組成員、華東師范大學教育學部教授、教育技術學系系主任顧小清教授; - 清華大學計算機系教授、中國計算機學會計算機應用專委會主任許斌教授; - 松鼠Ai董事長、首席教育技術科學家栗浩洋。此外,大會還進行了IEEE人工智能教育大模型標準工作組(P3428)的成立儀式。松鼠Ai董事長栗浩洋作為該工作組主席,與北師大黃榮懷教授、華東師大顧小清教授、清華大學許斌教授共同啟動該工作組,各位嘉賓并對全球人工智能教育大模型標準的建立展開討論與分享。近年來,人工智能發展受到各級政府的高度重視和國家產業政策的重點支持,國家陸續出臺了多項政策,鼓勵人公共職能行業發展與創新。今年7月,國家網信辦、國家發展和改革委員會、教育部、科學技術部、工業和信息化部、公安部、國家廣播電視總局等7部委就聯合公布了《生成式人工智能服務管理暫行辦法》,對大模型技術在教育行業的發展給予了大力支持。而人工智能教育大模型標準工作組的成立,正是極為關鍵的一步——一方面是響應相關政策,在政策和市場之間建立互聯通道,推進相關政策的貫徹實施,給予相關部門反饋一些來自市場一線的信息和建議;另一方面,工作組將進一步團結業界,通過資源整合、戰略研究和交流平臺搭建的形式,進一步推動 AI大模型技術在教育領域的支撐和應用,提高企業的競爭力和可持續 發展能力。作為人工智能教育領域的佼佼者,松鼠Ai在技術上堅持創新驅動,在標準上進行頂層設計和超前布局,從而源源不斷地把技術創新成果轉化為行業標準。此次牽頭成立工作組,這不僅能夠有效地促進了教育大模型技術的健康有序發展,同時也能不斷培育和發掘前瞻性的技術標準,從而持續幫助行業在國際標準上實現超越,對于提升中國教育的全球競爭力和影響力、推進人工智能產業發展尤為重要。此外,松鼠Ai還在發布會上宣布一項普惠計劃:松鼠Ai計劃永遠面向全球20%的最低收入家庭的孩子,免費提供松鼠Ai系統,推動優質教育資源的規模化、公平化、個性化。松鼠Ai董事長栗浩洋談到,在全球人工智能浪潮下,教育領域呈現出強勁的發展勢頭。 作為中國人工智能教育領域的創新企業代表,松鼠Ai切盼望關注教育智適應大模型發 展的企業、專家、學者能夠加強對話與合作,共同推動產業鏈的協同發展,讓因材施教的個性化教育早日惠及更多孩子。據其介紹,未來工作組將吸納更多專家成員、企業家,充分發揮各領域專業人士的優勢,為中國教育大模型技術發展及行業落地應用提供專業的指導和建議。未來,松鼠Ai也將基于在教育智適應大模型領域的技術創新成果和經驗積累,充分發揮落地應用的先發實踐優勢,聚力行業合作伙伴,為中國人工智能教育領域的標準化體系建設、全球教育行業智能化升級注入源源不斷的動力。創始人專訪提問:松鼠Ai智適應大模型可以加速發現知識點和題目,以及與學生之間的關系,這個是咱們之前模型擁有的能力,還是全新的迭代?栗浩洋:我們以前的模型在知識圖譜和系統的基礎上,能夠給孩子提供個性化的實時的反饋,而在「暗邏輯」上發現的效果不夠好。松鼠Ai在2年前開始研究大模型,1年前開始運用在智適應中。這時我們發現,大模型夠找到各種各樣的「暗邏輯」。比如學什么東西學的快或慢,簡單或容易等等,這體現的就是每個學生獨特的大腦認知和學習方式。具體來說,我們首先利用大模型生成給學生的學習推薦、反饋等輸出。在這之中,大約80-90%是正確的,10%可能有明顯錯誤。然后,用人工針對錯誤的輸出進行標注歸類。基于人工標注后的結果會用作獎勵模型進行強化學習,對具體的錯誤類別進行性能優化, 這樣通過「人工標注+強化學習」的方式來不斷改進輸出,處理那些大模型直接生成的可能有錯 誤的輸出。提問:松鼠Ai大模型在進行數學推理時,是否也會面臨LLM在數學推理能力上本身的局限和不足?栗浩洋:目前大模型在推理和理解能力上還是有限,它們主要是在概率上進行字和像素(比如Midjourney)的排序,距離真正的理解還很遠。但大模型在處理復雜情景以及「暗邏輯」上是非常有潛力的,因此它們在智能教育系統中策略有很好的應用價值。在我們系統中,松鼠Ai大模型更多是用于制定學習效率的策略——「理解」題目及其解析并進行知識點標注,而不是直接進行數學推理。而在學生的學習路徑中,松鼠Ai大模型還會根據不同的錯誤類型和水平進行個性化引導。在這一場景下,同樣也不是簡單地對題目進行分步解析。提問:學生給出解題步驟后,如何利用松鼠Ai智適應大模型(LAM)對錯誤點進行分析?栗浩洋:在分析學生的解題步驟時,先利用松鼠Ai大模型進行問題定位,找到學生的錯誤點。然后利用松鼠Ai大模型系統結合學生的整體水平、不同類別的學生做出綜合的判斷,進而提供個性化學習路徑。松鼠Ai智適應大模型(LAM)分三步運作,首先通過各種學生數據訓練得到一個通用模型,然后根據不同學科、不同板塊、不同場景再去微調模型,最后結合具體的學生數據再進行診斷和路徑規劃。松鼠Ai的LAM系統最新的進展便是,自主發現學生在哪些情況下可以學會,哪些情況下學不會,從而進行更智能的路徑規劃。