亚洲欧美网站_国产精品午夜电影_国产精久久久_综合激情五月婷婷_久久人人爽国产_欧美影院三区_欧美性猛片xxxxx免费中国_色黄网站在线观看_最近中文字幕免费mv2018在线_久久中文资源

學而思研發面向全球數學愛好者大模型MathGPT

2023-05-05 19:31:42來源:鞭牛士編輯:時寒峰

掃一掃

分享文章到微信

掃一掃

關注鹿財經網微信公眾號

  原標題:學而思研發面向全球數學愛好者大模型MathGPT

  據了解,學而思正在進行自研數學大模型的研發,命名為MathGPT,面向全球數學愛好者和科研機構,以數學領域的解題和講題算法為核心,目前已經取得階段性成果,并將于年內推出基于該自研大模型的產品級應用。

  據悉,學而思已將MathGPT作為公司核心項目,由CTO田密負責,今年春節前,該項目已經啟動相應的團隊建設、數據、算力準備和技術研發。此外,學而思已經啟動在美國硅谷的團隊建設,將成立一支海外算法和工程團隊,在全球范圍內招募優秀的人工智能專家加入。

  MathGPT與大語言模型(LLM)的差異

  美國OpenAI公司在今年三月份發布了大語言模型GPT-4,國內百度、阿里也發布了各自的大模型產品,但通用語言模型更像一個“文科生”,在語言翻譯、摘要、理解和生成等任務上有出色表現,在數學問題的解決、講解、問答和推薦方面則存在明顯不足:解答數學問題經常出錯,有些數學問題雖然能夠解決,但方法更偏成年人,無法針對適齡孩子的知識結構和認知水平做適配。

  “這種不足是由LLM模型的自身特點決定的。”學而思AI團隊負責人介紹,LLM大模型來自對海量語言文本的訓練,因此最擅長語言處理。行業內偏向基于LLM大模型做閱讀、寫作類應用,但如果想要在數學能力上有突破,就需要研發新的大模型。因此,學而思決心組建團隊專研MathGPT——數學領域大模型,用自己在數學和AI上的多年積累,面向全球范圍內的數學愛好者和科研機構,做好AI大模型時代的數學基礎工作。

  學而思希望通過MathGPT彌補和攻克大語言模型的三個問題:第一,題目要解對,現在GPT結果經常出現錯誤;第二,解題步驟要穩定、清晰,現在GPT的解題步驟每次都不一樣,而且生成內容經常很冗余;第三,解題要講的有趣、個性化,現在GPT的解釋過于“學術”和機械,對孩子的學習體驗很不友好。

  做MathGPT,學而思憑什么

  學而思作為獲國家科技部批準的“智慧教育國家新一代人工智能開放創新平臺”建設單位,也是教育行業唯一一家人工智能“國家隊”成員,在人工智能領域有著多年的深入研究,早在2017年,學而思便成立了AI lab 人工智能實驗室。

  據公開信息顯示,基于智慧教育人工智能開放創新平臺助力,學而思AI lab獲得各類頂級學術會議比賽冠軍16項,亞軍6項;發表國際期刊和會議高水平學術論文31篇,包含光學字符識別、圖像、自然語言處理、語音以及多模態等多領域的學術研究,在計算機視覺頂會以及自然語言頂會中均有多篇論文發表;申請專利220余項,授權專利150余項,軟件著作權60余項。

  微信截圖_20230505173100.png

  學而思AI lab在各類頂級學術會議比賽獲獎情況

  “以數學起家”的學而思至今已有20年的數學教學經驗,積累了龐大的數學相關數據,這些數據是進行MathGPT訓練的必備物料。另外,學而思的海外業務Think Academy在全球若干國家和地區深受數學愛好者喜歡,學而思的學生在每年的IMO和AMC等國際數學競賽中表現優異,每年都有多位學生在國際奧林匹克數學競賽中拿到金牌。所以,學而思選擇在MathGPT方向發力也順理成章。

  另據了解,學而思學習機近期將會上線一款“AI助手”,涵蓋作文助手、口語助手、閱讀助手、數學助手等相關功能,該AI產品將于5月11日開啟內測。

  MathGPT的挑戰和技術難題

  如何利用大語言模型服務各行各業是當下社會的焦點問題。比如在教育領域,Duolingo、Quizlet、可汗學院等產品主要和OpenAI合作,在GPT大模型上做微調和接口調用,增強原有的產品體驗。但也有一些領域如數學、醫學等,對AI的需求是準確、清晰、具備強大的邏輯推理能力,且容錯率低,通用LLM目前的性能表現還無法在上述領域取得突破,未來是否可能取得突破尚不清晰。

  以數學領域為例,目前市場上有幾個主要流派。比如Google收購的Photomath、微軟數學、Mathway、專注數學計算的WolframAlpha等產品,主要利用非LLM的傳統AI技術加上數據庫的方式解決數學問題。走AGI路線的公司則嘗試讓通用LLM“更懂數學”,比如GPT4在數學任務上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也專門針對數學問題進行調優。學而思選擇了另一條少有人走的路,不基于現有LLM做微調和接口調用、不做通用LLM,而是自研基于專業領域的“數學大模型”MathGPT,致力于打造自主、穩定、可持續、高質量的學習解決方案。

  在大語言模型不斷進化的浪潮下,不同的技術路線選擇孰優孰劣,仍有待討論和驗證。學而思自研獨立的MathGPT大模型是否成立,是否能夠超越通用模型在數學任務上的表現,是否更匹配不同人群的數學學習場景,這個問題還需要在創新實踐中尋找答案。隨著整個行業的深化發展和越來越多人才參與到這個領域,相信不久的將來就能看到更為成熟的解決方案。

     投稿郵箱:lukejiwang@163.com   詳情訪問鹿財經網:http://m.cqpengren.com

相關推薦
“AI教父”辛頓WAIC首談:擔憂AI未來,呼吁研發“ “AI教父”辛頓WAIC首談:擔憂AI未來,呼吁研發“

原標題:AI教父辛頓WAIC首談:擔憂AI未來,呼吁研發善良技術 在2025年世界人工

科技說2025-07-27

消息稱一汽豐田正籌備 AI 座艙研發:計劃明年發 消息稱一汽豐田正籌備 AI 座艙研發:計劃明年發

原標題:消息稱一汽豐田正籌備 AI 座艙研發:計劃明年發布 7 月 15 日消息,據

科技說2025-07-16

黃仁勛:正確使用AI能提升認知,關鍵在于主動思 黃仁勛:正確使用AI能提升認知,關鍵在于主動思

原標題:黃仁勛:正確使用AI能提升認知,關鍵在于主動思考與批判性看待答案

科技說2025-07-15

華為十年研發費破萬億,鴻蒙時代全面開啟! 華為十年研發費破萬億,鴻蒙時代全面開啟!

原標題:華為十年研發費破萬億,鴻蒙時代全面開啟! 華為在近期舉辦了一場

科技說2025-06-11

蘋果研究:AI推理模型在高復雜度任務中“思考” 蘋果研究:AI推理模型在高復雜度任務中“思考”

原標題:蘋果研究:AI推理模型在高復雜度任務中思考崩潰 在人工智能領域,一

科技說2025-06-09

商務部原副部長陳健:汽車行業需破內卷,新能 商務部原副部長陳健:汽車行業需破內卷,新能

原標題:商務部原副部長陳健:汽車行業需破內卷,新能源車研發成亮點 近期

科技說2025-06-06

蔚來“瘦身”研發計劃,精細化管理下非必要項 蔚來“瘦身”研發計劃,精細化管理下非必要項

原標題:蔚來瘦身研發計劃,精細化管理下非必要項目難立項 近期,蔚來汽車

科技說2025-06-04

工信部加速AI大模型研發,推動制造業智能升級 工信部加速AI大模型研發,推動制造業智能升級

原標題:工信部加速AI大模型研發,推動制造業智能升級 近日,工業和信息化部

科技說2025-05-04

美團高管自曝:正研發我發起的NativeAI產品 但不 美團高管自曝:正研發我發起的NativeAI產品 但不

原標題:美團高管自曝:正研發我發起的NativeAI產品 但不是我帶隊 3月24日消息

科技說2025-03-24

空客推遲氫動力商用飛機研發計劃:技術發展比 空客推遲氫動力商用飛機研發計劃:技術發展比

原標題:空客推遲氫動力商用飛機研發計劃:技術發展比目標落后5到10年 2月

科技說2025-02-09