亚洲欧美网站_国产精品午夜电影_国产精久久久_综合激情五月婷婷_久久人人爽国产_欧美影院三区_欧美性猛片xxxxx免费中国_色黄网站在线观看_最近中文字幕免费mv2018在线_久久中文资源

AMD發(fā)布首個(gè)AI小語言模型:6900億token、推測(cè)解碼提速3.88倍

2024-10-01 17:19:07來源:快科技編輯:時(shí)寒峰

掃一掃

分享文章到微信

掃一掃

關(guān)注鹿財(cái)經(jīng)網(wǎng)微信公眾號(hào)

  原標(biāo)題:AMD發(fā)布首個(gè)AI小語言模型:6900億token、推測(cè)解碼提速3.88倍

  10月1日消息,AMD發(fā)布了自己的首個(gè)小語言模型(SLM),名為“AMD-135M”。

  相比于越來越龐大的大語言模型(LLM),它體積小巧,更加靈活,更有針對(duì)性,非常適合私密性、專業(yè)性很強(qiáng)的企業(yè)部署。

  AMD-135小模型隸屬于Llama家族,有兩個(gè)版本:

AMD發(fā)布首個(gè)AI小語言模型:6900億token、推測(cè)解碼提速3.88倍

  一是基礎(chǔ)型“AMD-Llama-135M”,擁有多達(dá)6700億個(gè)token,在八塊Instinct MIM250 64GB加速器上訓(xùn)練了六天。

  二是延伸型“AMD-Llama-135M-code”,額外增加了專門針對(duì)編程的200億個(gè)token,同樣硬件訓(xùn)練了四天。

  創(chuàng)建與部署流程

  它使用了一種名為“推測(cè)解碼”(speculative decoding)的方法,通過較小的草稿模型,在單次前向傳播中生成多個(gè)候選token,然后發(fā)送給更大的、更精確的目標(biāo)模型,進(jìn)行驗(yàn)證或糾正。

  這種方法可以同時(shí)生成多個(gè)token,不會(huì)影響性能,還可以降低內(nèi)存占用,但因?yàn)閿?shù)據(jù)交易更多,功耗也會(huì)增加。

  AMD還使用AMD-Llama-135M-code作為CodeLlama-7b的草案模型,測(cè)試了推測(cè)解碼使用與否的性能。

  比如在MI250加速器上,性能可提升最多約2.8倍,銳龍AI CPU上可提升最多約3.88倍,銳龍AI NPU上可提升最多約2.98倍。

  推測(cè)解碼

  AMD-135M小模型的訓(xùn)練代碼、數(shù)據(jù)集等資源都已經(jīng)開源,遵循Apache 2.0。

  按照AMD的說法,它的性能與其他開源小模型基本相當(dāng)或略有領(lǐng)先,比如Hellaswag、SciQ、ARC-Easy等任務(wù)超過Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任務(wù)則基本類似GTP2-124MN、OPT-125M。

     投稿郵箱:lukejiwang@163.com   詳情訪問鹿財(cái)經(jīng)網(wǎng):http://m.cqpengren.com

相關(guān)推薦
一加 Ace 6T 發(fā)布,2399元起售,享驍龍8 Gen 5與830 一加 Ace 6T 發(fā)布,2399元起售,享驍龍8 Gen 5與830

一加今日正式推出備受期待的性能旗艦新成員——一加 Ace 6T。這款新機(jī)以“性

科技說2025-12-04

華為Mate 80系列發(fā)布:首發(fā)麒麟9030系列,鴻蒙6系 華為Mate 80系列發(fā)布:首發(fā)麒麟9030系列,鴻蒙6系

11月25日,華為正式發(fā)布Mate 80系列,帶來三款核心機(jī)型——Mate 80、Mate 80 Pro和

科技說2025-12-03

華為鴻蒙6系統(tǒng)正式發(fā)布 余承東:體驗(yàn)從未如此 華為鴻蒙6系統(tǒng)正式發(fā)布 余承東:體驗(yàn)從未如此

今天下午,華為舉辦華為Mate 80系列|Mate X7及全場(chǎng)景新品線上發(fā)布會(huì),正式推出備

科技說2025-12-03

華為旗艦巔峰之作:Mate 80 RS非凡大師發(fā)布 首發(fā)頂 華為旗艦巔峰之作:Mate 80 RS非凡大師發(fā)布 首發(fā)頂

今日,華為正式推出其迄今最高端的直板旗艦——Mate 80 RS非凡大師,這款新機(jī)

科技說2025-12-03

華為Mate80正式發(fā)布,起售價(jià)4699元 華為Mate80正式發(fā)布,起售價(jià)4699元

點(diǎn)擊圖片跳轉(zhuǎn)視頻

科技說2025-12-03

不止于快:高通發(fā)布第五代驍龍8,以端側(cè)AI重塑 不止于快:高通發(fā)布第五代驍龍8,以端側(cè)AI重塑

高通技術(shù)公司今日正式揭曉其第五代驍龍8移動(dòng)平臺(tái),標(biāo)志著旗艦移動(dòng)體驗(yàn)邁入

科技說2025-12-03

榮耀Magic 8 Ultra或明年1月發(fā)布:首發(fā)全新影像算法 榮耀Magic 8 Ultra或明年1月發(fā)布:首發(fā)全新影像算法

10月15日,榮耀推出了全新的Magic8系列,共包含兩款機(jī)型,分別是榮耀Magic8、榮

科技說2025-12-03

12月3日發(fā)布!一加Ace 6T將全球首發(fā)第五代驍龍8: 12月3日發(fā)布!一加Ace 6T將全球首發(fā)第五代驍龍8:

10月27日,一加推出了一加Ace 6,該機(jī)定位滿配旗艦,一經(jīng)發(fā)布便受到了用戶的廣

科技說2025-12-03

顯卡市場(chǎng)寒冬延續(xù):NVIDIA RTX 60與AMD RDNA 5發(fā)布或推 顯卡市場(chǎng)寒冬延續(xù):NVIDIA RTX 60與AMD RDNA 5發(fā)布或推

據(jù)RedGamingTech最新爆料,PC游戲玩家可能需要比預(yù)期更長(zhǎng)的時(shí)間才能迎來NVIDIA和

科技說2025-12-02

華為Mate XT迎來最強(qiáng)對(duì)手:三星Galaxy Z TriFold正式發(fā) 華為Mate XT迎來最強(qiáng)對(duì)手:三星Galaxy Z TriFold正式發(fā)

三星電子今日在海外市場(chǎng)正式發(fā)布了其首款三折疊智能手機(jī)——Galaxy Z TriFold,

科技說2025-12-02