9 月 29 日消息,AMD 在 Huggingface 平臺(tái)公布了自家首款 " 小語(yǔ)言模型 "AMD-Llama-135m,該模型具有推測(cè)解碼功能,擁有 6700 億個(gè) token,采用 Apache 2.0 開(kāi)源許可,附模型地址如下。
據(jù)介紹,這款模型主打 " 推測(cè)解碼 " 能力,其基本原理是使用小型草稿模型生成一組候選 token,然后由更大的目標(biāo)模型進(jìn)行驗(yàn)證。這種方法允許每次前向傳遞生成多個(gè) token,而不會(huì)影響性能,從而顯著減少 RAM 占用,實(shí)現(xiàn)效率提升。
AMD 表示,這款模型在四個(gè) AMD Instinct MI250 節(jié)點(diǎn)訓(xùn)練了六天,其 " 編程專用版本 " 變體 AMD-Llama-135m-code 則額外耗費(fèi)了四天時(shí)間進(jìn)行微調(diào)。
發(fā)布日期: 2024-07-14
發(fā)布日期: 2023-07-04
發(fā)布日期: 2025-03-21
發(fā)布日期: 2024-06-17
發(fā)布日期: 2024-05-15
發(fā)布日期: 2024-08-22
發(fā)布日期: 2024-04-15
發(fā)布日期: 2024-04-07
發(fā)布日期: 2025-04-14
發(fā)布日期: 2025-04-14
發(fā)布日期: 2025-04-14
發(fā)布日期: 2025-04-14
發(fā)布日期: 2025-04-14
尋找更多銷售、技術(shù)和解決方案的信息?
廣州綠測(cè)電子科技有限公司(簡(jiǎn)稱:綠測(cè)科技)成立于2015年11月,是一家專注于耕耘測(cè)試與測(cè)量行業(yè)的技術(shù)開(kāi)發(fā)公司。綠測(cè)科技以“工程師的測(cè)試管家”的理念向廣大客戶提供專業(yè)的管家服務(wù)。綠測(cè)科技的研發(fā)部及工廠設(shè)立于廣州番禺區(qū),隨著公司業(yè)務(wù)的發(fā)展,先后在廣西南寧、深圳、廣州南沙、香港等地設(shè)立了機(jī)構(gòu)。綠測(cè)科技經(jīng)過(guò)深耕測(cè)試與測(cè)量領(lǐng)域多年,組建了一支經(jīng)驗(yàn)豐富的團(tuán)隊(duì),可為廣大客戶提供品質(zhì)過(guò)硬的產(chǎn)品及測(cè)試技術(shù)服務(wù)等支持。
技術(shù)工程師
020-22042442