<big id="h5tjq"></big>
<blockquote id="h5tjq"><tt id="h5tjq"></tt></blockquote>
  • <tfoot id="h5tjq"><tbody id="h5tjq"></tbody></tfoot>
  • <rt id="h5tjq"></rt>

      <tt id="h5tjq"><option id="h5tjq"></option></tt>
        1. <cite id="h5tjq"><rp id="h5tjq"><pre id="h5tjq"></pre></rp></cite>
          欧美乱子伦xxxx12,99精品国产兔费观看久久99,国产亚洲欧美在线人成aaaa,亚洲中文av,亚洲AV无码专区首页第一页,少妇无码太爽了在线播放,91精品国产91,4hu四虎永久免费地址ww416
          快速發布求購 登錄 注冊
          行業資訊行業財報市場標準研發新品會議盤點政策本站速遞

          深圳先進院在大模型AI芯片設計領域取得突破

          研發快訊 2025年03月27日 17:20:07來源:中國科學院深圳先進技術研究院 20486
          摘要近日,中科院深圳先進技術研究院黃明強研究員團隊在大模型AI芯片領域取得重要進展,該研究成功攻克人工智能大語言模型(LLM)在資源受限邊緣設備部署的核心難題,為智能機器人、便攜設備等場景的實時AI應用提供了創新解決方案。

            【儀表網 研發快訊】近日,中科院深圳先進技術研究院黃明強研究員團隊在大模型AI芯片領域取得重要進展,其研究成果在電路與系統領域頂級期刊IEEE Transactions on Circuits and Systems I: Regular Papers上在線發表,論文題目為“EdgeLLM: A Highly Efficient CPU-FPGA Heterogeneous Edge Accelerator for Large Language Models”。該研究成功攻克人工智能大語言模型(LLM)在資源受限邊緣設備部署的核心難題,為智能機器人、便攜設備等場景的實時AI應用提供了創新解決方案。
           
            自2017年以來,Transformer算法在自然語言處理和計算機視覺(CV)研究領域迅速成為人工智能領域的主導力量。通過引入自注意力機制,Transformer改變了傳統的序列建模方法,不再依賴卷積神經網絡或循環神經網絡進行特征提取和序列處理。這一創新不僅增強了模型的并行化能力,使得大規模模型的訓練成為可能,還顯著提升了模型性能。在Transformer取得成功之后,研究人員開始探索更大的模型,這些模型通常擁有數百億甚至更多的參數,被稱為“大語言模型”。大語言模型不僅增強了人工智能的語言處理能力,還推動了AI更廣泛的技術進步,為教育、娛樂、醫療和商業等行業帶來了革命性的變革。但是大語言模型在資源受限的端側系統部署仍存在較大的困難。
           
            首先,大語言模型計算量龐大以及內存訪問需求高?,F有解決方案通常將這些權重參數量化為INT4格式。然而,為了確保計算精度,模型中的激活函數仍然保持FP16格式。因此,在前饋神經網絡(FFN)層中,系統需要支持FP16INT4格式的矩陣乘法。另一方面,在多頭注意力(MHA)模塊中,KV緩存作為激活數據動態生成,因此涉及KV緩存的矩陣乘法需要FP16FP16格式。因此,設計混合精度計算單元以加速LLM變得尤為重要。我們分析了前饋網絡(FFN)和多頭注意力(MHA)的計算需求,提出了高效率的混合精度計算單元以及組脈動陣列架構。此外,我們還提出了對數尺度結構化稀疏性和塊級量化方法,以在硬件效率和算法精度之間取得平衡。
           
            此外,在大語言模型中,定義計算流程的算子圖極其復雜,包含數百甚至數千個以復雜方式相互連接的算子,確保從一個算子到另一個算子的過渡無縫且高效成為了一項重大挑戰。該團隊分析了大語言模型中的編譯需求,設計了一種統一且通用的數據格式,適用于所有算子和AI算法中的高維張量結構,使系統能夠快速執行算子操作而無需任何數據重排。隨后,開發了端到端的編譯方案,其中動態編譯用于處理不同輸入token長度,指令流水線策略用于減少延遲。該方案能夠動態編譯所有算子,并將整個模型映射到CPU-FPGA異構系統上。
           
            最終,整個設計成功部署在AMDXilinx VCU128 FPGA上。與GPU相比,該系統的吞吐量提高了1.91倍,能效提高了7.55倍;與先進的FPGA加速器FlightLLM相比,整體性能提升了10%到24%。該成果有望應用于新一代具身智能機器人、手機AI大模型等應用場景中。
           

          我要評論
          文明上網,理性發言。(您還可以輸入200個字符)

          所有評論僅代表網友意見,與本站立場無關。

          版權與免責聲明
          • 凡本網注明"來源:儀表網"的所有作品,版權均屬于儀表網,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明"來源:儀表網"。違反上述聲明者,本網將追究其相關法律責任。
          • 本網轉載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品來源,并自負版權等法律責任。
          • 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。
          • 合作、投稿、轉載授權等相關事宜,請聯系本網。聯系電話:0571-87759945,QQ:1103027433。
          廣告招商
          今日換一換
          新發產品更多+

          客服熱線:0571-87759942

          采購熱線:0571-87759942

          媒體合作:0571-87759945

          • 儀表站APP
          • 微信公眾號
          • 儀表網小程序
          • 儀表網抖音號
          Copyright ybzhan.cn    All Rights Reserved   法律顧問:浙江天冊律師事務所 賈熙明律師   儀表網-儀器儀表行業“互聯網+”服務平臺
          意見反饋
          我知道了
          主站蜘蛛池模板: 高潮抽搐潮喷毛片在线播放| 久艹视频在线观看| 99久久人妻无码精品系列蜜桃| 华人在线亚洲欧美精品| 欧美亚韩一区二区三区| 欧美老熟妇喷水| 洛浦县| 2020无码专区人妻系列日韩| 在线看片免费人成视久网下载| 精品国产制服丝袜高跟| 亚洲成片观看四虎永久| 午夜福利激情一区二区三区| 欧美久久久| aaaawwww毛片免费视频| 亚洲午夜成人精品电影在线观看| 中国xxxx自拍| 狠狠躁夜夜躁人人爽天天5| 国产免费人成视频在线观看| jizzjizz| 亚洲中文字幕久久精品品| 果冻传媒MV国产推荐视频| 亚洲在线一区二区| 女人一级特黄大片国产精品| 老熟女重囗味hdxx69| 亚洲精品宾馆在线精品酒店| 国产在线视频精品视频| 爆乳熟妇一区二区三区| 日韩精品亚洲专在线电影| 国产成人精品AA毛片| 亚洲av中文久久精品国内| 七妺福利精品导航大全| 亚洲成av人片色午夜乱码| 亚洲天堂av 在线| 亚洲AV怡红院影院怡春院| 亚洲欧美激情另类| 国产黄a三级三级| 国产av不卡一区二区| 国产一区内射最近更新| 岛国av在线免费播放| 久久天天躁狠狠躁夜夜躁2012| 色婷婷狠狠97成为人免费|