“All in AI”產品戰略關鍵一步 安謀科技Arm China發布“周易X3”NPU IP快訊
在‘All in AI’產品戰略的指引下,致力于為基礎設施、智能汽車、移動終端、智能物聯網等場景打造端側AI計算效率新標桿,實現從模型部署到開發調試的全鏈路支持。
【TechWeb】11月20日消息,日前,安謀科技Arm China正式推出新一代NPU IP“周易”X3,作為公司“All in AI”產品戰略下的首款重磅產品,“周易”X3基于專為大模型設計的最新DSP+DSA架構,在性能、能效與軟件生態方面實現全面突破,致力于為基礎設施、智能汽車、移動終端、智能物聯網等場景打造端側AI計算效率新標桿。
安謀科技Arm China產品研發副總裁劉浩表示:“在‘All in AI’產品戰略的指引下,我們將持續加大投入,以前瞻性視野整合頂尖研發資源,秉持開放合作理念,為生態伙伴提供業界領先的從硬件、軟件到服務的端到端解決方案,全力賦能伙伴的產品創新和商業化落地。”
硬件架構全面升級,為大模型量身打造
公開數據顯示,“周易”X3采用最新的DSP+DSA架構,專為大模型而生,在計算效率、帶寬、精度適配、任務處理四大維度上實現了跨越式提升,精準解決端側AI大模型運行難題,打造端側AI計算效率的新標桿,是其“All in AI”戰略的硬核體現。
其單Cluster最高支持4個Core,擁有8~80 FP8 TFLOPS算力且可靈活配置,單Core帶寬高達256GB/s。相較于“周易”X2產品,“周易”X3的CNN模型性能提升30%~50%,多核算力線性度達到70%~80%。在同算力規格下,AIGC大模型能力較上一代產品實現10倍增長,這得益于16倍的FP16 TFLOPS、4倍的計算核心帶寬、超過10倍的Softmax和LayerNorm性能提升共同驅動。
借助這些優化,端側大模型推理將更高效:在Llama2 7B大模型實測中,“周易”X3 NPU IP在Prefill階段算力利用率高達72%,并在安謀科技Arm China自研的解壓硬件WDC的加持下,實現Decode階段有效帶寬利用率超100%,遠超行業平均水平,滿足大模型解碼階段的高吞吐需求。
軟件平臺開放易用,開發效率顯著提升
周易”X3搭載全新升級的Compass AI軟件平臺,實現從模型部署到開發調試的全鏈路支持:
兼容TensorFlow、PyTorch、ONNX、Hugging Face等主流框架與模型庫;
支持超160種算子與270多種模型,覆蓋LLM、VLM、VLA、MoE等主流架構;
提供GPTQ量化、動態Shape支持、Token級量化等先進優化手段;
核心組件如Parser、Optimizer、Linux驅動等已開源,支持自定義算子與編譯流程,助力開發者實現白盒化部署。
安謀科技Arm China產品總監鮑敏祺指出:“‘周易’X3遵循‘軟硬協同、全周期服務與成就客戶’的產品準則,提供從硬件、軟件到售后服務的全鏈路支持,以前瞻性設計、專業團隊交付與深度服務投入,全面助力客戶產品成功與商業化落地。”
多場景落地,推動端側AI普及
新一代“周易”X3 NPU IP將端側智能的邊界拓展至更廣闊的應用場景,面向基礎設施、智能汽車、移動終端、智能物聯網四大領域,精準匹配當前爆發的端側AI需求。
基礎設施:支持加速卡中CNN與大模型的高效推理;
智能汽車:為ADAS自動泊車、IVI智能交互提供高能效AI算力;
移動終端:在AI PC與AI手機中實現超分渲染與AI Agent流暢運行;
智能物聯網:在智能IPC、智能網關等設備中實現本地化低延遲推理。
“周易”X3 NPU IP的發布,標志著安謀科技Arm China“All in AI”產品戰略的正式開啟。安謀科技Arm China以“AI Arm CHINA”為戰略發展方向,為千行百業智能化轉型提供更強IP“核芯”動力。(御風)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。
