云端AI推理卡“云燧i20”發布

        光明網 2021-12-07 23:08:19

        12月7日,燧原科技發布針對云端推理場景的AI加速產品——第二代云端人工智能推理加速卡“云燧i20”。

        據介紹,作為全新一代云端AI推理加速產品,云燧i20擁有高達819 GB/s的AI加速卡存儲帶寬,為目前業內最大存儲帶寬,遠超行業同類產品水平;同時全面支持從FP32、TF32、FP16、BF16到INT8的計算精度。對比第一代推理產品,云燧i20將浮點算力提升到1.8倍,整型算力提升到3.6倍。

        燧原科技CEO趙立東表示,“當前,我國芯片產業正處于激烈的成長與蛻變時代,燧原科技以‘做大芯片,拼硬科技’為時代使命,基于原始創新的軟硬件架構,正在不斷加速技術創新與產品迭代。性能趕超業內旗艦GPU的云燧i20正是關鍵成果之一。”

        算力的提升并非單純依靠硬件的升級,而是通過軟件手段,使得現有條件下硬件的利用率和效率被顯著提高。燧原科技通過引入通用高層圖優化和大規模算子融合技術,充分釋放了大容量片內存儲和高帶寬存儲的利用率,將模型平均性能提升3.5倍,硬件算力利用率平均提升2倍。

        應用技術的提高,往往帶來成本優勢。通過升級的編程模型以及算子自動分片、自動生成技術,自定義算子開發效率翻倍,模型遷移成本大大降低;此外,燧原科技的“馭算”軟件棧增強了對動態性的支持,使云燧i20在檢測、語音識別、語義理解等場景更具競爭力。

        “云燧i20的發布標志著燧原科技在云端AI算力加速領域,從訓練到推理的完整產品線已全面迭代到第二代,能夠以更有競爭力的產品,為客戶提供更優的AI計算方案。”燧原科技CEO趙立東表示。

        目前,以語音識別、圖片識別、視頻內容分析為主的感知類應用,內容推薦和欺詐交易攔截等決策類應用在云端大部分都是以實時在線的方式提供服務;同時神經網絡的參數越來越多,數據帶寬需求也越來越高,兼顧高帶寬和低延遲變得至關重要。云燧i20創新性地采用了高帶寬HBM2E存儲,實現了高達819GB/s的超大帶寬,為各類云端推理業務提供高吞吐、低延時的性能,保障其準確、平穩、高效的運行。

        之江實驗室發展合作部副部長吳麗娟表示,“之江實驗室今年3月與燧原科技成立聯合研究中心,圍繞人工智能應用場景,共同開發具有標桿性的技術解決方案,構建開源開放的創新生態系統。目前,燧原科技的第一代人工智能訓練產品‘云燧T11’正在之江實驗室搭建千卡高性能計算的液冷集群,打造符合國家碳中和政策導向的低碳綠色數據中心。未來,我們還會在智能計算的更多領域合作研發。”

        浪潮信息副總裁劉軍表示,“燧原科技是國產人工智能計算芯片的領軍企業,浪潮信息與燧原科技通過元腦生態聯合創新,在AI整機系統、AI算力優化、場景方案落地等多方面深入合作。此次隨著云燧i20的發布,標志著燧原從訓練到推理全面進入2.0時代,這也是國產AI算力發展的里程碑。我們期待和燧原一起緊密合作,共同推進中國人工智能產業的快速發展。”

        關鍵詞: 芯片

        免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

        最新推薦