中國高校最大云上科研智算平臺上線,由復旦大學與阿里云共建_全球即時看

        澎湃新聞 2023-06-27 19:41:53

        ·首個基于CFFF平臺訓練的科學大模型,是復旦大學人工智能創新與產業研究院李昊團隊研發的45億參數量的中短期天氣預報大模型,目前訓練成果已正式發布,并達到國際先進水平。在CFFF平臺上,45億參數量一天之內就能訓練完畢。

        ·CFFF平臺還將持續擴大其算力規模,并向復旦校外的科研機構、高校、醫院、高科技企業等開放。


        (相關資料圖)

        部署在復旦校內的“近思”一號和托管在1500公里外阿里云烏蘭察布數據中心的“切問”一號連成了一臺真正意義上的“超級計算機”。6月27日,中國高校最大的云上科研智算平臺CFFF(Computing for the Future at Fudan)在復旦大學正式上線。

        澎湃科技(www.thepaper.cn)了解到,CFFF是為發現和解決復雜科學問題而建設的科研“超級計算機”,由面向多學科融合創新的AIforScience(人工智能用于科研)智能計算集群“切問”一號和面向高精尖研究的專用高性能計算集群“近思”一號兩部分組成,二者的名稱來源于復旦大學校訓“博學而篤志,切問而近思”。據介紹,CFFF由復旦大學與阿里云、中國電信共同打造,以先進的公共云模式提供超千卡并行智能計算,并支持千億參數的大模型訓練,這在國內高校中屬于首例。

        平臺啟動儀式上,中國工程院院士、阿里云創始人王堅回憶起2008年剛創辦阿里云時在高校的演講,他表示,自己最初投身云計算的初心,就是“讓每一位學生都能用得起超算,讓計算發揮出它的價值。”15年后CFFF平臺上線,讓王堅感慨自己當年的愿望成真。

        復旦大學校長、中國科學院院士金力表示,一方面,CFFF作為國內高校第一的大規模異構智算平臺,希望它能夠為復旦的基礎科學研究提供更強大更穩定、更加靈活高效低成本的算力支持。另一方面,希望基于CFFF平臺能夠建成一批具有世界級影響力的科學大模型,例如生命科學大模型、大氣科學大模型、材料科學大模型、集成電路大模型等。

        45億參數量一天內訓練完畢

        目前,CFFF平臺上的第一個科研成果已經誕生,是復旦大學人工智能創新與產業研究院李昊團隊近期發布了45億參數量的中短期天氣預報大模型,預測效果在公開數據集上首次達到業界公認的ECMWF(歐洲中期天氣預報中心)集合平均水平,并將預測速度從原來的小時級縮短到了3秒內。據介紹,這個45億參數量的大模型只用一天就完成了訓練。

        李昊在接受澎湃科技等媒體的采訪時介紹,“第一,我們把它的預報時長延長到了15天;第二,我們做到了歐洲的中期天氣預報中心的集合平均水平;第三,模型采用的相對數值模式的推理速度是分鐘級甚至秒級,這也是這個人工智能模型本身的優勢。”

        “基于CFFF平臺的千卡并行智能計算,這樣一個規模的大模型只用一天就完成了訓練。傳統的計算平臺是很難做到的。”李昊說。

        不過李昊也表示,目前大模型取得的成績更多還是統計意義上的結果,天氣預報是一個復雜的過程,對于臺風等極端天氣的預報還需要在更多實際場景中去驗證模型,也需要跟產業界更多單位和專家進行合作。

        金力表示,未來CFFF平臺還將持續擴大其算力規模,并向復旦校外的科研機構、高校、醫院、高科技企業等開放。

        金力認為,在數據和智能技術驅動的“大科學時代”,如何在日新月異的科技創新環境中贏得主動,在關鍵領域取得創新突破,是時代給予高校的命題。以CFFF平臺為代表的智算平臺作為一種新興的科研超算架構,將成為科研的重要支撐力量,極大提升科研效率、降低科研成本,加速科學原理發現和技術突破,并有力推動科學大模型的落地。

        據復旦大學介紹,CFFF平臺從開始建設的第一天起,就收到了來自復旦不同院系的多種研究需求,不僅涵蓋生命科學、大氣科學、材料科學領域,也包括金融系統分析等社會科學研究。平臺上的云原生與低代碼工程化AI開發平臺,進一步降低了AI與科研融合的門檻。

        27日,面向全球科研人員的首屆“世界科學智能大賽”也宣布正式啟動,大賽設置生命科學、量子化學等五大賽道,CFFF平臺將為參賽隊伍提供免費訓練算力,并以更普惠的算力長期支持部分科研項目。

        復旦四校區所有實驗設備都能高速接入

        在具體技術層面,部署在復旦校內的“近思”一號和托管在1500公里外阿里云烏蘭察布數據中心的“切問”一號連成了一臺真正意義上的“超級計算機”。百G高速數據傳輸網和阿里云的大規模異構算力融合調度技術、分級存儲技術、AI與大數據一體化技術,讓復旦四校區的所有實驗設備都能高速接入,做到異構算力統一管理,計算任務統一調度,滿足不同應用場景下的科學智能研究與應用需求。位于“東數西算”節點上的阿里云烏蘭察布數據中心,以公共云模式為復旦校內多學院的多個科研項目提供更高性能、更具彈性、更低成本和更綠色的智能計算服務。

        復旦大學浩清教授、人工智能創新與產業研究院院長漆遠表示,有賴于公共云模式,跑在CFFF平臺上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。

        另外,據復旦大學方面介紹,CFFF平臺還擁有國內高校最大規模的多級數據冷熱分層存儲集群,解決了海量科研數據無法長期備份的痛點,并支持云上高速傳輸。以往PB級科研數據從復旦校內傳到西部數據中心需要兩周,如今當天就能完成,真正實現了“東數西算”。

        高校與企業如何合作?

        啟動儀式之后,金力和王堅一道接受了媒體采訪。談到此次阿里云與復旦大學的合作,王堅和金力均表示,企業與高校的合作不應僅僅局限于產學研科技成果轉化的范疇,而應將其看作企業與高校聯合創新并聯合培養人才的活動。

        王堅表示,高校和企業的合作不僅是高校把研究成果轉化到企業這樣一個簡單的關系,而是可以創造出更多東西。回溯歷史,IBM和哥倫比亞大學的合作誕生了計算機專業,MIT和貝爾實驗室的合作誕生了通訊專業,而此次阿里云與復旦大學的合作也可以在未來創造更多新的機會。王堅還提到,用GPU(圖形處理器)來做AI計算的方法是高校老師和學生首先使用的,但產業界后來將這種方法做成了規模化,這讓高校和產業界在創新上有了更好的聯動。

        金力表示,科技飛速發展為高校如何培養學生造成了很大挑戰,一方面是跨學科的融合,另一方面是新技術不斷地產生,為此產教融合非常重要,“這種產教融合不是一個單純的技術轉移的格局,而是創新上和人才培養上高校和企業密切的互動。創新不是簡單地為企業解決一個技術,而是能在國際競爭當中處于優勢地位,在人才培養上企業能更多看到社會的進步,因此也能讓高校的人才培養看到目標和方向。”

        金力還從復旦大學的角度對新一代工程師的培養提出了新的觀點,他表示:“中國發展到現在,培養工程師除了量的角度,還有一個質的角度,也就是我們不僅要培養更多的工程師,還要培養卓越的工程師。”

        “很多人覺得復旦大學文科好,后來發現我們理科也不錯,但是復旦大學的工科沒有形成優勢。”金力坦言,“原來傳統的工科更多強調用成熟的技術和材料去做工程上的實現,總是強調高端、前端,但從產業角度來說這些東西是沒用的。現在我們強調把原創的東西去做工程化的實現,希望把沒用的東西變成有用,這就是傳統工科和新工科的區別。”

        (本文來自澎湃新聞,更多原創資訊請下載“澎湃新聞”APP)

        關鍵詞:

        免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

        最新推薦