阿里云發布視頻云直播3.0產品

        中國網 2020-09-22 18:58:16

        9月18日召開的“云棲大會”上,阿里云視頻云發布了視頻云“直播3.0”產品,助理各個行業實現第二增長曲線。

        基于云計算的發展成熟,視頻云的概念也在不斷探索音視頻技術的邊界和融合更多更典型的空間場景,目前比較成熟可見的產品,主要包含視頻直播、視頻點播、音視頻通信RTC、智能媒體生產與處理等等。

        視頻云技術的核心與極致——超低延時、超高清、低成本

        從線下搬到線上的云活動,這背后的本質就是直播技術,今年其已成為多行業標配。對直播而言,有三個重要元素:成本、質量、延時。一場直播,成本考慮的是如何高效、便捷地觸達直播的受眾,并能支撐百萬千萬的并發。質量,考慮的是音視頻的畫面清晰度、流暢度、卡頓度。而對于延遲層面,低延時是實時互動的關鍵,是視頻直播的核心技術。在行業端,成本、質量、延時之間一定是相互平衡的關系,而直播中的“延時”是最直接的體驗,一般將延時分為幾類:普通延時、優化延時、低延時、超低延時,達到5秒的延時才可成為低延時。傳統直播的延時來源于鏈路的五個環節:采集編碼、上行推流、CDN分發、下行拉流、解碼渲染,視頻云技術正是需要對直播全鏈路進行優化,行業中,阿里云便是通過如此的技術優化,推出超低延時技術(RTS),延時可以做到1秒以內,同時在直播連麥的部分,主播和嘉賓利用WebRTC通道,延時可達300毫秒,體驗極其順滑,這對用戶端、企業端、行業端都是極大的技術普惠。

        在直播之外,視頻內容也正全面爆炸,視頻制作愈發平民化,數據顯示,2020年中國人日均觀看在線視頻的時常高達250分鐘,近三年全球每月的視頻流量增長了三倍,這些視頻分布在短視頻、點播、直播等領域。而視頻云技術的重點任務,就是讓互聯網上這些海量視頻都提升為高質量視頻,并追求這個過程中的極致成本,要達到這個目標,需要解決三個問題:第一,如何應對低質量的視頻源;第二,互聯網視頻是將視頻的制作成本轉移到云端,所以制作成本極高,需要普惠降低成本;第三,電視廣播一般帶寬很高,動輒百兆級別,但很多用戶還是在弱網低帶寬情況下接入網絡。對此,可利用視頻云技術,通過窄帶高清編碼來解決上述問題,以達到高清晰、低成本、低寬帶,并能最終普惠影院級的視頻服務。簡單而言,“窄帶高清”就是將用戶上傳的視頻,通過視頻云的處理、轉碼之后,變得更清晰,同時對帶寬的占用更低。對此,阿里云研發團隊對所謂“視頻質量的提升”進行了重新定義,基于用戶主觀質量并對其建模,通過千頻千面的大數據分析對不同的視頻達到最優效果。據了解,其最新推出的窄帶高清版本,最大亮點是將成本相比原來有數量級的下降,從而實現技術的極大普惠和大規模的商業化。

        視頻云驅動行業生長第二增長曲線

        對于視頻云的發展,其更核心的價值在于技術的極大普惠,賦能于更多典型的場景和更多行業的創新。目前,伴隨視頻云技術的探索,已經攻克了疫情期間一些重要場景的互動形態問題,突破了一些商業發展的瓶頸問題,也在創造一些行業交互發展的新空間,很多行業和場景都演進到新的發展階段,尤其在電商直播、在線教育、社交娛樂、媒體資訊等方面,我們能看到,視頻云技術在驅動行業增長的第二曲線,帶來了新的空間、新的體驗、新的可能性。

        數字視頻新基建助力在線教育“戰疫”

        疫情期間,全民教育從線下轉為線上,得益于持續打造的數字視頻新基建,視頻云的網絡與媒體處理產品在全面助力學校“停課不停學“工程。針對在線教育領域,視頻云擁有一站式教育解決方案,同時還將服務能力拓展到更廣闊的教育場景。

        以學信網為例,在疫情期間恰逢整個中國的研究生復試,數據顯示,2020年碩士研究生招生報考人數達到了341萬,遠程視頻面試作為其新的交互形式,可以通過多機位視頻互動、多項技術核驗認證,來保障面試過程科學有效、公平公正。據學信網技術負責人程衛星介紹,學信網基于阿里云承接起了今年遠程面試的重要任務,短期內,在學信網硬件條件有限的情況下,視頻云團隊將云服務集成到學信網的業務系統中,充分結合其業務特點和業務流程,助力學信網極大提高系統的承載力和穩定性。在面試期間最高峰同時有3199考場、9758路視頻并發,整個系統運行平穩順利。此次研究生復試,學信網通過視頻面試系統的使用,與往年相比,復試的調劑效率顯著提高,整個工作周期明顯縮短。

        AI編輯部開啟智慧新聞表達時代

        目前,傳統媒體已經進入到深度融合階段,如何利用視頻AI的能力賦能是重要問題。人民日報媒體技術股份有限公司楊海霞介紹,傳統媒體的核心鏈條包含視頻拍攝、生產制作、媒資管理和分發傳播,面對大量的視頻內容生產制作和審核分發,提高效率是核心問題,而視頻AI恰起到關鍵作用。

        針對媒體內容的生產制作環節,體現在智能轉碼、智能合成、智能配音三個場景能力。首先,是針對大量外部視頻素材的轉碼需求,人民日報利用視頻云的窄帶高清技術,直接與自身業務系統集成,來完成轉碼智能動作,并在過程中對不佳畫質做技術處理,提升整個視頻的質量。第二,是生產精品視頻的大量原材料的AI智能合成,包括對內容的智能提取、轉場效果、背景音樂等按照一定模板進行智能合成,并批量化生產輸出視頻,如現在很多賽事的精彩集錦和數據新聞。第三,是AI智能配音,即AI通過聲紋采集和文字轉語音,可系統智能地完成內容的自動配音和合成,由此極大提升媒體內容的生產效率。

        同時,在媒資管理和分發傳播環節,人民日報與阿里云視頻云團隊合作,通過人臉庫和物理庫,實現人物識別、物體識別、語音識別、OCR識別,從而生成智能標簽,利用于高效的媒體檢索,并更好的在分發端進行智能推薦和相關推薦。此外,當前的黨媒正在將UGC模式更好的應用其中,這就涉及要對UGC生產提供智能的支持,同時又要通過智能審核保障內容的安全性,在一些大的省級融媒云平臺上,已經廣泛應用到了這些智能技術。綜合從全業務場景和鏈條來看,視頻AI能力已大大提升了傳統媒體生產、分發的效率和質量。

        直播翻譯系統助推電商出海

        毋庸置疑,電商直播是今年的超熱話題,它結合了視頻直播和網紅直播的優勢,處在蓬勃發展之中。阿里巴巴旗下面向全球市場打造的跨境電商平臺“速賣通”(AE),被稱為“國際版淘寶”,面向海外買家,其平臺商家也非常希望能更好地利用直播溝通把商品賣到海外。但是,AE的商家中,87%為中國人,受限于外語能力無法參與直播,同時,AE的用戶來自于上百個國家,即使主播有外語能力,也無法覆蓋到每一個用戶語種。基于此,阿里巴巴達摩院與阿里云共同打造了世界上第一個電商直播翻譯系統,該系統依托于視頻云強大的視頻直播、媒體處理服務能力,結合了導播臺的ET字幕產品方案和視頻翻譯技術方案,最終打造的AE直播翻譯系統,整體鏈路延時小于1秒,讓電商直播溝通體驗全新升級。

        該系統在今年5月上線后,大批“無外語能力”的淘系商家涌入AE直播,自如的運用中文進行直播賣貨,通過直播翻譯系統譯成英語、俄語、西班牙語等等,世界各地的觀眾都能實時看到帶有當地語言字幕的直播視頻,還可與主播溝通互動,最終,帶來的銷售轉化高于普通AE商家的20倍。未來在此系統基礎上,會繼續深度研發多語向互譯,讓商業沒有語言障礙,讓技術普惠能量升級,讓天下沒有難做的生意。

        虛擬交互技術打造娛樂新價值

        視頻云對視頻時代的加速推動,體現在新內容和新交互兩個層面,而交互方式的探索在娛樂行業具有更大空間。疫情期,在線娛樂行業迎來爆棚式發展,也讓行業借此更加審視在交互體驗上的突破價值。優酷作為視頻內容的重要陣地,結合視頻云技術,開展了對互動視頻體驗的全新升級,集中體現在三個關鍵詞:一是直播化,即基于DIBR重建技術,讓用戶在自由的視角進行任意的觀看,實現自由視點互動直播化。二是游戲化,通過人臉識別、動捕系統等體感互動技術,賦能視頻的游戲化體驗,其中的技術已應用在優酷即將播出的動漫IP上,可實現用戶和IP的互動,進而增加用戶粘性。三是特效化,在綜藝、體育領域與AR特效的融合,創造全新的交互體驗,尤其當AR特效應用于體育賽事場景中,可以讓觀眾實時了解當前賽事情況,在優酷2020年CBA直播中,其利用阿里視頻云技術,打造比賽中的“子彈時間”特效,通過自動化、準實時的CBA云特效合成,讓觀眾以自如的視角觀看當前誰在投籃,顯示命中率是多少,當前陣型如何等等,達到現場實時直播輸出的效果。

        所有以上的特效互動技術,都得益于目前CV和CG技術,兩者結合助力于互動特效視頻的自動化、批量化生產,相較于傳統方案可以提速百倍。基于此,我們對未來的期待一定是虛擬世界、增強世界和物理世界三元合一的狀態。

        2020年視頻行業的爆發,加速了視頻云的應用和對多場景互動形態的探索,視頻云技術也致力于不斷創新內容和交互方式的改變,“未來,隨著人工智能、5G、AR、VR技術的加速創新、視頻與云計算的高效融合、以及視頻云技術本身的不斷演進,一定會有越來越多的行業和場景,基于視頻進入新內容、新交互的時代,創造新的業務價值,引領行業的第二增長曲線。”阿里云林昊的這句話,充分展現視頻云技術在未來的發展。張銘陽

        關鍵詞: 視頻 視頻拍攝 視頻

        免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

        最新推薦