Sora驚豔發佈,文生視頻跨越式突破
OpenAI發佈Sora模型,1分鐘文生視頻效果驚豔。2月15日,OpenAI發佈文生視頻模型Sora,展示出許多亮點:1)視頻生成長度可達1分鐘,遠超其他文生視頻模型。2)3D空間的一致性,Sora可以生成具有動態鏡頭運動的視頻,隨着攝像機的移動和旋轉,人物和場景元素在三維空間中保持連貫運動。3)長期連續性和物體持久性。可以在單個視頻中生成同一物體的多個鏡頭,一個主題即使暫時離開視野也能保持不變。4)能夠向前後擴展視頻,以及連接兩個視頻。5)模擬數字世界,Sora能夠模擬人工操作,例如控制Minecraft遊戲中的玩家。我們認爲Sora相比此前其他文生視頻模型,已經跨越到實用生產力工具,1分鐘長度有望大規模應用在短視頻領域,擴展視頻的能力也有望製作長視頻,或將帶來新一輪內容創作產業革命。
AIGC應用空間廣闊,算力需求或呈量級提升。Sora是一種擴散模型,與GPT模型類似,Sora使用transformer架構,將視頻和圖像表示爲稱爲Patch的較小數據單元的集合,類似於GPT中的token。Sora建立在OpenAI在Dall E和GPT模型的基礎上。目前Sora暫未對外開放使用,僅OpenAI CEO Sam Altman在X平臺上與評論互動生成視頻,我們認爲算力的限制可能是目前Sora暫未開放使用的重要因素。隨着AIGC技術在影視劇集、宣傳視頻、自媒體、遊戲等領域逐步滲透,視頻創作效率或迎來顯著提升,同時視頻相對於文字、圖像的交互數據量級將有巨大提升,或對應算力需求的高速擴張。
谷歌發佈Gemini1.5 Pro,上下文長度達百萬token。2月15日,谷歌推出Gemini 1.5 Pro,支持長達100萬個token,遠超當前其他基礎模型,可以一次性處理大量信息,如1小時的視頻、11小時的音頻、超過3萬行代碼或超過70萬個單詞。Gemini 1.5 Pro是一箇中型大小的多模態模型,相同基準測試下其性能與此前谷歌最大的Gemini-1.0 Ultra相似,即使上下文窗口增加,Gemini1.5 Pro也能保持高水平的性能。我們認爲,谷歌Gemini1.5的推出進一步促進了大模型技術的良性競爭,產業發展趨勢欣欣向榮。
投資建議:
算力側:中科曙光、浪潮信息、海光信息、利通電子、新易盛、高新發展、中際旭創、工業富聯、寒武紀、神州數碼、恆爲科技、軟通動力、潤建股份、萬馬科技、雲賽智聯、拓維信息、烽火通信等。
映射應用:萬興科技、紫天科技、虹軟科技、大華股份、海康威視。
風險提示:技術迭代不及預期、經濟下行超預期、行業競爭加劇。
本文源自券商研報精選