☰

Sora驚豔發佈，文生視頻跨越式突破

OpenAI發佈Sora模型，1分鐘文生視頻效果驚豔。2月15日，OpenAI發佈文生視頻模型Sora，展示出許多亮點：1）視頻生成長度可達1分鐘，遠超其他文生視頻模型。2）3D空間的一致性，Sora可以生成具有動態鏡頭運動的視頻，隨着攝像機的移動和旋轉，人物和場景元素在三維空間中保持連貫運動。3）長期連續性和物體持久性。可以在單個視頻中生成同一物體的多個鏡頭，一個主題即使暫時離開視野也能保持不變。4）能夠向前後擴展視頻，以及連接兩個視頻。5）模擬數字世界，Sora能夠模擬人工操作，例如控制Minecraft遊戲中的玩家。我們認爲Sora相比此前其他文生視頻模型，已經跨越到實用生產力工具，1分鐘長度有望大規模應用在短視頻領域，擴展視頻的能力也有望製作長視頻，或將帶來新一輪內容創作產業革命。

AIGC應用空間廣闊，算力需求或呈量級提升。Sora是一種擴散模型，與GPT模型類似，Sora使用transformer架構，將視頻和圖像表示爲稱爲Patch的較小數據單元的集合，類似於GPT中的token。Sora建立在OpenAI在Dall E和GPT模型的基礎上。目前Sora暫未對外開放使用，僅OpenAI CEO Sam Altman在X平臺上與評論互動生成視頻，我們認爲算力的限制可能是目前Sora暫未開放使用的重要因素。隨着AIGC技術在影視劇集、宣傳視頻、自媒體、遊戲等領域逐步滲透，視頻創作效率或迎來顯著提升，同時視頻相對於文字、圖像的交互數據量級將有巨大提升，或對應算力需求的高速擴張。

谷歌發佈Gemini1.5 Pro，上下文長度達百萬token。2月15日，谷歌推出Gemini 1.5 Pro，支持長達100萬個token，遠超當前其他基礎模型，可以一次性處理大量信息，如1小時的視頻、11小時的音頻、超過3萬行代碼或超過70萬個單詞。Gemini 1.5 Pro是一箇中型大小的多模態模型，相同基準測試下其性能與此前谷歌最大的Gemini-1.0 Ultra相似，即使上下文窗口增加，Gemini1.5 Pro也能保持高水平的性能。我們認爲，谷歌Gemini1.5的推出進一步促進了大模型技術的良性競爭，產業發展趨勢欣欣向榮。

投資建議：

算力側：中科曙光、浪潮信息、海光信息、利通電子、新易盛、高新發展、中際旭創、工業富聯、寒武紀、神州數碼、恆爲科技、軟通動力、潤建股份、萬馬科技、雲賽智聯、拓維信息、烽火通信等。

映射應用：萬興科技、紫天科技、虹軟科技、大華股份、海康威視。

風險提示：技術迭代不及預期、經濟下行超預期、行業競爭加劇。

本文源自券商研報精選

Sora驚豔發佈，文生視頻跨越式突破

相關資訊