國泰君安:OpenAI發佈Sora AI生成視頻的里程碑

智通財經APP獲悉,國泰君安證券發佈研報稱,Sora 模型推動 AI 多模態領域飛躍式發展,AI 創作等相關領域將迎來深度變革,AI 賦能範圍進一步擴大,多模態相關的訓練及推理應用也將進一步提升對算力基礎設施的相關需求。

以下爲研報核心摘要:

2024 年 2 月 16 日 OpenAI 發佈文生視頻模型 Sora,AI視頻生成能力實現跨越式發展,模型強大的視頻生成能力推高行業天花板,產業賦能的深度和廣度有望超預期拓展。

投資建議:Sora 模型推動 AI 多模態領域飛躍式發展,AI 創作等相關領域將迎來深度變革,AI 賦能範圍進一步擴大,多模態相關的訓練及推理應用也將進一步提升對算力基礎設施的相關需求。推薦標的:金山辦公、科大訊飛、萬興科技、虹軟科技、神州數碼、中科曙光,受益標的:蘇州科達、當虹科技。

OpenAI 發佈首個文生視頻模型 Sora,效果震撼。Sora 模型可以通過文本描述生成 60 秒長視頻,還可以對視頻色彩風格等要素精確理解,創造出人物表情豐富、情感生動的視頻內容。目前 Sora 尚未對公衆全面開放,僅邀請部分測試者進行體驗,但是 OpenAI CEO 在社交平臺上展示了由網友提供文本描述生成的視頻案例,展現了 Sora 在視頻生成方面的強大能力。

Sora 三大亮點突出,實現 AIGC 領域的里程碑式進展。首先是 60 秒長視頻,Sora 可以保持視頻主體與背景的高度流暢性與穩定性。其次是單視頻多角度鏡頭,Sora 在一個視頻內實現多角度鏡頭,分鏡切換符合邏輯且十分流暢。再是理解真實世界的能力,Sora 對於光影反射、運動方式、鏡頭移動等細節處理得十分優秀,極大地提升了真實感。

Sora 的技術基礎保障了強大功能的持續迭代。Sora 是一種 Diffusion 模型,同時具備良好的擴展性。Sora 使用 DALL·E 3 的 Recaption 技術,使視頻可以更符合文本指令,此外還具備靜圖生視頻、原視頻拓展補幀等能力。OpenAI 表示 Sora 是構建世界模型的基礎,未來將向實現 AGI 繼續邁進,我們認爲該模型的當前表現展現出了這種潛力。