華爲雲計算技術申請視頻生成方法、裝置及集羣專利,生成幀間一致性高的視頻

金融界2024年11月15日消息,國家知識產權局信息顯示,華爲雲計算技術有限公司申請一項名爲“視頻生成方法、裝置及集羣”的專利,公開號 CN 118945442 A,申請日期爲2023年7月。

專利摘要顯示,一種視頻生成方法、裝置及集羣。該方法包括:獲取目標視頻的文本描述信息和多個結構信息,多個結構信息和多個噪聲樣本一一對應;在第一時間步中,獲取多個噪聲樣本中的第一噪聲樣本,第一噪聲樣本用於生成目標視頻中的第一視頻幀;利用預訓練的擴散模型,基於文本描述信息和第一噪聲樣本對應的結構信息,去除第一噪聲樣本的噪聲,得到第一噪聲樣本對應的第一中間樣本;以及,更新第一噪聲樣本對應的第一中間樣本的特徵,得到第一噪聲樣本對應的第一輸出樣本;其中,第一噪聲樣本的第一輸出樣本用作第一時間步的下一個時間步的噪聲樣本,或者第一視頻幀。該方法可以在無需訓練模型的情況下,生成幀間一致性高的視頻。

本文源自:金融界

作者:情報員