東風悅享申請基於潛在擴散模型的可控數據生成專利,解決擴散模型生成內容可控性不夠精確的問題
金融界2024年12月12日消息,國家知識產權局信息顯示,東風悅享科技有限公司申請一項名爲“一種基於潛在擴散模型的可控數據生成方法、系統及介質”的專利,公開號 CN 119107519 A,申請日期爲 2024 年 9 月。
專利摘要顯示,本發明涉及一種基於潛在擴散模型的可控數據生成方法、系統及介質,所述方法包括:U1.通過潛在擴散模型的圖像編碼器,對噪聲圖片和目標ROI圖片進行圖像編碼,得到噪聲圖片嵌入的數據信息和ROI嵌入數據信息,並將目標box信息輸入MLP模型進行識別,獲取目標box嵌入數據信息,並通過潛在擴散模型的自然語言編輯器,對場景提示詞進行編碼,獲取prompt嵌入數據信息;U2.基於所述prompt嵌入數據信息、所述目標box嵌入數據信息和所述ROI嵌入數據信息,採用基於自適應學習的交叉注意力拼接算法對數據進行拼接嵌入。本發明不僅解決目標檢測部分場景、極端樣本難採集的問題,而且引入目標ROI信息和box信息解決擴散模型生成內容可控性不夠精確的問題。
本文源自:金融界
作者:情報員