☰

東風悅享申請基於潛在擴散模型的可控數據生成專利，解決擴散模型生成內容可控性不夠精確的問題

金融界2024年12月12日消息，國家知識產權局信息顯示，東風悅享科技有限公司申請一項名爲“一種基於潛在擴散模型的可控數據生成方法、系統及介質”的專利，公開號 CN 119107519 A，申請日期爲 2024 年 9 月。

專利摘要顯示，本發明涉及一種基於潛在擴散模型的可控數據生成方法、系統及介質，所述方法包括：U1.通過潛在擴散模型的圖像編碼器，對噪聲圖片和目標ROI圖片進行圖像編碼，得到噪聲圖片嵌入的數據信息和ROI嵌入數據信息，並將目標box信息輸入MLP模型進行識別，獲取目標box嵌入數據信息，並通過潛在擴散模型的自然語言編輯器，對場景提示詞進行編碼，獲取prompt嵌入數據信息；U2.基於所述prompt嵌入數據信息、所述目標box嵌入數據信息和所述ROI嵌入數據信息，採用基於自適應學習的交叉注意力拼接算法對數據進行拼接嵌入。本發明不僅解決目標檢測部分場景、極端樣本難採集的問題，而且引入目標ROI信息和box信息解決擴散模型生成內容可控性不夠精確的問題。

本文源自：金融界

作者：情報員

東風悅享申請基於潛在擴散模型的可控數據生成專利，解決擴散模型生成內容可控性不夠精確的問題

相關資訊