海信申請基於多模態大模型的視頻處理專利,實現視頻特徵的精細化提取
金融界2024年10月18日消息,國家知識產權局信息顯示,海信集團控股股份有限公司申請一項名爲“基於多模態大模型的視頻處理方法、裝置、設備及介質”的專利,公開號CN 118779491 A,申請日期爲2024年7月。
專利摘要顯示,本申請涉及數據處理技術領域,尤其涉及基於多模態大模型的視頻處理方法、裝置、設備及介質,在本申請實施例中,多模態大模型包括融合結構、語言大模型和至少兩個視頻編碼器,其中,採用至少兩個視頻編碼器提取目標視頻的初始視頻特徵,並採用融合結構將多個視頻編碼器的初始視頻特徵進行融合,得到目標視頻特徵,實現視頻的特徵的精細化提取,增強多模態大模型視頻細節描述能力。
本文源自:金融界
作者:情報員
相關資訊
- ▣ 卓視智通申請基於大模型的長視頻理解專利,有效減小大語言模型上下文長度對視頻理解的限制
- ▣ 卡特加特申請基於多模型協作的圖生視頻及配樂專利,大幅降低視頻創作技術門檻
- ▣ 暗物智能科技申請多模態驅動的視頻生成專利,實現視頻內容的個性化和豐富性
- ▣ 浪潮通信申請基於多模態大模型的無人機巡檢專利,提高無人機巡檢視頻分析任務靈活性
- ▣ 廣州開得聯申請多模態視頻導播專利,提高視頻導播效果
- ▣ 浪潮通信申請基於RKNN的邊緣網關實時視頻推理專利,實現高流量視頻數據實時處理並減少資源依賴
- ▣ 九章雲極申請多模態大模型圖像處理專利,提高機器學習模型處理圖像的效率
- ▣ 百度網訊申請基於大模型的信息處理專利,提升會話應答的準確性
- ▣ 快手申請視頻大模型可靈商標
- ▣ 建信金融科技申請多路視頻流處理專利,使得視頻結構清楚,有利於用戶瞭解周圍環境
- ▣ 廣東電網申請基於人工智能的雙目視頻信號採集和分析裝置專利,實現視頻信號的採集分析與結果傳輸
- ▣ 深圳樂行申請基於模型拓印的垂類大模型生成方法專利,降低大模型的複雜度並提高精度
- ▣ 智源發佈原生多模態世界模型Emu3,實現圖像、文本、視頻大一統
- ▣ 美騰科技申請基於大模型的人機交互專利,實現大模型對業務問題解析的功能
- ▣ 中創申請智能監控視頻的異常分析方法及系統專利,實現智能化的監控視頻異常分析
- ▣ 武漢重型機牀集團申請基於骨架模型的機牀幾何模型還原專利,可保證機牀振動可視化的真實準確性
- ▣ 快手公佈圖生視頻模型專利
- ▣ 濟南海基申請基於多模態信息融合的一體化監控系統及方法專利,提升交通異常監控與管理效率
- ▣ 基於Transformer的通用世界模型成功挑戰視頻生成
- ▣ 當虹科技:多模態大模型技術實現高效的多模態內容創作與編輯,視頻超級壓縮技術可應用於衛星通信及商業航天領域
- ▣ 廣東電網申請多頻振盪辨識方法專利,避免頻率振盪分析中的模態混疊現象
- ▣ 深圳若愚科技申請基於多模態模型的意圖識別專利,使機器人在複雜任務中減少對人類頻繁指令的依賴
- ▣ 華爲技術和浙江大學申請視頻編解碼網絡參數更新專利,提升視頻編解碼器的模型參數對待編碼幀內容的匹配度
- ▣ 科大訊飛申請多模態交互專利,能夠實現多模態交互,提升用戶體驗
- ▣ 匯暢數宇取得基於 AI 模型的人臉風格化處理方法專利
- ▣ 網易申請一種信息發送及接收處理專利,實現信息的高效處理及多元發送模式
- ▣ 中通服軟件科技申請基於單模態監督對比學習和推理增強的視覺問答專利,提高問答模型推理能力和可解釋性
- ▣ 寧波博登智能科技申請基於多模態大模型的通用圖像標註系統及方法專利,標註精度高
- ▣ 浪潮雲申請一種基於圖文特徵向量相似度的多模態檢索系統專利,提供靈活的搜索方式