爲了找出羞羞視頻,百度雲居然有“嬌喘模式”
原標題:爲了找出羞羞視頻,百度雲居然有“嬌喘模式”
如果一天同時有一萬個唐馬儒實時在線鑑片,世界將會變成怎樣?
是的,那畫面太美我也不敢想。不過,9月15日,在百度雲智峰會的分論壇“視頻智能技術與平臺”上,百度雲高級產品專家黃鋒在視頻 AI 產品發佈中介紹了“複製10000個唐馬儒”的功能。
到底怎麼回事?
現在大家直播玩得666,短視頻也十分火熱,攝像頭還到處都要,這造成了一種嚴峻的局面:視頻量海量增長,誰知道里面有沒有混入一些黃賭毒等奇怪的東西。
個人可能看得開心(或者不開心?),平臺要承擔相應的責任。於是,這些企業很煩惱:現在羣主都可能被拉下水,何況我們平臺?!
於是,百度雲就趁機利用視頻人工智能技術推出了內容分析 VCA 、內容審覈VCR 和封面智選 VCS 。
我們先從內容分析 VCA說起 。
除了視頻量比海深,之前很多企業依靠的是人工審覈標註團隊,所謂人工審覈標註,就是一堆勤勞的唐馬儒不停地鑑定視頻,給視頻打上標籤。如果只是篩選出黃賭毒也就罷了,要是要做內容分類、推薦怎麼辦?
唐馬儒的身體不只被掏空~人力成本太高,企業請不起這麼多唐馬儒,畢竟人家在用生命工作,很貴的。
這時,AI 技術派上了用場。
AI 版唐馬儒拿到一個視頻後,把視頻分爲了幾層:鏡頭、幀和語音。然後,它開始了視頻場景識別、人臉識別、字幕識別、物體識別,同步進行語言識別,並將語音識別的結果與之進行交叉認證,從而精準地判斷這個人在什麼場景下在幹嘛,他周圍有些什麼物體。
黃鋒稱,這些識別模型使用了 1000 萬+訓練數據,能識別 5000 多個場景與40000 種物體,並且用上了百度的人臉識別技術,還有百度百科公衆人物庫與自定義人臉庫。
也就是說,他不僅能從海量視頻中檢索出鹿晗,還能識別這是一個在郵筒邊拍照的鹿晗,還是在跳舞的鹿晗。
或者,是一個在中國工作拿着仙女棒的波多野結衣或在日本和道具一起加班的波老師。
黃鋒說,對比人工,VCA 分析效率提升5倍,日吞吐能力相當於10000人,分析成本降低了 50%,召回率提高 10 倍。
下面來到了你們最關心的鑑黃,哦不,內容審覈 VCR 。
還是按照內容分析VCA 一樣,AI 唐馬儒講視頻分層成了幀和音頻,然後將兩者(圖像)與視頻黑庫中的圖像指紋和聲紋指紋進行對比,AI 會自動對這個視頻進行色情識別、暴恐識別、政治人物識別和廣告識別。
(看上去,視頻黑庫其實就是小黑屋?)
視頻中的畫面進行文字識別得到字幕,視頻中的語音通過長語音識別也變成文字,這兩部分文字都再進行文本審覈。
問題來了,假如什麼話都沒有,畫面也不暴露,一言不合就開車,只剩下不能描述的哼哼唧唧的聲音怎麼辦?
黃鋒表示,不要擔心,我們 AI 識別還有“嬌喘模式”,能識別這些不可描述的聲音。
對這些視頻內容進行嚴格的審覈後,AI 唐馬儒有三個處理模式:通過、封禁、人審。
所謂人審,就是你藏得太深了,連本 AI 都搞不定,讓我家真正的唐馬儒出馬吧!
黃鋒指出,VCR 還有更多的用武之地:
視頻去重:兩個清晰度不一、但內容相同的視頻,當然是取其一了。
雷鋒網宅客頻道編輯也不想承認這一點,但是沒辦法,你去超市買個西紅柿都會選更好看的那一個啊!!!
他向雷鋒網介紹了 VCS 封面選圖過程,通過鏡頭檢測——主/客觀質量過濾——內容相關性三個步驟,AI 幫助一個視頻選出了自己賣相最好的那一張封面照。
圖1和圖3均是以前封面選圖的結果,呈現局部或者單一圖像,圖2和圖4是VCS的選圖,圖2呈現了人和寵物的關係,圖4展現的是完整的車。
其實,聽到最後,宅客頻道編輯弱弱提出了一個終極疑惑:這和百度雲是什麼關係?
黃鋒說,這是百度雲接入的視頻 AI 能力,通過線上溝通、定製方案、測試對接,最後就能正式上線。
好吧好吧,你說什麼都對。
反正聽到“嬌喘模式”那一節時,雷鋒網編輯已經笑到抽搐不在線了。