普通人終於能感覺到大模型有啥用了
AI大模型會對我們的生活帶來什麼改變?
這似乎是一個難以回答的問題。因爲在人工智能出現的這麼多年裡,普通人的感知很弱,甚至完全沒有感知。這與人工智能發展階段有關,早期人工智能處於“專家系統”階段,此時人工智能只能跟着預設的規則操作。此後,儘管隨着大數據時代到來,人工智能進入“統計學習階段”有了衆多突破,如視覺識別、自然語言理解等,但也很難落地到普通人使用。
在很長一段時間內,人工智能似乎只是人們對未來生活的想象,大部分人對人工智能的第一印象是在影像、電影中看到的“科幻”場景,虛幻、神秘,但觸不可及。
這並不是人工智能發展的初衷,最終科技還是要讓更多普通人都能用上,這纔是人工智能發展的意義。而今,大模型技術打開了通用人工智能的大門。
試想一下,當你需要在短時間內整理一篇論文的主要觀點和細節時,通常需要先通讀全文再逐句解析,最後才能整理出相關細節。但有了AI大模型輔助後,只需要將文檔“投喂”給大模型並提出“文檔總結”的需求,不到數秒你就能看到AI大模型整理的相關細節內容。
這或許只是AI大模型做得最淺顯的事情,它帶來的改變,更多在悄然無聲中發生。
未來,或許都不需要人發出指令,AI大模型就能根據你自身習慣給出建議並提前做好各項工作,你要做的則是不斷糾錯,讓大模型更瞭解自身的個性化需求。
這纔是科技企業在人工智能領域不斷探索的意義,即讓本來離人千里之外的科技“接地氣”,真正刷新每個人的生活體驗。
而這一切的前提是,AI大模型,要先讓普通人有感知、有體驗、有用處。
打破壁壘,AI大模型正走進每個人的“口袋”
智能手機——幾乎是每個人最常使用、最容易接觸的智能設備,但大模型卻沒能第一時間落地。
不是手機廠商們不想將大模型落地於手機,而是做成這件事的難度係數太高了。
試想一下,如果你在智能手機上使用一次大模型,就會佔據全部手機運行內存,其他應用全部受限,甚至手機無響應,最終直接死機。即便能運行,但每次等待回覆都要數秒鐘,並且耗費大量電量,相信沒人願意在手機上使用這樣的大模型。
手機大模型真正的挑戰,在於如何在功耗、性能和成本之間找到一個絕妙的平衡。這並不是一件易事,否則也不會大模型出來這麼久,還是有很多人無法方便使用大模型。
vivo副總裁、OS產品副總裁,vivo AI全球研究院院長周圍曾提到,目前vivo有3億中國大陸用戶,如果這些用戶每天用10次大模型,一天的運算成本就有3000萬元,一年成本近百億。
可見,手機廠商要想將大模型落地手機,首先必須降低大模型在手機端的運算成本,這是制約大模型難以落地手機的關鍵因素。
vivo的解決方式是推出一個大模型矩陣,涵蓋10億、70億、700億、1300億和1750億,共計5個不同級別的大模型。這個大模型矩陣基本覆蓋用戶所有使用場景,並實現了10億和70億大模型的端側落地。
功耗,本是另一座難以逾越的“大山”,但端側大模型的出現,讓一切問題全都迎刃而解。
vivo首先加速框架架構設計升級,使得底層運行時的極致性能功耗得到優化,並通過VCAP(vivo自研的移動端AI計算加速平臺)使得底層平衡精度與性能採用多種混合精度並行計算。最後,vivo還聯合硬件廠商攻關大模型NPU的部署,通過全鏈路協同異構器件計算加速降低功耗。
在多個層面的共同努力下,vivo將功耗控制在正常範圍,從而解決了大模型在智能手機上的長期運行難題,用戶也能享受到更快的響應速度,數據安全性也更高。
最後要解決的問題,則是用戶感知最直接,也是影響用戶體驗的關鍵因素——性能。
用戶等待時間過長、操作卡頓等情況,都會直接導致用戶放棄交互,嚴重影響用戶使用率。Google DoubleClick研究表明:如果一個移動端頁面加載時長超過3秒,用戶就會放棄而離開。BBC發現網頁加載時長每增加1秒,用戶就會流失10%。
這個問題,在大模型矩陣面前,獲得了完美的解決方案。例如針對文檔總結這類長文本輸入場景,vivo的10億級藍心大模型就能提供服務,而在實現對話這種短文本輸入的場景上,則可通過70億藍心大模型爲用戶服務。
vivo還對藍心大模型的性能進行了攻關優化。目前,vivo已經做到70億大模型的模型體積減小至3.2GB,運行內存優化至3.8GB,並且出詞性能達到每秒近16個漢字(10token/s),同時平均耗電不超過400mA。
vivo是帶着誠意和思考來落地大模型的,就像周圍所說,“這次是全面的、系統的、氣質上發生改變的一個應用”。
橫亙在大模型與智能手機之間的三座“大山”終於搬走了,原本離人千里之外的AI大模型,正在逐漸實現普及化,進入普通人使用的手機中,刷新衆多人的生活體驗。
AI大模型,需要“接地氣”
當AI大模型走入更多人的生活,然後呢?
儘管AI大模型驚訝了業界,但一般消費者對此並沒有那麼強的感知,大模型具體能幫助自己做什麼?生活會有哪些具體變化?“接地氣”、能用上,這纔是消費者真正能感知到的變化。
落到實處,如果今後只需要通過基於大模型打造的智能化應用提出如“幫我買一張杭州到北京的火車票”的需求,該智能化應用就能爲你快速挑出對應的功能或選項;當你瀏覽文字信息時,它不僅可以基於網頁/文檔/鏈接內容進行總結,還可以對文本內容進行問答……
當用戶與基於大模型打造的智能化應用長期接觸後,它還可以實現更加“懂你”的提供精確化、個性化的智能服務。比如它會幫你找出從杭州到北京的火車票還有哪幾班、你常選擇的座位還有沒有、離你最近的火車站是哪個、到達城市氣候如何……
完全按照你的生活習慣,給出有價值的建議。這些“能用上”的智能服務,纔是消費者真正感受到的改變。
簡單來說,未來搭載AI大模型的智能手機,將從一個“沉默”電子產品,轉變爲一個“能說會跳”、可感知你情緒、爲你“排憂解難”的“陪伴者”。
改變,正在發生。
vivo基於藍心大模型開發的首款全局智能輔助——藍心小V,已經將其變爲現實。作爲一款直接面向用戶的具有AI大模型能力的智能化產品,藍心小V將走入尋常百姓家,成爲每個人的專屬私人助理。
目前,藍心小V擁有超能語義搜索、超能問答、超能寫作、超能創圖、超感智慧交互五大智能輔助能力。這五大能力,對普通人來說都非常“接地氣”。
以超能問答這一能力爲例,每個人在工作中總會遇到一些新名詞、新事物,常理下都會通過傳統搜索引擎去查資料瞭解相關信息,此時輸入搜索的“關鍵詞”很重要,因爲有時候差一個詞,搜索出來答案就有很大差別。此外,在衆多網站鏈接中還要辨別哪些是廣告,哪些纔是真正靠譜的信息,整個過程難免有些耗時耗力耗心。
這屬於傳統的“人找服務”交互方式。
但現在,具備海量的參數、複雜的算法和強大訓練能力的大模型,如藍心小V,開始擁有“觸類旁通”和“智能涌現”的能力,朝着具備橫跨多領域學習能力的通用人工智能進化。這帶來的直接改變就是傳統服務供應模式向智能、個性化的服務匹配模式的轉變,即實現從“人找服務”到“服務找人”的轉變。
例如,用戶只需要描述具體需求發給藍心小V,如“XR、VR、AR、MR有哪些區別?”,大模型立刻就能整理好相關答案,並給出專家級的解答。甚至你去某個陌生城市旅遊,完全可以讓大模型設計旅遊線路,如“我想要到威海玩3天,請給出旅遊規劃與建議”,還能讓藍心小V幫你算出每天所需花銷,控制預算。
藍心小V之外,vivo還自主研發了自然語言對話機器人——藍心千詢。作爲一款自然語言對話機器人,藍心千詢支持與用戶自然對話、進行知識信息的快速問答、文學創作、中文理解、圖片生成,還可以像一名軟件工程師去編寫應用程序……
當然,大模型能做的事情遠不止於此。你完全可以將其當做各個領域的專家、每個城市的當地人、房產談判專家、面試指導達人……普通人能通過大模型解決更多實際工作生活產生的問題,這纔是大模型的價值所在。
一個關鍵的“分水嶺時刻”正在來臨。
埋頭種因,大模型沒有捷徑可走
“埋頭種因”,這是vivo創始人沈煒常提起的一個詞。
在沈煒看來,果不能求亦無須求,因決定果,埋頭種因,果自會水到渠成。
2017年,vivo種下了AI的“因”。這一年,AlphaGo震驚業界,沈煒提出一個觀點:人工智能是所有技術創新的最底層技術,在未來很長一段時間,我們都應該去“過飽和”地投入。就此,vivo開始佈局研究人工智能,組建了AI全球研究院,其也是首批設立專攻人工智能方向研究院的中國手機公司之一。
既然要做,那就本本分分把各個領域研究透,這是vivo一以貫之的價值觀。因此,在人工智能的本原包含的五個要素:數據、人力、算法、算力、安全,vivo一直在本分地打牢所有基礎。
2018年,vivo正式成立300人規模的人工智能圖譜研究院,致力於對人類知識進行圖譜建設。到今天,該研究院積累了13000T的多種模態數據,以及2800T高質量中文文本數據。這讓vivo滿足瞭如今大模型所必備的完整數據底座。
數據只是基礎,如何用好數據,投餵給大模型進行訓練與應用纔是關鍵所在。這需要“人力”和“算法”。
vivo在2019年起,始終保持着1000人左右的專業人工智能團隊,到2021年vivo已有超過600人專注研發大模型。這支“過飽和”投入的團隊沒有讓vivo失望,目前已經在頂級期刊發佈了超70多篇全球頂級論文。
vivo也明白,強大的基礎能力是大模型的根基。爲此在算法方面,vivo不僅在預訓練階段,就利用最前沿的Transformer架構,在包含了3.3萬億詞的大規模多語言數據集上進行訓練,還在強化學習階段,建立了300餘名專業人員組成的審覈團隊,制定了200+的安全審查機制,對模型的輸出進行篩查和標註,並藉此訓練出高質量的獎勵模型,保證爲用戶提供有價值的信息。
vivo用實際行動踐行了“本分”的價值觀。如今在算力方面,vivo在保證獲得CPU、NPU等設備的前提下,還建立了一個150人左右的工程團隊,通過信息技術應用創新,充分挖掘算力價值,實現更高效的模型訓練和推理部署。
vivo也沒有忘記安全的重要性。目前,vivo的內容理解平臺內容安全過濾服務,通過了中國信通院內容審覈服務系統評測,在文本、語音和視頻內容識別需要檢測的15個大類中,14個大類獲得最高的5星等級,1個獲得4星等級。
時隔六年後,當年vivo種下的因,終於在此刻落地,結出了豐碩的果實。
在中文大模型評測領域,vivo大模型在CMMLU榜單、C-Eval(大語言模型的多層次多學科中文評估套件)榜單上都取得了全球中文榜單第一的成績。近期,在中文通用大模型綜合性測評基準(SuperCLUE)最新發布的中文大模型10月榜單中,vivo自研大模型也以70.74的總分位列總排行榜第四,在國內大模型中排行第一。
無論潮水如何變動,科技如何迭代,vivo相信時代不會愧對每一家埋頭種“因”、本分創新的企業。科技企業要保持競爭力,沒有捷徑可走,必須打牢研發底座,做出對普通人真正有用的大模型。事實也證明,在每一輪科技迭代的浪潮中,不走捷徑、埋頭種因的vivo總能牢牢站穩腳跟、後發先至。今後,vivo仍將站在潮頭,讓創新科技“接地氣”,讓每個普通人都能享受科技帶來的改變。