大模型重塑版訊飛輸入法來了!能懂每個人的AI輸入

智東西作者 程茜編輯 漠影

智東西10月28日報道,訊飛輸入法又上新,這次是端側大模型重塑版!

科大訊飛的大模型底座上週官宣更新,訊飛星火4.0 Turbo七大核心能力全面超過GPT-4 Turbo,數學和代碼能力超越GPT-4o,國內外中英文14項主流測試集中拿下9項第一。

在此之上,搭載着訊飛星火端側輸入大模型、訊飛星火語音大模型的訊飛輸入法14.0亮相,再次讓人眼前一亮。

訊飛輸入法14.0的”AI輸入增強“可以直接讓輸入法“猜你喜歡”,輸入上句就能秒出下句,聊天氣、遊玩計劃都不在話下;在大模型的加持下,輸入法方言語音輸入即將支持多達202種;爲了更契合生成式AI輸入,輸入法的界面升級活力視界2.0,除了各種功能卡片、切換動效一應俱全,個性皮膚設置也讓視覺煥新;還有橫貫娛樂、生活、工作等各大場景的AI助手。

這一被大模型重塑的訊飛輸入法14.0,提出的“每個人的AI輸入”價值主張,已經清晰呈現在大衆視野中,讓所有人都能享受AI輸入服務的可能成爲了現實。

可以看到,大模型應用時代,這一歷經40多年發展原先只用於打字的輸入法,已經在作爲用戶日常工作、生活、娛樂必備交互工具這件事上更勝一籌。

在大模型走向落地應用深水區的同時,現在大大小小的AI原生應用層出不窮,但像輸入法這樣與用戶日常生活連接如此緊密,又能在不同界面隨時調用AI能力的產品並不多。

但如果輸入法直接與大模型簡單粗暴的相接,只能解決助力表達的一環,但新的問題又接踵而至。首先雲端大模型輸入服務成本高,其次用戶對生成內容的多樣化需求難以被緊湊的鍵盤界面滿足,還有通用模型難以解決用戶垂域溝通場景的體驗,這些都是當前AI爲名的輸入法亟需解決的難題。

那麼,在AI席捲我們日常生活的當下,訊飛輸入法針對於上述痛點的思考是什麼?輸入法如何潛移默化影響我們的日常表達?看完訊飛輸入法14.0的全面重構,我們或許可以找到答案。

一、輸入法也能“猜你喜歡”,輸入中前後三大場景幫你秒回消息

現在不論是聽音樂、購物、點外賣…………“AI輸入增強”經常能猜中我的內心想法。你有沒有想過在聊天中,也能有一位24小時隨時待命“猜你喜歡”的互聯網嘴替?

這就是訊飛輸入法14.0重磅更新的本地AI化的“聯想”和“預測”功能。不過,這可並非此前輸入法中預埋的根據上文猜詞功能。在訊飛星火端側輸入大模型的加持下,我有時候只需要一句話,輸入法上就會自動生成下文的完整回答。

先來聊一下最近大家都關心的天氣。

當我向聊天對象發出“今天好冷啊”,訊飛輸入法上方的輸入框就能自動幫我接上下一句,“多穿點衣服”、“不要着涼了”,不僅省下了輸入的時間,還能給我一些聊天靈感。

聊天氣、聊週末安排時,這些直接出現的短句都深得我心。

除了直接給出關聯句子,這一輸入法還能根據用戶的關鍵詞進行“私人訂製”回覆。

當我打出“我想週末去公園”,輸入法就可以自動幫你聯想到去公園需要天氣好的時候,所以當打出“天氣”,輸入法就會自動補齊句子。

晚上極度疲憊想要和朋友快速結束對話,當你打出“我要早點睡”,訊飛輸入法上方就直接出現“明天要上班”的表達,這時候你就可以心安理得拋下手機進入夢鄉。

還有一種場景是,在下雨天手拿雨傘的你本來打字就不方便,當你和聊天對象輸入“今天下雨了”,下半句話只要輸入“jide”的拼音,就可以直接生成“記得帶傘”的回覆。

在增強聯想的場景中,只要你給出一個情境,訊飛輸入法就能幫你補齊下文。

例如想和朋友討論週末出去玩的計劃,當你輸入“我想去公園散步”,輸入“享受”,訊飛輸入法就可以秒懂你的想法,直接給出“享受大自然,放鬆心情”,消除AI機械化、硬生生的聯想。

訊飛輸入法的升級,能根據用戶輸入的拼音或者開頭關鍵詞,然後結合其日常輸入習慣聯想甚至預測出一些完整的句子。

除了打字輸入,現在語音輸入的使用場景也越來越多。基於端側大模型的泛化能力,離線狀態下訊飛輸入法的識別能力也直線up,識別準確率基本持平雲端語音輸入效果。

訊飛輸入法業務部總經理程坤補充道,這一離線語音識別的功能可以讓用戶網絡不好時,也能實現完整輸入體驗。爲了做到這一點,他們用大模型將離線語音功能重寫,他認爲,這也是未來針對用戶做個性化輸入的基礎,能結合用戶的本地輸入習慣。這意味着,離線的語音輸入不僅僅是在線語音輸入的補充,而是有可能成爲用戶使用日常語音輸入的風向標。

無獨有偶,谷歌、蘋果、OpenAI等國際巨頭科技公司正不遺餘力強化語音識別能力,提高其識別的準確率和響應速度。

而在中文語音識別這件事上,訊飛輸入法不斷加碼。自2010年發佈以來,訊飛輸入法已經迭代了14年。此次,訊飛輸入法14.0接入訊飛星火語音大模型,將使得方言識別種類倍增,可覆蓋近300座城市。據悉,訊飛輸入法將在“方言免切換”中支持202種方言自由說,讓每個人都能“想說就說”。這與科大訊飛在1024開發者節上發佈的星火大模型的底座能力一脈相承。

在方言免切換的功能中,即使兩個聊天對象一個說方言一個說普通話,或者兩個人說不同的方言,也無需手動切換。當我播放了一段北京話和中原官話夾雜的方言音頻,訊飛輸入法也準確識別了出來。

二、上萬個AI人設,幫你分分鐘化身網絡顯眼包

當然大模型賦能的輸入法能力遠不止於此,更新後的訊飛輸入法還能讓AI直接橫跨你的工作、生活、娛樂社交圈。

與上司溝通、戀愛、鬥圖、翻譯、校對……形形色色的場景都能讓你在輸入法中找到對應的AI助手。

對於我而言,社交場景中最頭疼的就是工作相關的溝通環節,既需要準確傳達自己的意思,還要把握好和同事、客戶溝通的方式。

所以訊飛輸入法的AI助手中,我高頻使用的就是“高情商溝通”助手。

當與同事合作完成一個項目,但項目DDL就在明天,僵硬的催促可能不是溝通的好辦法。這時候你只需要點擊高情商溝通,選擇溝通對象以及想要的風格,訊飛輸入法就直接生成了5種回覆方式,語氣詞、關鍵信息應有盡有。

還有更爲考驗情商的一個場景就是,你需要通知大家今晚加班,這時候你只需要將“今天晚上需要加班”這幾個字打出來,AI助手就能對應生成風趣幽默、高情商、簡單直接等話術,你直接點擊發送,無需再頭痛斟酌每一個字詞。

當下的網絡上的年輕人都喜歡立人設,“人設立得好”等相關話題也頗有熱度!

訊飛輸入法直接將這些人設一股腦搬到了輸入法的AI助手裡,不僅有霸道總裁、黛玉文學、大胖橘,還有烏薩奇等,想要立什麼樣的人設,AI都能幫你用“同款”風格進行聊天。程坤透露,短短一個多月時間,訊飛輸入法中官方加用戶創建的人設已經達到1萬多個。

作爲甄嬛傳深度愛好者,我主要試用了“嬛言嬛語”,即使面對現代色彩濃厚的“我好睏,想喝咖啡”,AI助手也非常忠於人設,直接穿越到了古代。

此外,除了面向C端消費者提供豐富的AI助手,針對於企業,訊飛輸入法也提供了領域定製化的AI助手,能根據企業所屬的行業、具體的需求,讓輸入更能深入其中,幫助企業員工提質增效。如今,訊飛輸入法已經與友邦保險聯合定製了AI營銷助手,提供了一整套智能化的解決方案。

把大模型裝進輸入法的最新形態已經被展現在我們的日常生活中。值得一提的是,訊飛輸入法的AI能力並不侷限與當前,其創新採用了全新的AI插件化引擎構架,使得輸入法可以靈活拓展多種AI模型,能實現廣泛覆蓋、智能融合,讓本地化的AI輸入呈現給更多的用戶。

三、讓輸入更準確、更高效、更懂用戶,大模型+輸入的更優解

訊飛輸入法正在全方位重塑中文輸入法。這除了體現在上述提到的功能升級,訊飛輸入法還在輸入界面以及用戶的交互上進行了自我革新。

爲了讓生成式AI與用戶的輸入更加契合,訊飛輸入法的活力視界2.0再一次亮眼的表現。程坤談道,活力視界2.0爲輸入法中的每種服務都單獨設計了卡片,並跟其本身的功能進行了深度結合。

同時,用戶在選擇不同功能時中間有動效切換並完成了和所有輸入法皮膚的適配。

程坤認爲,輸入法界面的重新設計,是未來輸入法提供輸入文字之外更廣泛能力必須要走的一步。

在這個趨勢下,訊飛輸入法一直走在行業前面,正如其此前率先將傳統輸入法的候選欄變爲工具欄,從只有備選文字變爲擁有語音輸入等更多切換按鈕。

基於這種模式,訊飛輸入法集成了很多服務,覆蓋了用戶輸入前、中、後三大場景。

輸入法作爲用戶使用電子設備時調用頻率最高的,也是與用戶距離最近的服務,相比於其他AI產品而言與用戶的交互也更爲密切、深入。

不過,這背後程坤提到,他們遇到的難題就是,大模型訓練、推理成本高,在高頻輸入場景爲用戶提供大模型能力,對於輸入法本身而言並不是提供AI服務最好的路徑,因此要找到一個平衡點,讓所有用戶都能用上大模型同時成本降下來。

在輸入法領域已經積累14年之久的科大訊飛,交出了自己的答卷。

從2010年發佈業內首箇中文語音輸入法,到方言語音輸入、多方言多語種免切換輸入,訊飛輸入法不斷突破高效輸入、降低輸入門檻這兩件事的極限,在生成式AI輸入法上同樣如此。

▲訊飛輸入法業務部總經理程坤

基於星火大模型,他們結合訊飛輸入法的輸入場景訓練出了端側大模型,這個大模型解決了輸入過程、輸入上屏以及輸入完成之後,下一句話如何聯想的過程。

在大模型參數不再追求龐大的參數,手機性能提升同時垂直領域大模型應用興起的背景下,端側大模型部署成爲可能,這使得輸入法與端側大模型的結合多了更多可能性和創新空間。

多年佈局之下,訊飛輸入法已經貫穿不同設備、不同輸入場景、不同用戶羣體的個性化需求,再輔以大模型時代的生成式AI技術,將這一產品打造的更準確、更高效、更懂用戶。

結語:14年技術積累,致力於打造每個人的AI輸入

輸入法與大模型的結合與其他產品不同,既需要符合用戶傳統的使用習慣,還要將新的AI能力融入其中。輸入法是用戶日常使用頻率極高的工具,人們在長期使用過程中形成特定的操作習慣和預期,同時,大模型具有強大的語言理解、生成和預測等能力,將這些融入輸入法需要精心設計,不能簡單地堆砌功能。而恰好,科大訊飛在技術研發和產品落地的耕耘已久。

在訊飛星火大模型底座之上,訊飛輸入法搭載了訊飛星火端側輸入大模型,全力支撐輸入法的拼音和離線語音輸入,同時基於訊飛星火語音大模型雲端能力的快速迭代用於提升方言輸入種類和效果,將通用大模型與垂域小模型的能力充分體現到用戶的輸入過程之中,真正實現AI的交互體驗升級。

訊飛輸入法發展至今已經14年時間,且星火大模型自去年起就成績頗豐。可以看到,訊飛輸入法已經在端側大模型時代努力打造普惠的屬於“每個人的AI輸入”。