中關村論壇年會閉幕,科大訊飛智能語音技術爲大會提供多項服務
4月29日,2024中關村論壇年會在北京圓滿閉幕,100多個國家和地區、150餘家外國政府部門和國際組織機構受邀參加了本次年會。面對上百位頂尖專家、上千名演講嘉賓,來自科大訊飛的訊飛同傳爲各項會議全程提供中英轉寫、翻譯上屏,線上直播字幕,多語種語音播報技術支持,獲得高度認可。
訊飛同傳第五年爲中關村論壇服務
中關村論壇是中國面向全球科技創新交流合作的國家級平臺。今年,中關村論壇首次在剛建成的永久會址舉辦,聚焦人工智能、數字金融、ESG、生命科學、國際交流等全球共同關注的科技發展方向組織專場活動。
這是訊飛同傳連續服務中關村論壇年會的第5年。2024中關村論壇年會以"創新:建設更加美好的世界"爲主題,爲期5天裡共舉辦近120場活動。在這近120場活動中,包括全體會議、國企發現與發明論壇、全球數字化應用創新論壇等在內的80場活動由訊飛同傳提供服務。大咖們藉助訊飛同傳實現跨語言實時交流。
另外,本屆中關村論壇年會中,全面開展線上語音直播頻道,所有觀衆可通過掃描二維碼,通過訊飛同傳小程序進行多語種播報收聽,打造多元化的創新參會模式。
訊飛同傳的服務,給來自各國的參會者留下了深刻的印象。
訊飛同傳基於科大訊飛語音轉寫、機器翻譯和語音合成的核心技術,能夠進行實時語音識別,包括中英文混合語音的識別,還能將中文語音翻譯成英語、法語、俄語、德語、日語、韓語、西班牙語和阿拉伯語等多種語言。訊飛同傳提供了離線單機版及在線版客戶端兩種形態,適用於大型高端會議、發佈會和展覽會等場合。
此外,訊飛同傳還能夠記錄會議內容,並實時生成字幕,提供字幕條模式和多語種全屏模式,滿足不同類型會議的需求。
參會者可以通過掃描二維碼或佩戴同傳耳機,在任何時間和地點收聽和觀看多語種的語音播報。通過訊飛同傳App,參會者能實現端到端免切換的流暢同傳體驗,讓用戶在聽到同傳翻譯播報的同時還可看到對應的文字以及多語種翻譯結果,滿足國際演講、訪談直播、跨國會議等多種場景的使用需求,實現邊看邊聽。
訊飛同傳已是諸多國際大會的標配,2023年迪拜的聯合國氣候變化框架公約大會(COP28)、第六屆南非金磚國家媒體高端論壇、第45屆IAA世界廣告大會、2023金融街論壇年會、日本大規模人工智能科技公司展會"AI EXPO TOKYO"、2023世界製造業大會、第31屆世界大學生運動會、世界人工智能大會、2023全球人工智能技術大會、澳門BEYOND國際創新博覽會等都有訊飛同傳的助力,讓來自全球各地的來賓溝通無障礙。
無論是政府間的高層對話,還是企業間的商務洽談,抑或是學術研討會上的學術交流,訊飛同傳都能夠提供高效便捷的同聲傳譯服務。
目前,訊飛同傳已服務超過全球50個國家及地區,服務支撐40萬+場會議,覆蓋超4億觀衆。
智能語音技術賦能傳統會議創新
25日上午,中關村論壇年會的開幕式上,集中發佈了十項具有創新性、前瞻性、顛覆性的重大科技成果,涉及基礎研究、前沿技術、科技基礎設施等各方面。科大訊飛運用語音合成技術,爲視頻環節進行AI配音。
語音合成等智能語音技術對傳統會議模式的創新突破效果顯著。藉助先進的深度學習技術,可將文本轉化成擬人化的語音,即"賦予機器像人一樣自然流暢說話的能力",是語音交互、語音翻譯的關鍵接口能力。
自上世紀90年代,科大訊飛開始在語音領域的探索,堅持源頭技術創新,14年蟬聯國際語音合成大賽冠軍,在語音識別、機器翻譯等領域也多次在國際大賽上奪冠。
深耕智能語音領域25年,科大訊飛不僅將中文語音技術做到了最好,也將多語種語音技術做到了最好。2020年,科大訊飛60個語種的語音識別、翻譯和37個語種的語音合成超過谷歌、微軟,達到國際領先水平;2021年,科大訊飛在美國國家標準與技術研究院NIST發起的國際低資源多語種語音識別競賽OpenASR中,獲得全部受限賽道的15個語種冠軍及7個語種非受限賽道冠軍。目前,科大訊飛的多語種技術已經可以滿足60餘種語言的智能語音技術需求。
作爲人工智能領域龍頭企業,科大訊飛不僅將中文語音技術做到了最好,也將多語種語音技術做到了最好。1月份,結合語音屬性解耦、多語種共享建模等技術創新發布訊飛星火語音大模型,在多語種語音識別方面首批37個主流語種效果超過OpenAI Whisper V3。
星火語音大模型首批覆蓋語種中,24個主要語種識別率達到了90%(已超過實用門檻);13個重點語種識別率更是超過了94%。在多語種語音合成能力方面,27個主要語種MOS(Mean Opinion Score)評分達到了4.4(普通人口語水平爲4),13個重點語種MOS評分高達4.6(地方播音員水平)。
4月26日,訊飛星火大模型V3.5春季上新,科大訊飛發佈業界首個支持長文本、長圖文以及長語音的大模型產品。在此次升級中,面對廣泛的音視頻信息高效獲取需求,科大訊飛推出長語音功能,將語音識別和翻譯技術結合起來,可以實現會議錄音、學習視頻等的一鍵研讀,實現音視頻場景的高效知識獲取。
科大訊飛進一步升級星火語音大模型,首發多情感超擬人合成,情緒表達的可感知度達到 85% 以上,對高興、抱歉、安慰、撒嬌、困惑等語氣表達更加生動,可以滿足用戶在各種場景下的自我減壓、釋放情緒等需求,並推出一句話聲音復刻功能。
認知大模型的出現,讓自然語言處理類任務的上限大幅提升,結合大語言模型更精準的語義理解和更精細的描述能力,語音各類任務也能快速突破效果的上限,未來的人機交互將更便捷、更智能、更人性化。