亞馬遜雲科技陳曉建:沒有一個模型適用於所有場景

4月8日報道,近日,2024亞馬遜雲科技舉辦生成式AI溝通會,亞馬遜雲科技大中華區產品部總經理陳曉建等專家就生成式AI的相關問題與媒體深度交流。

陳曉建認爲,儘管大模型非常重要,但僅靠大模型遠遠不夠,企業需要一系列周邊的能力來正確、合理、安全、高效地使用大模型,這就是亞馬遜雲科技一系列產品所提供的價值所在。

據介紹,亞馬遜雲科技在生成式AI領域提供三層技術棧,從最底層的高性能基礎設施,到中間層提供最廣泛的基礎模型選擇,這些模型來自多個提供商,客戶可以在此基礎上定製這些模型,同時保持他們自己的數據私有和安全,並與其他在亞馬遜雲科技上的工作負載無縫集成。最上層的是應用GenAI技術的開箱即用的雲服務。

亞馬遜雲科技認爲“沒有一個模型可以適用於所有業務場景”,所以AmazonBedrock提供各種基礎模型供客戶選擇:既有知名的開源模型,如StableDiffusion XL、Llama、Mistral7B和Mixtral8*7B,也有如AnthropicClaude 3、AI21labsJurassic、CohereCommand、AmazonTitan等非開源模型。

值得一提的是,亞馬遜和Anthropic在生成式AI領域進行廣泛的深度合作,Anthropic將亞馬遜雲科技作爲首選雲服務提供商,此前,亞馬遜對Anthropic已完成40億美元投資。

具體來講,Anthropic在AmazonBedrock上提供的Claude3系列模型是全球最領先的大模型之一,共包含三個模型:具有幾乎即時響應能力且最緊湊的Claude3 Haiku;在技能與速度之間達到理想平衡的Claude3 Sonnet;以及爲處理高度複雜任務設計的最智能模型Claude3 Opus。

通過現場演示,我們瞭解到,Claude3現已具備多模態能力——Claude3可以接收基於圖像的輸入,能力與其他前沿模型大致相同,並且延遲低於其他多模態模型(尤其是Claude3 Haiku)。Claude3能夠降低幻覺,提升回答準確率,比如,在處理挑戰性開放問題(100QHard)上準確性明顯提升,並且減少錯誤答案。

與此同時,Claude3系列模型均提供200K超長上下文準確召回,針對某些特殊場景,還會開放支持1Mtoken的上下文窗口。

在場景方面,Claude3系列模型在內容續寫、代碼輔助、電商商品描述撰寫、長文本知識召回總結方面表現優秀。“大模型第一批真正受益的用戶是什麼呢?就是代碼編寫和程序員。程序員本身具備更容易理解大模型的能力,像AmazonCodeWishperer,在亞馬遜內部得到了廣泛的使用,更不用提外面海量的編程員的羣體了。”陳曉建談到。

他還介紹了AmazonBedrock如何把大模型的能力,比如Claude3的能力提供給用戶,總結起來是4點,首先是知識庫功能KnowledgeBases for Amazon Bedrock,爲基礎模型和Agent提供來自企業私人數據源的上下文信息,用於檢索增強生成(RAG),以提供更相關、更準確和更個性化的響應。其二,是代理功能Agentsfor Amazon Bedrock,使生成式AI應用能夠使用自然語言來執行多步驟的業務任務。其三,實現負責任AI的Guardrailsfor Amazon Bedrock,允許客戶根據應用程序特定要求和負責任的AI策略來管理用戶體驗。最後,合規,AmazonBedrock是基於全面的數據保護和隱私保護構建的,傳輸中數據和靜態數據都會被加密,數據不會與模型提供者共享,也不會用於改進基礎模型。

在對話中,談及應用創新,陳曉建表示,Midjourney是生成式AI的現象級應用,是文生圖賽道最具競爭力的選手。2023年2月份,它就在Discord上擁有超千萬的社區成員。在去年9月,Midjourney就成功實現年盈利2億美元。這些成功的生成式AI初創企業在做生成式AI模型的時候,非常多的使用了雲計算的相關資源,去幫助他們快速地把業務推向終端用戶。這一點上,像亞馬遜雲科技這樣的雲計算提供商給這些初創企業提供了非常多的安全和彈性的資源,幫助他儘快將業務從燒錢階段到找到自己的運營模式,快速找到自己的客戶羣。(定西)