Anthropic 的 Claude:使用指南與競品對比全解析

儘管它可能不像谷歌、微軟和 OpenAI 的競品那樣佔據衆多頭條,但 Anthropic 的 Claude 並不比其前沿模型同行遜色。

事實上,最新版本 Claude 3.5 Sonnet 在衆多行業基準測試中已被證實不輸給 Gemini 和 ChatGPT。在本指南中,您將瞭解 Claude 是什麼,它最擅長做什麼,以及如何充分利用這個低調但有能力的聊天機器人。

與 Gemini、Copilot 和 ChatGPT 一樣,Claude 是一個大型語言模型(LLM),它依靠算法,依據其龐大的訓練材料語料庫來預測句子中的下一個詞。

Claude 與其他模型的不同之處在於,它經過訓練和調適,以遵循 73 點的“憲法 AI”框架,旨在使 AI 的響應既有用又無害。Claude 首先通過監督學習方法進行訓練,在這種方法中,模型會針對給定的提示生成迴應,然後評估該回應與它的“憲法”的契合程度,最後對後續迴應進行修改。然後,Anthropic 並非依靠人類來進行強化學習階段,而是運用該 AI 評估數據集來訓練偏好模型,幫助微調 Claude,以始終輸出符合其憲法原則的響應。

Anthropic 於 2023 年 3 月發佈了 Claude 的首次迭代版本,並在四個月後的 2023 年 7 月迅速將其更新爲 Claude 2。這些早期版本在編碼、數學和推理能力方面相當有限。這種情況隨着 2024 年 3 月 Claude 3.0 系列——Haiku、Sonnet 和 Opus 的發佈而發生了改變。

“對於絕大多數工作負載而言,Sonnet 比 Claude 2 和 Claude 2.1 快兩倍,並且具有更高的智能水平,”Anthropic 在Claude 3 公告帖中寫道。“它在需要快速響應的任務中表現出色,如知識檢索或銷售自動化。”

Opus 佔據榜首的位置是短暫的。2024 年 6 月,Anthropic 推出了更強大的 Claude 3.5 模型。Claude 3.5 Sonnet“運行速度是 Claude 3 Opus 的兩倍,”Anthropic 當時寫道,這使其成爲“諸如對上下文敏感的客戶支持和協調多步驟工作流程等複雜任務”的理想之選。它也普遍優於 GPT-4o、Gemini 1.5 和 Meta 的 Llama-400B 模型。

十月份,Anthropic 發佈了 3.5 Sonnet 的一個略有改進的版本,稱作 Claude 3.5 Sonnet(新),同時還推出了新的 Claude 3.5 Haiku 模型。

雖然 ChatGPT 和 Gemini 被設計成能夠回答各類廣泛主題的問題,並且通過語音交互來達成,但 Claude 卻在編碼、數學和複雜推理任務上表現出衆。

Anthropic 把 Claude 的最新版本稱作其“迄今爲止最強大的視覺模型”。而且它稱 3.5 Sonnet 能夠執行各類基於視覺的任務,比如從模糊的照片中解讀文字或者解釋圖表及其他視覺內容。

Claude 也是首個在聊天對話本身之外提供專用協作空間的 LLM 聊天機器人。“The Artifacts 功能”於 2024 年 9 月初次登場,充當一個實時預覽窗口,還允許用戶創建“一個動態的工作空間,他們能夠實時查看、編輯並基於 Claude 的創作來構建,將 AI 生成的內容無縫融入他們的項目和工作流程中”,Anthropic 團隊宣稱。

OpenAI 此後也給其聊天機器人引入了類似的功能,不過目前僅對 Plus 和 Enterprise 訂閱用戶開放。

克勞德 3.5 十四行詩相較於其主要對手 ChatGPT 具有諸多優勢。例如,克勞德爲用戶提供了更大的上下文窗口(200,000 個字符對 128,000 個),使用戶能夠制定更細緻和詳細的提示。克勞德的憲法式人工智能架構意味着它被調整爲提供準確的答案,而非富有創意的答案。這個聊天機器人還能夠出色地總結研究論文,依據上傳的數據生成報告,並將複雜的數學和科學問題拆解爲易於遵循的分步說明。

雖說它或許沒法給您寫首詩,不過在生成可驗證且能重現的迴應上表現優異,特別是新推出的分析工具。 該公司把它描述成“一個內置的代碼沙箱,Claude 能夠在裡面進行復雜的數學運算、分析數據,還能在分享答案前對不同想法進行反覆琢磨。”“處理信息和運行代碼的能力意味着您會得到更準確的答案。”

另一方面,有好多其他聊天機器人能做的事兒,Claude 卻做不了。例如,Claude 沒有提供與 OpenAI 的高級語音模式相當的功能,所以您只能堅持使用文本和圖像提示。該人工智能也無法生成圖像,就像 ChatGPT 與 Dall-E 3 那樣。

Claude 的發展並非不存在自找麻煩的戲劇性情況。 Proof News 於 7 月的一份報告確鑿地指控 Anthropic(連同 Nvidia、Apple 以及 Salesforce)使用了從超過 48,000 個頻道(包含 MrBeast、Marquees Brownlee 和 Pew Die Pie)抓取的 173,536 個 YouTube 視頻字幕的數據集來訓練其大型語言模型。