奧特曼熱捧華人AI製藥公司獲3.72億美元融資;李開復稱若AI取代工作,可以代言生髮廣告;AGI或使全球GDP翻倍丨AI情報局

融資快報

Formation Bio宣佈完成3.72 億美元D輪融資:Formation Bio(原名爲TrialSpark)由華人Benjamine Liu和Linhao Zhang共同創立,是一家專注於將人工智能應用於藥物臨牀試驗的創業公司。本輪融資由Andreessen Horowitz 領投,老股東賽諾菲、紅杉資本、Thrive、Emerson Collective、Lachy Groom,新投資SV Angel Growth和FPV Ventures等共同參投。

Hebbia獲得近1億美元B輪融資:Hebbia是一家使用生成式AI搜索大型文檔並返回答案的初創公司,本輪融資對該公司的估值在 7 億至 8 億美元之間,由 Andreessen Horowitz 領投。

吳恩達計劃爲其AI基金繼續籌集1.2億美元:AI基金在公司生命週期的種子和A輪階段提供資金,幫助團隊在隱秘情況下工作,並連接Ng的專業網絡。AI Venture Fund II的規模將比第一輪小。

不停科技獲得獲近億元A+輪融資:不停科技是一家2B美食機器人RaaS服務商,主攻AI數字廚房解決方案,打造的線上機器人Botin Bota,可以實時分析餐飲門店的運營數據,爲其精細化運營提供指導意見。本次由華山資本領投,老股東高秉強教授生態圈基金未來科技參與投資,老股東李澤湘教授旗下清水灣基金、甘潔教授旗下知行一號基金連續三輪繼續超額加持。星辰資本擔任後續融資獨家財務顧問。本輪資金將用於產品研發及全球交付。

酶有科技獲數千萬元天使輪融資:酶有科技用AI技術降低酶法DNA合成成本。本輪融資由線性資本領投,奇績創壇和旦恩資本跟投。

碩橙科技獲數千萬元C1輪融資:碩橙科技專注通過全感知智能硬件、AI算法,提供設備預測性維護、智能運維等智能製造服務。 投資方爲彬復資本。

瑞馳信息獲得戰略投資:瑞馳信息是一家專注於研發安卓雲、AI邊緣計算、雲基礎設施等產品及解決方案的高新技術企業,基於ARM技術與獨特的軟硬件架構設計,爲客戶提供以雲計算和大數據爲核心的產品及解決方案服務。

Constructor獲得B輪融資:Constructor是一家美國電商服務提供商,致力於爲電子商務行業提供AI搜索軟件、產品發現平臺、推薦與建議。

Ora完成2000萬美元融資:Ora Lab是一家AI驅動的區塊鏈項目提供商,旨在通過其“鏈上AI預言機”將AI融入去中心化應用程序。Polychain、HF0和Hashkey Capital等參投。 新資金將使該項目“繼續開發其技術和基礎設施,以標記人工智能模型,並將分散的人工智能引入以太坊生態系統”。

MagicSchool AI 獲 1500 萬美元 A 輪融資:MagicSchool AI是一家AI教育技術平臺。本輪融資由Bain Capital Ventures領投,其他投資者包括Adobe Ventures和Common Sense Media、Replit創始人Amjad Masad、Clever聯合創始人Tyler Bosmeny和Rafael Garcia,以及OutSchool聯合創始人Amir Nathoo。

中科盈騰完成數百萬元天使輪融資:中科盈騰是一家AI技術研發商,主要從事AI基礎軟件開發、人工智能應用軟件開發、計算機系統服務等業務。本次融資由北京積露領投,其他多家投資機構跟投。此次融資資金將主要用於AI技術研發、場景應用深化及市場拓展。

(歡迎添加微信AIyanxishe2,瞭解更多AIGC、融資情況,與志同道合的朋友一同暢聊時新AI產品)

國內情報:

百度文心大模型 4.0 Turbo 發佈,文心一言用戶規模達 3 億人:

百度 WAVE SUMMIT 深度學習開發者大會上,百度首席技術官王海峰宣佈了文心大模型 4.0 Turbo 的發佈。這個新版本顯著提升了應答速度和檢索能力。同時文心一言的用戶規模已經達到了3億人,單日最高調用次數達到了5億次,這得益於飛槳平臺的強大支撐。

百度推出智能代碼助手“文心快碼”,基於文心大模型,實現“幫你想、幫你寫、幫你改”的場景應用,加速開發速度、提升業務迭代速度。百度內部上萬工程師中有 80%的人已經在使用文心快碼,代碼採用率達到了 44%。文心快碼支持 100 多種主流編程語言及多種 IDE,提供了四種版本,百度承諾不會存儲或分析用戶代碼,確保了數據安全,並根據隱私協議,確保用戶的代碼片段不會被用於其他用戶的建議代碼。

華爲攜手廣東省氣象局推進AI氣象應用,發佈星河AI網絡解決方案引領Net5.5G智能雲網:

華爲與廣東省氣象局簽署深化合作框架協議,旨在通過共同推動高性能計算和人工智能等現代技術在氣象領域的應用。

另外,華爲發佈了面向 Net5.5G 智能雲網的星河 AI 網絡解決方案。該方案針對網絡運維的複雜性、業務體驗保障以及 AI 時代下的網絡安全防護等三大難題,引入 AI 技術賦能網絡,實現 L4 自動駕駛網絡和高智慧泛在安全防護。

知乎發佈全新AI產品“知乎直答”,支持提問、搜索等功能:

“知乎直答”是知乎 AI 搜索功能的產品化,已上線 PC 端。該產品立足於知乎創作者的問答數據,能提供“簡略”和“深入”兩種答案生成結果,並支持“找內容”和“找人”,之後將推進 App 開發和多模態能力引入,探索對外合作。

硅基智能開源AI數字人交互平臺Duix,可快速創建部署逼真數字人:

該平臺旨在幫助開發者簡化智能數字人的創建和部署過程,提供了豐富的工具和支持,無需技術團隊的介入,即可在各種終端設備上部署數字人。用戶可以下載多種數字人模型,適用於不同行業需求,並且該項目已開源,便於開發者進行二次開發和個性化定製。功能包括語音輸入、語音輸出、實時交互和多終端支持等。此外,平臺還提供虛擬助理服務,可應用於乘客服務、自動化客戶服務、智能諮詢服務、虛擬主持人等場景,提升用戶體驗和服務效率。

智源張宏江稱AI系統永遠不應該欺騙人類:

北京智源研究院的創始人和首任理事長張宏江談到國際合作在 AI 保障方面的重要性,以及中國 AI 技術面臨的機遇和挑戰時表示:“人工智能系統永遠不應該自我複製和改進。這條紅線非常重要。當系統有能力自我複製、自我改進時,它就會失控。第二是欺騙。人工智能系統不應該具有欺騙人類的能力。”

李開復稱如果AI取代了我的工作,我可以代言生髮劑的廣告:

零一萬物CEO、創新工場董事長李開復表示,這麼多年他的頭髮沒有變少,如果AI取代了他的工作,他可以代言生髮劑的廣告。“喬布斯說人生不要做職業規劃,世界改變的太快了,只要在每一個重要決定的時候follow your heart。而這個人工智能的時代已經是我渴望了四十多年的時代,當我26歲拿到博士的時候沒想到62歲的時候會做這麼大膽的事情,那是因爲時代要到來了。我認爲AI是人類最終對自己的理解。”李開復稱,AI智能有望明年趕超博士,奇點將於數年後爆發。

國際情報:

OpenAI CriticGPT代碼審查模型發佈,模型年化收入超10億美元,與《時代》雜誌達成戰略合作:

OpenAI 推出 CriticGPT 新模型,它基於 GPT-4 構建,專門設計用來審查和識別大型語言模型(例如 ChatGPT)生成的代碼中的錯誤。CriticGPT 利用人類反饋強化學習技術,顯著提高了代碼審查的準確性和效率。不僅能識別出 AI 輸出中的潛在問題,還能提供解釋,幫助開發者提升代碼的質量和安全性。

在商業方面,根據OpenAI和微軟最新內部數據,OpenAI 通過出售對其 AI 模型的訪問權限,截至3月已經實現了約10億美元的年化收入。這一成績標誌着 OpenAI 在 AI 模型銷售方面超越了科技巨頭微軟,後者的 Azure OpenAI Service 直到最近才達到相同的年化收入水平。

此外,OpenAI 還與全球知名的《時代》雜誌達成了多年內容授權協議。OpenAI 將能夠訪問《時代》雜誌過去100多年的檔案和文章,這些內容將用於訓練 OpenAI 的 AI 模型,如 ChatGPT。

Perplexity被指引用錯誤信息,涉嫌違規抓取網站數據引亞馬遜AWS調查:

初創公司GPTZero發現Perplexity鏈接的來源中有越來越多是AI生成的,甚至會使用這些來源中的過時和不正確信息。Perplexity聲稱其答案僅來自“可靠來源”。另外亞馬遜 AWS 正在調查 Perplexity AI,因其被指控未經許可使用 AWS 服務器託管的爬蟲程序抓取數據,並涉嫌違反 robots.txt 排除協議。

亞馬遜聘請Adept創始人,加碼佈局AGI研發:

雙方達成技術授權協議,Adept 的聯合創始人及部分團隊成員將加入亞馬遜。Adept 專注於開發能夠執行各種軟件任務的人工智能 “代理”,其技術將支持亞馬遜在生成式人工智能領域的擴展。Adept 並未關閉業務。工程部門負責人 Zach Brock 將接任CEO,公司將重新聚焦於“啓用代理人智能的解決方案”。聯合創始人兼首席執行官David Luan 將在前 Alexa 負責人、現領導新 AGI 團隊的 Rohit Prasad 的領導下工作。據悉,Adept 已籌集超過 4.15 億美元資金,估值約 10 億美元。

Rain AI 招募蘋果芯片專家,加速AI芯片研發:

美國芯片初創公司Rain AI挖來曾在蘋果效力17年的芯片高管Jean Didier Allegrucci。他將擔任公司的硬件工程主管,領導下一代突破性節能芯片的開發。三週前,Rain AI剛招聘了Meta ASIC架構團隊的首席架構師Amin Firoozshahian。

菲爾茲獎得主親測 GPT-4o,經典過河難題破解失敗:

菲爾茲獎得主 Timothy Gowers 揭示了大型語言模型在處理經典的「狼 - 山羊 - 捲心菜」過河難題時的失誤。Gowers 提出了「廢話比率」作爲新的基準,指出 GPT-4o 在最簡單的題目上的錯誤,Claude 3.5 也無法倖免。該現象引發了對大型語言模型是否真的能夠推理和規劃的質疑。Gowers 還指出,目前評估大型語言模型的方法存在缺陷,提出了交互式評估平臺 CheckMate 和評分數據集 MathConverse。儘管大型語言模型在各種基準測試上表現出色,但在實際的數學和推理問題上卻出現了失誤。

谷歌DeepMind開源AI模型 Gemma 2,單 A100 / H100 GPU 可運行:

Gemma 2有90億(9B)和270億(27B)兩種參數規模可用。27B模型訓練了13T tokens,性能與兩倍規模的主流模型相當;9B是8T tokens,超越了 Llama 3 8B 等,都擁有8192上下文窗口,可在Google AI Studio中使用。Gemma 2 的架構設計能夠在各種硬件上快速運行,包括谷歌雲 TPU 主機、英偉達 A100 或 H100 GPU。

26億參數(2.6B)模型將很快發佈,小到可以在手機本地運行。

開發者狂喜!Meta最新發布的LLM Compiler,實現77%自動調優效率:

這是一個基於大語言模型的編譯器優化工具。該工具通過在包含 5460 億個標記的 LLVM-IR 和彙編代碼的語料庫上訓練,增強了對編譯器中間表示、彙編語言和優化技術的理解。在測試中,LLM Compiler 的優化潛力達到了自動調優搜索的 77%,顯著減少了編譯時間並提高了代碼效率。在反彙編方面,LLM Compiler 能夠將 x86_64 和 ARM 彙編代碼轉換回 LLVM-IR,往返反彙編的成功率爲 45%。

Resemble AI 發佈下一代深度僞造檢測模型 Detect-2B,準確率高達94%:

該模型採用了一系列預訓練的子模型和微調技術,能夠對音頻片段進行深入檢查,以確定其是否爲 AI 生成。Detect-2B 能夠以至少 93% 的準確率正確檢測六種不同語言的深度僞造音頻,並且能夠預測音頻的 AI 生成概率,無需在每次收聽新片段時重新訓練模型。Detect-2B 的子模型由一個凍結的音頻表示模型和插入關鍵層的自適應模塊組成,這些模塊能夠識別錄音中留下的意外聲音,以此區分真實音頻和 AI 生成的音頻。

OpenAI CEO 奧特曼預測AGI或在十年內實現全球 GDP 翻倍:

Sam Altman強調, AI 的發展並非一蹴而就,而是一個漸進的過程。儘管 ChatGPT 的推出引起了廣泛關注,但大多數應用程序還未發生根本性變化。未來幾年,隨着更多應用程序在 AI 模型基礎上構建,變化將更加顯著。Altman 預測, AGI 可能會使全球 GDP 翻倍,這將成爲巨大的生產力驅動因素。他相信,隨着人們逐漸採用這些工具, AI 將帶來前所未有的經濟和社會效益。

微軟AI高管稱開放網絡上的內容可自由複製,但也有灰色地帶:

當被問及“人工智能公司是否實際上竊取了全球知識產權”時,微軟AI首席執行官穆斯塔法·蘇萊曼回答:“我認爲,對於開放網絡上已有的內容,自90年代以來,這些內容的社會契約一直是合理使用。任何人都可以複製、重新創作……這就是‘免費軟件’,這就是我的理解。”“還有一種單獨的情況是,當一個網站、出版商或新聞機構明確表示,除了爲讓其他人找到這些內容而對其進行索引外,不得出於任何其他原因抓取或爬取其內容。這是一個灰色地帶,我認爲它會在法院中逐漸得到解決。”

力挺開源!扎克伯格抨擊閉源競爭對手正試圖“創造上帝”:

扎克伯格深信人工智能最終不會“只有一個”,他強調了開源的價值——即把人工智能工具交到更多人手中。他表示:“我不認爲AI技術是一種應該被私藏起來的東西——那樣就只有一家公司可以用它來打造他們想要的某個中心化、單一化的產品。”扎克伯格稱,在AI發展過程中有必要創造出許多不同的人工智能,以反映人們的不同興趣。在談到那些建立閉源AI平臺的公司時,他不認爲這是爲人們創造最佳體驗的方式。

比爾・蓋茨喊話環保人士,不要“過分擔心”AI 用電問題:

針對當前 AI 系統導致能源消耗加快的問題,比爾・蓋茨發起“辯護”,他認爲 AI 技術最終將會“抵消”其耗電量,不要“過分擔心”運行新一代 AI 系統所需的巨大電力,因爲微軟等大型科技公司競相投資數百億美元建設大型新數據中心。

更多國際情報:

全美 TOP 5 機器學習博士發帖稱實驗室沒有 H100 GPU :學術界 GPU 資源不平等,許多研究者需要爭搶計算資源。普林斯頓和哈佛等高校擁有大量的 H100 GPU,而其他機構則可能一盞燈也沒有。同一個實驗室的博士,甚至時常會出現需要爭搶GPU的情況。

首個類 Sora 開源復現方案,可在英偉達 RTX 3090 顯卡上 AI 生成視頻:Open-Sora 可以在英偉達 RTX 3090 GPU 上基於文本生成視頻,最高可以生成 240P 分辨率、時長最長 4 秒的視頻。生成 2 秒視頻大約需要 30 秒,4 秒視頻大約需要 60 秒。對於 424x240 的輸出來說,4 秒鐘的視頻輸出逼近 1 千萬像素。

微軟對OpenAI 價值 130 億美元的投資協議面臨歐盟審查:監管機構將更多地詢問微軟的競爭對手和客戶,瞭解微軟與OpenAI簽訂的排他性條款,以及這些條款是否可能對競爭產生負面影響。

AI 幫助大學生獲取更高分,且難以被發現:Scarfe 教授團隊使用 GPT-4 生成考試答案,並代表 33 名假學生提交。在不知情的情況下進行評分,AI 生成的本科心理學課業答案在 94% 的情況下未被發現,而且平均得分比學生真實得分高。

配備 GPT-4o 和攝像頭的智能眼鏡來了:Solos 將推出一款名爲 AirGo Vision 的智能眼鏡,該眼鏡配備了 OpenAI 的 GPT-4o AI 模型和攝像頭,能夠識別物體並回答用戶關於所看物品的問題,同時兼容 Google Gemini 和 Anthropic 的 Claude AI 模型,並且有 LED 通知燈,目前尚未公佈具體價格和發佈日期。

奧迪攜手ChatGPT,爲200萬輛汽車注入智能語音助手:這項服務預計將於7月推出。車主將能夠通過自然語言與汽車進行互動,實現對信息娛樂、導航和空調系統的語音控制。ChatGPT甚至能夠回答一般知識性問題。

Product Hunt 熱榜,AI 智能化 API 客戶端ApyHub Fusion

ApyHub Fusion是一款融合AI技術的創新型API客戶端,旨在徹底改變API開發流程。平臺借鑑了Notion的直觀界面設計,將API的構建、測試和文檔化過程整合到一個智能化的工作空間中。

Fusion的核心優勢在於其AI驅動的智能化功能,能夠預測用戶需求並優化工作流程。它支持實時團隊協作,簡化了API開發的複雜性。該平臺的模塊化測試系統和無縫的文檔集成功能,大大提高了開發效率。Fusion兼容主流API客戶端的數據導入,支持多平臺使用,包括MacOS、Windows和Web。

?https://apyhub.com/product/fusion?ref=producthunt

GitHub Trending 熱榜,AI短視頻生成MoneyPrinterTurbo

MoneyPrinterTurbo是一個基於AI大模型的開源項目,旨在自動化短視頻生成過程。該工具支持通過輸入主題或關鍵詞一鍵生成高清短視頻,包括視頻文案、素材、字幕和背景音樂。

項目提供Web界面和API接口,支持多種語音合成服務和字幕生成模式。它基於MoneyPrinter項目重構,增加了新功能如視頻轉場效果和長度選項。可通過Docker或手動方式部署,也可使用一鍵啓動包快速體驗。

?https://github.com/harry0703/MoneyPrinterTurbo

開發者推薦,Glif作者創建meme梗圖生成器風靡推特:

Glif創始人fabian用幾分鐘搭建了一個meme梗圖生成器,能快速生成幽默、尖銳的梗圖,成爲新一代"嘴替"。AI改造後的梗圖展現全新創意表達形式,用戶通過Glif快速創建個性化梗圖。

?https://glif.app/@Hanwei/glifs/clxv3atsq00009wq1iwsmw1ks/source

前沿技術

1.Visual Sketchpad :AI 視覺推理能力

華盛頓大學、Allen AI 研究所和賓夕法尼亞大學聯合推出 Visual Sketchpad,這是一個爲多模態語言模型賦予視覺推理能力的創新框架。該項目的核心是將多模態語言模型與視覺繪圖能力結合,使其能夠生成輔助草圖,從而在解決幾何問題、計算機視覺任務等視覺推理任務時進行更有效的思考和解決問題。與之前的文本鏈式推理和工具使用範式不同,Visual Sketchpad 允許模型繪製線條、框、標記等,更接近人類的草圖方式,有助於推理過程。

?https://visualsketchpad.github.io/

2.DigiRL 設備控制 AI 代理訓練方法

加州大學伯克利分校等機構研究人員推出 DigiRL,這是一種創新的自主強化學習方法,旨在訓練真實環境中的設備控制 AI 代理。該技術通過兩階段微調預訓練的視覺語言模型,顯著提升了 AI 在複雜圖形用戶界面控制任務中的表現。核心亮點包括:

• 採用離線強化學習初始化模型,隨後進行離線到在線的強化學習

• 構建可擴展、並行化的 Android 學習環境,配備 VLM 評估器

• 在 Android-in-the-Wild (AitW) 數據集上,1.5B 參數的 VLM 經 DigiRL 訓練後,成功率從 17.7% 提升至 67.2%

• 大幅超越現有最佳方法,包括使用 GPT-4V 的 AppAgent (8.3%) 和 17B 參數的 CogAgent (14.4%)

?https://digirl-agent.github.io/

3.SciPhi-AI推出了開源RAG引擎R2R

R2R是一個旨在連接本地LLM實驗和可擴展的、生產就緒的檢索增強生成的工具。它爲開發者提供了一個全面且最新的RAG系統,圍繞着RESTful API構建,方便易用。R2R支持多模態輸入,包括文本、文件、圖像、音頻等,同時還提供了混合搜索、圖形RAG、應用程序管理、客戶端-服務器交互、可配置性、可擴展性等功能。

?https://github.com/SciPhi-AI/R2R?utm_source=uwl.me

4. Director3D:文本到3D生成技術

廈門大學,上海人工智能實驗室推出Director3D,這是一個強大的開放式文本到3D生成框架,旨在生成真實世界的3D場景和相應的攝像機軌跡。通過使用Trajectory Diffusion Transformer建模文本描述的攝像機軌跡分佈,以及使用Gaussian-driven Multi-view Latent Diffusion Model建模給定攝像機軌跡和文本的圖像序列分佈,Director3D能夠產生與文本描述一致的高質量3D場景。此外,Director3D通過引入SDS++損失,進一步優化和細化3D場景的生成。

?https://imlixinyang.github.io/director3d-page/?utm_source=uwl.me

5.StreamingT2V: AI長視頻生成技術新突破

俄勒岡州佐治亞理工學院和UIUC推出StreamingT2V,開源項目最新版本支持高分辨率長圖像到視頻的生成,爲用戶提供24fps和12fps兩種幀率選擇。這項技術利用條件注意力模塊和外觀保持模塊,實現了視頻片段間的一致性和長期場景特徵保持,能夠生成長達2分鐘的高質量視頻。

該項目採用隨機混合方法,使視頻增強器可在自迴歸過程中持續應用,從而產生無限長度的視頻。實驗表明,StreamingT2V在生成高運動量視頻方面表現優異,解決了現有方法容易導致視頻停滯的問題。這一技術的泛化能力強,不受特定文本到視頻模型限制。

?https://streamingt2v.github.io/

大牛洞見

Andrej Karpathy演講:從學術圈到社會重塑

UC Berkeley黑客鬆活動上,Andrej Karpathy指出,AI領域正經歷前所未有的變革,從小規模學術討論發展到影響整個社會經濟格局。Karpathy強調,大型語言模型正成爲新的計算核心,類似於傳統CPU的角色。他預測AI技術將從數字領域擴展到物理世界,深刻影響基礎設施。未來可能出現多個AI實體協作完成任務,自動化大量工作。Karpathy還借鑑科幻電影《Her》和《I, Robot》,探討了AI的潛在發展方向及其帶來的倫理和社會挑戰。

? https://www.youtube.com/watch?v=Tmrq914yLck

敬請期待明日的最新動態!

雷峰網