鉅亨網編譯陳韋廷 2025-05-02 17:30
全球生醫界大震撼!全球首個AI科學家天團出道 四大AI智慧體讓科研效率提升數百倍(圖取自FutureHouse官網)
全球首個公開可用的 AI 科學家「天團」周四 (1 日) 正式亮相,由谷(
GOOGL-US) 前執行長 Eric Schmidt 投資的非營利組織 FutureHouse 推出四款專為科學研究設計的 AI 智慧體 Crow、Falcon、Owl 和 Phoenix。這些 AI 在文獻檢索、實驗設計、矛盾檢測等任務中展現出超越人類博士的科學研究能力,引發全球科學界震動。
中國 AI 媒體《新智元》報導,FutureHouse 測試數據顯示,該組織的 AI 科學家在 LitQA 基準測試中的精確度和準確率已超過 GPT-4.5、Claude-3.7 等頂級模型。更關鍵的是,它們能直接存取完整科學文獻全文,而非僅依賴摘要,避免了傳統搜尋工具的資訊遺漏問題。透過評估來源質量,AI 科學家能有效過濾低品質論文以及流行但不可靠的資訊來源。
FutureHouse 執行長 Sam Rodriques 說:「我們的 AI 科學家智慧體,執行起科學任務來已經完勝人類!透過把它們串聯起來,我們已經很快有了全新的生物學發現。」
在具體應用中,這套 AI 系統展現出驚人的科學研究加速能力。以多囊性卵巢症候群 (PCOS) 研究為例,使用者僅提供「尋找非荷爾蒙治療方法」的初步需求,AI 便自主完成從文獻綜述到實驗設計的完整閉環;Falcon 智能體透過深度搜尋梳理出 19 篇關鍵論文,Crow 定位到關鍵基因表現關聯,Phoenix 最終產生三種新型化合物建議。整個過程耗時僅數分鐘,而傳統文獻研究通常需要數週。
FutureHouse 共同創辦人 Andrew White 說:「我們建構的是真正的科學第一平台。該組織團隊歷時一年完成三大里程碑,先在 2024 年 6 月發布 Lab-Bench 基準測試,同年 9 月推出文獻問答系統 PaperQA2,12 月在分子克隆和文獻研究任務中超越生物學專家 20 個準確率點。目前平台已整合 1.7 萬篇自動產生的人類編碼基因維基百科條目,驗證了系統的可行性。
與傳統 AI 相比,FutureHouse 的突破在於三大核心技術;一是透過分散式資料庫實現文獻全文存取;二是獨特的推理漏斗機制,從 19 篇論文中自動提煉關鍵證據;三是完全透明的推理軌跡展示,每個結論都可追溯到原始文獻出處。使用者甚至可以直接點擊查看 AI 選擇該文獻的具體原因。
在平台擴展性方面,FutureHouse 提供網頁端介面和 API 存取服務,讓研究人員將 AI 科學家無縫整合到現有工作流程。這種設計尤其解決了生物醫學研究者的痛點──許多科學家雖精通專業領域,卻缺乏工程能力維護複雜 AI 系統。
這四個 AI 智慧體對產業的影響正在顯現。在化學領域,Phoenix 已能自主完成目標蛋白結合物篩選,綜合考量溶解度、官能基、新穎性等複雜參數。在材料科學領域,系統透過分析矛盾文獻精準定位研究空白,顯著縮短創新週期。
業內人士預測,未來 1-2 年內,85% 的基礎科研桌面工作將被 AI 重建。
儘管前景光明,質疑聲依然存在。有網友指出,目前 AI 系統仍無法自主完成複雜實驗驗證,且資料來源合法性存疑。FutureHouse 則回應正在改進資料授權機制,首批三個生物醫學智能體已通過倫理審查。
FutureHouse 團隊強調,AI 科學家的定位始終是科研協作者,而非替代者。
隨著 API 介面的開放,全球科研生態正悄悄變革,杭州瑞普晨創的 RGB-5088 胰島細胞注射液等創新計畫已開始接入 AI 系統,美國 Vertex 公司的 VX-880 療法研發團隊也表示,正在評估 AI 協作可能性。這場由 AI 引發的科學研究典範革命,可能將重塑人類探索未知的方式。