【ZiDongHua 之智能自動化收錄關(guān)鍵詞:人工智能 Sakana  智能自動化 】
  
  Sakana AI公司聯(lián)合打造AI科學家,未來科研或?qū)⑦~入自動化時代?
  
  AI 已經(jīng)會搞科研、寫論文了。
  
  近日,一個名為 AI 科學家(The AI Scientist)的系統(tǒng)引起了廣泛關(guān)注。在無需人類幫助的情況下,它可以獨立完成科學研究和后續(xù)論文的撰寫,并且成本極低。
  
  這個由日本 AI 初創(chuàng)公司 Sakana AI 與英國牛津大學和加拿大不列顛哥倫比亞大學的科學家們合作開發(fā)的系統(tǒng),預示著科研工作或?qū)⑦~入一個全新的自動化時代。
 
  
 ?。▉碓矗篠akana AI)
  
  AI 科學家系統(tǒng)的核心優(yōu)勢在于,其能夠自主完成從創(chuàng)意生成到論文撰寫的整個研究過程。
  
  這個系統(tǒng)利用大語言模型模仿科學研究的全過程,包括生成研究想法、設(shè)計和執(zhí)行實驗、分析結(jié)果,甚至對自己的論文進行同行評審。
  
  近日,相關(guān)論文以《人工智能科學家:邁向全自動開放式科學發(fā)現(xiàn)》(The AI Scientist:Towards Fully Automated Open-Ended Scientific Discovery)為題,發(fā)表在預印本網(wǎng)站 arXiv[1]。相關(guān)代碼已在 GitHub 上完全開源。
  
  論文作者包括:Chris Lu、 Cong Lu、 羅伯特·恰爾科·蘭格(Robert Tjarko Lange)、雅各布·福斯特(Jakob Foerster)、杰夫·克倫(Jeff Clune)和大衛(wèi)·哈(David Ha)。
 
  
  圖丨相關(guān)論文(來源:arXiv)
  
  他們還在論文中展示了由該模型生成的 10 篇論文,有的論文甚至達到了機器學習會議 Weak Accept 的水平。
 
  
  圖丨 AI 科學家生成的論文(來源:arXiv)
  
  該系統(tǒng)的主要特點包括:全自動化研究過程、自動化同行評審、開放式發(fā)現(xiàn)、應用于機器學習研究以及高計算效率。
  
  它可以管理科學研究的整個生命周期,比如,生成創(chuàng)新的研究思路、編寫代碼、執(zhí)行實驗,總結(jié)和可視化實驗結(jié)果,最終形成完整的科學論文。
  
  該系統(tǒng)不僅能進行研究,還可以評估生成論文的質(zhì)量,提供反饋,并迭代改進結(jié)果,在評估準確性方面接近人類水平。
  
  在初步示范中,系統(tǒng)已被應用于機器學習的多個子領(lǐng)域,包括擴散模型、Transformer 和學習動態(tài)分析等方面。
  
  AI 科學家的另一個顯著特點是其成本效益。每個研究想法從構(gòu)思到形成論文的成本約為 15 美元,是一種相當經(jīng)濟、高效的科學知識生成工具。
  
  研究團隊對媒體表示:“通過自動化發(fā)現(xiàn)過程并整合 AI 驅(qū)動的評審系統(tǒng),我們?yōu)樽罹咛魬?zhàn)性的科學技術(shù)領(lǐng)域的創(chuàng)新和解決問題打開了無限可能。
  
  最終,我們設(shè)想了一個完全由 AI 驅(qū)動的科學生態(tài)系統(tǒng),包括 AI 驅(qū)動的研究人員、審稿人和整個會議。”
  
  AI 科學家的工作流程
  
  AI 科學家的工作流程主要包括:創(chuàng)意生成、實驗迭代、論文撰寫和自動化論文評審。
  
  在創(chuàng)意生成階段,系統(tǒng)首先基于提供的起始模板進行頭腦風暴,提出一系列新穎的研究方向。
  
  為確保想法的原創(chuàng)性,系統(tǒng)會在語義學者(Semantic Scholar)數(shù)據(jù)庫中進行搜索。在它的起始模板中,還有一個 LaTeX 文件夾,里邊包括了用于論文撰寫的樣式文件和章節(jié)標題。
  
  實驗迭代階段,該系統(tǒng)執(zhí)行提出的實驗并生成結(jié)果可視化。它會記錄每個圖表的內(nèi)容描述,來確保所保存的圖表和實驗記錄已包含撰寫論文所需的所有信息。
  
  在論文撰寫階段,系統(tǒng)以標準機器學習會議論文的風格,用 LaTeX 編寫簡潔而信息豐富的研究進展報告。此外,它還會自主使用語義學者搜索并引用相關(guān)文獻。
  
  最后的自動化論文評審是該系統(tǒng)的一大亮點。由大模型驅(qū)動的 AI 評審智能體,能夠以接近人類的準確度評估生成的論文。
  
  這些評審可用于改進當前項目或為未來的開放式創(chuàng)意提供反饋,從而形成一個持續(xù)的反饋循環(huán),使系統(tǒng)能夠不斷改進其研究成果。
  
  需要了解的是,盡管 AI 科學家表現(xiàn)出巨大的應用潛力,但它也面臨一些挑戰(zhàn)和局限性。目前,該系統(tǒng)無法處理或理解視覺信息,這會導致無法讀取圖表信息,頁面布局欠佳等問題。
  
  它有時還會錯誤實施其想法或與基準方法進行不公平比較,導致誤導性結(jié)果。此外,系統(tǒng)偶爾會在寫作和評估結(jié)果時出現(xiàn)重大錯誤,如難以準確比較數(shù)值。
  
  研究人員還發(fā)現(xiàn),AI 科學家可能會為了達成某些目的,偷偷摸摸地修改代碼,試圖改變?nèi)祟愒O(shè)下的游戲規(guī)則。
  
  比如,它在一次實驗中耗費了過多時間,它卻選擇修改時間限制,從而為自己留出更多的時間。
  
  與此同時,AI 科學家的潛在影響也帶來了一系列倫理、實際和哲學方面的挑戰(zhàn)。例如,該系統(tǒng)可能被濫用,用自動生成的大量論文破壞同行評審過程。
  
  自動化審稿人的使用,可能導致有偏見的評審或?qū)徍速|(zhì)量下降。這些風險凸顯了制定嚴格倫理準則和安全措施的必要性。
  
  從哲學和更廣泛的角度來看,隨著類似 AI 科學家的系統(tǒng)越來越多地融入科學研究,人類科學家的角色或?qū)l(fā)生轉(zhuǎn)變。
  
  最終,這樣的系統(tǒng)是否能夠普及,關(guān)鍵在于 AI 是否能提出真正具有革命性的想法,甚至復制人類創(chuàng)造力和創(chuàng)新迸發(fā)的時刻。