對于科學智能的未來研究方向,漆遠提到了依舊要選擇具有大科學價值的領域,另外也需要在社會和產業(yè)價值之間找到平衡點,去重點突破。
隨著2024年諾貝爾物理學獎和化學獎授予了人工智能相關研究,科學智能(科學和AI深度融合)及其研究方向引發(fā)了從科學家到公眾的廣泛關注,接下來將有哪些研究重點?
在11月11日下午舉辦的“2024科學智能創(chuàng)新論壇”上,上?茖W智能研究院(下稱“上智院”)聯合復旦大學、集智科學研究中心和阿里云,共同發(fā)布了科學智能前沿觀察報告,十大前沿方向涵蓋AI for Science、Science for AI和科學智能基礎設施三個維度。
其中,AI for Science的前沿方向包括垂直領域科學大模型、融入先驗知識的AI模型、基于LLM模型的科學研究、從提出假設到自動驗證的AI科學家,以及復雜世界的多智能體建模;Science for AI的前沿方向則覆蓋了物理世界的第一性原理和科學啟發(fā)的可解釋AI新架構;科學智能基礎設施前沿方向包括合成數據和新型智能計算。展望未來,面向可信可解釋的科學世界模型和上述九個方向共同構成科學智能十大前沿。
十大前沿
上智院院長、復旦大學浩清教授漆遠在會上表示,AI與基礎科學的深度融合,將開啟AI與科學“雙螺旋引擎”共振驅動的科學研究新范式。AI for Science和Science for AI,類似DNA和RNA的雙螺旋結構,一方面,AI將成為科學研究探索的最前沿;另一方面,科學啟發(fā)的AI也將成為實現AGI的重要支撐。未來可望有更多的科學智能研究成果問鼎諾貝爾獎!鞍l(fā)布科學智能前沿觀察報告,就是希望推動和支持更多AI和基礎研究領域的科學家,深度融合無縫合作,共同探索科學智能的新未來,打造能夠自主發(fā)現復雜世界未知規(guī)律的‘AI愛因斯坦’!
為何叫雙螺旋引擎
科學智能(AI X Science)是一個新興的跨學科研究領域,其研究方向和驅動力(7.070, -0.24, -3.28%)可以表述為“雙螺旋引擎”:其一,將AI技術應用于具體領域的科學研究(AI for Science);其二,將領域學科知識用于AI算法和架構的理解和改進(Science for AI)。
隨著大量數據的快速積累和文獻的爆炸式增長,人類科學家自身的信息處理能力達到極限,甚至成為研究突破的瓶頸。而越來越多的科學研究領域在面對復雜問題的挑戰(zhàn)時也難以利用傳統(tǒng)的數學和物理方法。如何將AI運用于垂直的科學領域研究,加速科學發(fā)現,擴展科研邊界,是AI for Science的核心主題。
今年諾貝爾化學獎授予的AlphaFold2,即是AI算法用于解決科學領域重要問題的研究典范。AI for Science其他成功研究案例還包括AI可控核聚變、氣象模型等等。
不過,雖然已獲重大突破,但AI仍然面臨數據稀缺、耗能過大、解釋性較差等重大挑戰(zhàn)。而人類科學家已經積累了各個學科領域的海量知識, 如何將科學家的經驗和知識,甚至直覺和啟發(fā)式想法,轉化為AI系統(tǒng)的能力,構成了Science for AI研究的重點。
漆遠接受第一財經采訪時表示,今年的諾貝爾獎就是科學智能非常好的代表,隨著基礎研究科學家和人工智能科研人員的雙向奔赴,未來會看到更多科學智能的成果產生,這也會影響科研范式本身。對于科學智能的未來研究方向,他提到了依舊要選擇具有大科學價值的領域,另外也需要在社會和產業(yè)價值之間找到平衡點,去重點突破。
漆遠
多個大模型發(fā)布
除了科學智能前沿觀察報告,會上還發(fā)布了“PI-AGENT氣候領域大語言模型”、“女媧:生命流體大模型”&“女媧:基因導航大模型”、“女媧:生物結構大模型”。
上智院介紹,此次發(fā)布的“女媧:生物結構大模型”類似于2024年諾貝爾獎成果AlphaFold和RoseTTAFold,通過生成式大模型生成生物結構,包括RNA、分子、蛋白質等,主要應用于制藥產業(yè),因為生物結構直接決定了藥物的功能。
“女媧:生物結構大模型”團隊負責人、復旦大學人工智能創(chuàng)新與產業(yè)研究院研究員朱思語告訴第一財經,從產業(yè)應用角度來看,目前他們已與一些制藥CRO企業(yè)合作,開展藥物結構合成的臨床前驗證。同時,他們還在探索通過官網提供API,供研究人員和企業(yè)申請調用女媧-生物結構大模型的服務!霸谏飻祿矫,我們將與國家蛋白質中心(上海設施)合作,通過分子動力學模擬積累動態(tài)蛋白數據,為模型生成提供支持!
“女媧:基因導航大模型”團隊負責人、復旦大學人工智能創(chuàng)新與產業(yè)研究院副院長、研究員程遠解釋,之所以取名為“基因導航大模型”,是希望對這些“暗物質”對生命的作用機制提供一套“導航圖”,最終可以構建出一套基因與基因之間、基因與環(huán)境之間、基因與外部刺激之間的關聯關系圖譜,就像我們在黑暗環(huán)境中有了一張導航地圖一樣。“我們希望將這套‘導航系統(tǒng)’開放給學術界和工業(yè)界,為未來的生命科學研究添磚加瓦。初期我們會首先開放基因調控關系圖譜和預測接口,然后逐步完善功能。”
而對比上智院此前發(fā)布的“伏羲”大模型,11日發(fā)布的氣候領域大語言模型有何區(qū)別?
“氣候領域大語言模型”團隊負責人,復旦大學校長助理、上海創(chuàng)智學院副院長吳力波解釋,該模型是中國首個獨立自主研發(fā)的氣候科學大語言模型,模型融合海量領域專業(yè)知識,通過智能體建模提升模型對科學事實的認知和總結能力、數據和信息的掌握能力,為氣候領域的研究人員和從業(yè)者提供全方位智能的AI科學家服務,加速氣候變化研究進展。
上智院首席戰(zhàn)略官,復旦大學兼職教授楊燕青