與傳統事業單位相比,期智研究院在經費使用上有更大的靈活度。“我們列出了負面清單,支持研究院圍繞既定的目標任務,根據科研活動實際需要,將財政經費用於人員、設備、試驗、交流等方面,具體如何使用由研究院自主決定。”市科委基礎處處長宋揚說。這種自主權給予科學家充分的信任,也是對在競爭性項目之外支持基礎研究的路徑探索。
按照期智研究院設定的目標,10年後將成為人工智能基礎研究的創新策源地,力爭與全球排名前五的人工智能研究機構比肩。
讓機器像人一樣做複雜決策
“90後”科學家吳翼博士,畢業於清華大學“姚班”,去年9月入職期智研究院。“我現在上海、北京兩頭跑,因為我還是清華大學助理教授。”小夥子告訴記者。
他的研究方向是強化學習,這種人工智能算法用於解決決策問題,希望有朝一日讓機器在多步驟操作中像人一樣做複雜決策。“AlphaGo就採用了強化學習算法,因為下圍棋需要很多步驟,每一步棋無所謂對錯,但都是為了最終能贏。”吳翼解釋說,“目前,人工智能已經能在所有棋牌遊戲、電子遊戲中達到或超越人類頂尖選手水平,但在很多複雜場景中還是遠不如人。”
能否開發出一個通用強化學習決策平台,讓機器在各種場景中都能做出智能決策?這就是吳翼在期智研究院帶隊研發的項目。這個項目的執行期是3年,他不必申請政府的競爭性項目,就能獲得足夠的資金,用來招聘科研和工程人員、購買計算集群等設備。他的團隊現有4人,其中兩人是“學士後研究員”,他們本科畢業後未能順利赴美留學,於是選擇師從吳翼開展前沿研究。“我們力爭2021年底給出漂亮的Demo(展示樣品),2022年讓通用強化學習決策平台有落地應用,2023年應用於多個場景,如自動駕駛、工業機器人和智能診斷。”
打造全球最快核酸檢測儀器 |