】 【打 印】 
【 第1頁 第2頁 】 
OpenAI新工具 文字可轉60秒視頻
http://www.CRNTT.com   2024-02-17 11:00:36


 
  OpenAI科學家布魯克斯表示,建立能夠理解視頻,以及人們世界中複雜互動的模型,是所有未來AI系統的重要一步。其他科企,如Meta、谷歌在研究文字到視頻的AI技術。

  處理複雜題材仍存缺陷

  儘管OpenAI的演示視頻令人印象深刻,但在社交平台上,不少受邀測試的創作者發出的視頻,顯示了Sora問題不少,尤其是處理相對複雜題材。例如,在一個“男人在跑步”的視頻中,男子站在跑步機上,但卻在朝著與跑步機相反的方向跑動。在另一“穿幫”視頻中,一群小狼在小路上嬉戲的視頻中,發生了數次小狼“憑空出現”或“憑空消失”的情形。

  OpenAI警告稱,Sora當前的模型“存在缺陷”,例如在生成視頻期間對空間認知發生錯誤、發生“左右不分”,或無法在整個視頻中保持視覺連續性等。OpenAI解釋說,例如,視頻中一個人咬了一口餅乾,但之後這塊餅乾上的咬痕可能就會消失。《華盛頓郵報》記者Drew Harwell指出,Sora所生成的視頻中,人類手部形態有缺陷,易穿幫,這是AI生成圖像中最難以攻克的障礙之一。

  Sora能力讓人驚訝的同時,也引發了外界AI技術濫用的擔憂。OpenAI表示,已意識到了Sora可能會生成錯誤信息和仇恨內容等。Sora目前僅開放給少量學者與研究人員使用,其間將同時進行所謂的紅隊演練(red-teaming),即試圖讓AI工具“失靈”,產生不恰當的內容或出毛病,以發現問題。OpenAI在有結論之前,不會開放公眾使用Sora。


 【 第1頁 第2頁 】


掃描二維碼訪問中評網移動版 】 【打 印掃描二維碼訪問中評社微信  

 相關新聞: