OpenAI新工具　文字可轉60秒視頻

【大中小】【打印】

【第1頁第2頁】

	OpenAI新工具　文字可轉60秒視頻
	http://www.CRNTT.com 2024-02-17 11:00:36

　　OpenAI科學家布魯克斯表示，建立能夠理解視頻，以及人們世界中複雜互動的模型，是所有未來AI系統的重要一步。其他科企，如Meta、谷歌在研究文字到視頻的AI技術。

　　處理複雜題材仍存缺陷

　　儘管OpenAI的演示視頻令人印象深刻，但在社交平台上，不少受邀測試的創作者發出的視頻，顯示了Sora問題不少，尤其是處理相對複雜題材。例如，在一個“男人在跑步”的視頻中，男子站在跑步機上，但卻在朝著與跑步機相反的方向跑動。在另一“穿幫”視頻中，一群小狼在小路上嬉戲的視頻中，發生了數次小狼“憑空出現”或“憑空消失”的情形。

　　OpenAI警告稱，Sora當前的模型“存在缺陷”，例如在生成視頻期間對空間認知發生錯誤、發生“左右不分”，或無法在整個視頻中保持視覺連續性等。OpenAI解釋說，例如，視頻中一個人咬了一口餅乾，但之後這塊餅乾上的咬痕可能就會消失。《華盛頓郵報》記者Drew　Harwell指出，Sora所生成的視頻中，人類手部形態有缺陷，易穿幫，這是AI生成圖像中最難以攻克的障礙之一。

　　Sora能力讓人驚訝的同時，也引發了外界AI技術濫用的擔憂。OpenAI表示，已意識到了Sora可能會生成錯誤信息和仇恨內容等。Sora目前僅開放給少量學者與研究人員使用，其間將同時進行所謂的紅隊演練（red－teaming），即試圖讓AI工具“失靈”，產生不恰當的內容或出毛病，以發現問題。OpenAI在有結論之前，不會開放公眾使用Sora。

　【第1頁第2頁】

【大中小】【打印】掃描二維碼訪問中評社微信

相關新聞：