】 【打 印】 
【 第1頁 第2頁 】 
OpenAI新工具 文字可轉60秒視頻
http://www.CRNTT.com   2024-02-17 11:00:36


  中評社北京2月17日電/據大公報報導,綜合法新社、《華爾街日報》、《麻省理工科技評論》報導:繼推出熱門聊天機器人ChatGPT之後,人工智能(AI)公司OpenAI在15日又有大動作,宣布推出全新的視頻AI生成工具“Sora”。該工具能夠根據文字輸入,生成最長60秒的高品質視頻,極具“爆款”潛質。Sora目前仍存在許多缺陷,包括無法處理比較複雜的題材,發生“左右不分”等等。由於生成視頻的能力太過強大,該工具目前仍在測試階段,在OpenAI完成風險評估前,暫時不會對公眾開放。

  “在夜晚的城市中,霓虹燈光將街道點亮,身著皮衣的女子從行人中走出,墨鏡上反射出街道上的斑馬線”……乍一看,這段長達59秒的視頻似乎是真實拍攝的,然而它其實是由OpenAI全新AI視頻生成工具Sora憑藉寥寥數行輸入的文字,一鍵輸入、憑空生成的視頻。

  美國當地時間15日下午,OpenAI正式宣布推出視頻生成工具Sora,並發布了一系列該工具生成的演示視頻。這些視頻五花八門,題材包括猛獁象踏過雪原,淘金熱時期的美國小鎮、男子坐在白雲上讀書等等,畫面生動逼真,令人瞠目結舌。

  “人人都可當導演”

  AI視頻工具已成為業界的熱門話題。Sora十分易用,用戶只需輸入文字描述自己想要的視頻,AI就能輸出一段最長60秒、細節豐富的影片,毋須擁有任何視頻拍攝的設備與製作經驗,相比於傳統的視頻製作,AI效率更高、成本更低,大幅降低視頻門檻,幾可實現“人人都可以當導演”。

  Sora使用的技術,與OpenAI旗下的圖像生成AI工具DALL-E相似,使用“擴散模型”來訓練AI將隨機像素轉變成視頻。但是訓練AI處理視頻與以往的處理文字不同,因為視頻並非由文字組成。研究人員要想辦法,將視頻切成像文字單詞一樣的“塊”。最終,他們將視頻按幀數劃分,在空間和時間上也切割成“塊”。如此一來,Sora內部的神經網絡就能像處理語言文本一樣,能夠處理視頻“塊”。
 


【 第1頁 第2頁 】 


掃描二維碼訪問中評網移動版 】 【打 印掃描二維碼訪問中評社微信  

 相關新聞: