OpenAI新工具　文字可轉60秒視頻

【大中小】【打印】

【第1頁第2頁】

	OpenAI新工具　文字可轉60秒視頻
	http://www.CRNTT.com 2024-02-17 11:00:36

　　中評社北京2月17日電／據大公報報導，綜合法新社、《華爾街日報》、《麻省理工科技評論》報導：繼推出熱門聊天機器人ChatGPT之後，人工智能（AI）公司OpenAI在15日又有大動作，宣布推出全新的視頻AI生成工具“Sora”。該工具能夠根據文字輸入，生成最長60秒的高品質視頻，極具“爆款”潛質。Sora目前仍存在許多缺陷，包括無法處理比較複雜的題材，發生“左右不分”等等。由於生成視頻的能力太過強大，該工具目前仍在測試階段，在OpenAI完成風險評估前，暫時不會對公眾開放。

　　“在夜晚的城市中，霓虹燈光將街道點亮，身著皮衣的女子從行人中走出，墨鏡上反射出街道上的斑馬線”……乍一看，這段長達59秒的視頻似乎是真實拍攝的，然而它其實是由OpenAI全新AI視頻生成工具Sora憑藉寥寥數行輸入的文字，一鍵輸入、憑空生成的視頻。

　　美國當地時間15日下午，OpenAI正式宣布推出視頻生成工具Sora，並發布了一系列該工具生成的演示視頻。這些視頻五花八門，題材包括猛獁象踏過雪原，淘金熱時期的美國小鎮、男子坐在白雲上讀書等等，畫面生動逼真，令人瞠目結舌。

　　“人人都可當導演”

　　AI視頻工具已成為業界的熱門話題。Sora十分易用，用戶只需輸入文字描述自己想要的視頻，AI就能輸出一段最長60秒、細節豐富的影片，毋須擁有任何視頻拍攝的設備與製作經驗，相比於傳統的視頻製作，AI效率更高、成本更低，大幅降低視頻門檻，幾可實現“人人都可以當導演”。

　　Sora使用的技術，與OpenAI旗下的圖像生成AI工具DALL－E相似，使用“擴散模型”來訓練AI將隨機像素轉變成視頻。但是訓練AI處理視頻與以往的處理文字不同，因為視頻並非由文字組成。研究人員要想辦法，將視頻切成像文字單詞一樣的“塊”。最終，他們將視頻按幀數劃分，在空間和時間上也切割成“塊”。如此一來，Sora內部的神經網絡就能像處理語言文本一樣，能夠處理視頻“塊”。

【第1頁第2頁】　

【大中小】【打印】掃描二維碼訪問中評社微信

相關新聞：