】 【打 印】 
【 第1頁 第2頁 第3頁 第4頁 】 
AI繪畫的“小秘密”都在這一篇文章裡
http://www.CRNTT.com   2023-01-09 14:59:22


 

  不過,在董未名看來,圖像風格遷移技術大多依賴的是生成式對抗網絡(GAN)算法,它最大的問題是生成的繪畫作品藝術性不強,筆觸和構圖讓人覺得與真實的繪畫有差距,所以長久以來,AI繪畫一直“籍籍無名”。

  當圖像風格遷移技術還在掙扎於輸出作品的審美問題時,圖文預訓練模型的出現,加速了AI繪畫的崛起。

  “依托圖文預訓練模型,只要輸入一句話或者上傳一幅風格明顯的圖片,算法就能將圖像特徵和文字特徵‘對齊’。生成的繪畫作品的內容特徵和上傳圖片的內容相似,藝術性也比圖像風格遷移技術生成的圖片強很多。”董未名舉例,比如支撐圖文預訓練模型的可對比語言—圖像預訓練(CLIP)算法,就是利用圖文特徵“對齊”的能力,再結合已有的生成模型,實現“以圖生圖”或者“圖+文”生圖。

  不過,董未名坦言,圖文預訓練模型的推廣也存在一些爭議,有部分人認為,該模型在訓練前期,需要用大量的圖形處理器(GPU)進行數據訓練,耗電量大、成本很高,而該模型的應用場景卻不夠清晰。但也有人認為,也許該模型未來可以打造為通用的人工智能模型,用它完成更多的算法作業,只是這還需要時間的驗證。

  誠然沒有一項技術是完美的,這也為人類探究更先進的技術提供了無限動力。當下最流行的擴散模型便是其中之一。

  “目前最新的AI繪畫技術採用的就是擴散模型,這種模型可以把一個隨機采樣的噪聲輸入模型,然後嘗試通過去噪來生成圖像。”董未名表示,擴散模型也存在弱點,由於模型對圖片內容識別的能力不足,或者難以完全理解識別文字的意義,以及訓練數據的偏差,有時便會生成“四不像”的作品。此外,擴散模型生成圖片的速度比較慢,目前還達不到實時生成圖片。 


 【 第1頁 第2頁 第3頁 第4頁 】 


掃描二維碼訪問中評網移動版 】 【打 印掃描二維碼訪問中評社微信  

 相關新聞: