AI繪畫的“小秘密”都在這一篇文章裡

【大中小】【打印】

【第1頁第2頁第3頁第4頁】

	AI繪畫的“小秘密”都在這一篇文章裡
	http://www.CRNTT.com 2023-01-09 14:59:22

　　不過，在董未名看來，圖像風格遷移技術大多依賴的是生成式對抗網絡（GAN）算法，它最大的問題是生成的繪畫作品藝術性不強，筆觸和構圖讓人覺得與真實的繪畫有差距，所以長久以來，AI繪畫一直“籍籍無名”。

　　當圖像風格遷移技術還在掙扎於輸出作品的審美問題時，圖文預訓練模型的出現，加速了AI繪畫的崛起。

　　“依托圖文預訓練模型，只要輸入一句話或者上傳一幅風格明顯的圖片，算法就能將圖像特徵和文字特徵‘對齊’。生成的繪畫作品的內容特徵和上傳圖片的內容相似，藝術性也比圖像風格遷移技術生成的圖片強很多。”董未名舉例，比如支撐圖文預訓練模型的可對比語言—圖像預訓練（CLIP）算法，就是利用圖文特徵“對齊”的能力，再結合已有的生成模型，實現“以圖生圖”或者“圖＋文”生圖。

　　不過，董未名坦言，圖文預訓練模型的推廣也存在一些爭議，有部分人認為，該模型在訓練前期，需要用大量的圖形處理器（GPU）進行數據訓練，耗電量大、成本很高，而該模型的應用場景卻不夠清晰。但也有人認為，也許該模型未來可以打造為通用的人工智能模型，用它完成更多的算法作業，只是這還需要時間的驗證。

　　誠然沒有一項技術是完美的，這也為人類探究更先進的技術提供了無限動力。當下最流行的擴散模型便是其中之一。

　　“目前最新的AI繪畫技術採用的就是擴散模型，這種模型可以把一個隨機采樣的噪聲輸入模型，然後嘗試通過去噪來生成圖像。”董未名表示，擴散模型也存在弱點，由於模型對圖片內容識別的能力不足，或者難以完全理解識別文字的意義，以及訓練數據的偏差，有時便會生成“四不像”的作品。此外，擴散模型生成圖片的速度比較慢，目前還達不到實時生成圖片。

　【第1頁第2頁第3頁第4頁】　

【大中小】【打印】掃描二維碼訪問中評社微信

相關新聞：