桐乡池优新材料有限公司

揭秘AI繪畫 怎么把真人照片畫成二次元人物?

網(wǎng)絡(luò) 分享 時間: 收藏本文

揭秘AI繪畫 怎么把真人照片畫成二次元人物?

有了AI,人人都可以是藝術(shù)家。AI繪畫的出現(xiàn),恰如瑞士藝術(shù)家保羅·克利所言:“藝術(shù)不是再現(xiàn)可見,而是使不可見成為可見。”經(jīng)過20年左右的發(fā)展,目前基于不同類型或者模態(tài)元素的AI繪畫發(fā)展情況不盡相同,發(fā)展最久的是“以圖生圖”,再到近期火爆的“文+圖”生圖。當(dāng)然,也有團(tuán)隊已經(jīng)研發(fā)出由語音生成圖像的技術(shù)。

上傳一張圖片,或者輸入一些簡單的關(guān)鍵詞,系統(tǒng)就能自動生成一張卡通圖像……最近一段時間,AI繪畫開始在互聯(lián)網(wǎng)社交平臺走紅。

AI繪畫,顧名思義就是利用人工智能進(jìn)行繪畫,是人工智能生成內(nèi)容的典型應(yīng)用場景之一。其主要原理是收集大量已有作品,通過算法對其內(nèi)容和風(fēng)格特征進(jìn)行解析,最后再生成新的作品,所以算法是AI繪畫的核心。

當(dāng)前,“憑空”生成圖像的AI繪畫,其實也會動輒“翻車”:也許上一秒AI通過你的照片繪出的是一張充滿藝術(shù)感的二次元畫像,下一秒你的寵物貓、狗則可能被畫成可愛少女或肌肉猛男。

事實上,AI繪畫早已火爆全球。第一張公開展出的、由人工智能創(chuàng)作的繪畫作品《埃德蒙·貝拉米的肖像》曾于2018年在佳士得拍賣行以43.25萬美元成交,那是一張由機(jī)器學(xué)習(xí)了從14世紀(jì)到20世紀(jì)的1.5萬張肖像畫之后自動生成的一張肖像畫作品。

AI繪畫是如何實現(xiàn)“憑空”生圖的?除了娛樂外,AI繪畫還有哪些潛在的應(yīng)用前景?

從“以圖生圖”到“語音生圖”

2022年,由人工智能創(chuàng)作的《太空歌劇院》一度火出圈。在美國科羅拉多州舉辦的新興數(shù)字藝術(shù)家競賽中,《太空歌劇院》獲得“數(shù)字藝術(shù)/數(shù)字修飾照片”類別一等獎。它的構(gòu)圖、配色以及畫面的細(xì)節(jié)堪稱精致。然而,這個作品的創(chuàng)作者不是藝術(shù)家,而是來自美國科羅拉多州的游戲設(shè)計師。

這位游戲設(shè)計師在一個名為“”的AI創(chuàng)作工具里,先輸入幾個關(guān)鍵詞,如光源、構(gòu)圖、氛圍等,得到了100幅作品,再進(jìn)行約80小時的修圖修飾,最終選出3幅作品,最后把圖像打印到畫布上。

通過簡單交互式對話在短時間內(nèi)生成的“藝術(shù)”作品,讓人類藝術(shù)家展開了一場關(guān)于“AI繪畫作品參賽是否屬于作弊”的爭論。這場聲勢浩大的爭論也令大眾直觀地意識到如今的AI繪畫水平已經(jīng)發(fā)展到了何種程度。

“人工智能在藝術(shù)方面的創(chuàng)作最早可以追溯到上個世紀(jì)末,當(dāng)時的人工智能繪畫技術(shù)叫作‘圖像的風(fēng)格化濾鏡’。”中國科學(xué)院自動化研究所多模態(tài)人工智能系統(tǒng)全國重點實驗室研究員董未名說,最初的AI繪畫方法比較簡單,比如一張普通的照片,通過一些圖像處理的算法,把照片像素進(jìn)行幾何或者色彩上的變換,然后再調(diào)節(jié)不同參數(shù),就可以模擬出類似油畫或者水彩畫的風(fēng)格。

經(jīng)過20年左右的發(fā)展,目前基于不同類型或者模態(tài)元素的AI繪畫發(fā)展情況不盡相同,發(fā)展最久的是“以圖生圖”,再到近期火爆的“文+圖”生圖。當(dāng)然,也有團(tuán)隊已經(jīng)研發(fā)出由語音生成圖像的技術(shù)。

AI繪畫主要依靠三種技術(shù)模式實現(xiàn)

董未名介紹,目前AI繪畫主要借助圖像風(fēng)格遷移技術(shù)、圖文預(yù)訓(xùn)練模型和擴(kuò)散模型實現(xiàn)。

“圖像風(fēng)格遷移技術(shù)指的是圖像處理算法通過對輸入的真實圖像內(nèi)容特征和對參考的藝術(shù)圖像風(fēng)格特征的提取,實現(xiàn)真實圖像內(nèi)容特征和藝術(shù)圖像風(fēng)格特征的融合,從而生成新的藝術(shù)圖像。”董未名舉例,如果將美國舊金山藝術(shù)宮的外景照片和印象派創(chuàng)始人莫奈繪制的作品,通過圖像風(fēng)格遷移技術(shù)進(jìn)行融合,就能得到一張看起來像是由莫奈繪制的美國舊金山藝術(shù)宮的繪畫作品。最初的AI繪畫采用的正是這種技術(shù)。

不過,在董未名看來,圖像風(fēng)格遷移技術(shù)大多依賴的是生成式對抗網(wǎng)絡(luò)(GAN)算法,它最大的問題是生成的繪畫作品藝術(shù)性不強(qiáng),筆觸和構(gòu)圖讓人覺得與真實的繪畫有差距,所以長久以來,AI繪畫一直“籍籍無名”。

當(dāng)圖像風(fēng)格遷移技術(shù)還在掙扎于輸出作品的審美問題時,圖文預(yù)訓(xùn)練模型的出現(xiàn),加速了AI繪畫的崛起。

“依托圖文預(yù)訓(xùn)練模型,只要輸入一句話或者上傳一幅風(fēng)格明顯的圖片,算法就能將圖像特征和文字特征‘對齊’。生成的繪畫作品的內(nèi)容特征和上傳圖片的內(nèi)容相似,藝術(shù)性也比圖像風(fēng)格遷移技術(shù)生成的圖片強(qiáng)很多?!倍疵e例,比如支撐圖文預(yù)訓(xùn)練模型的可對比語言—圖像預(yù)訓(xùn)練(CLIP)算法,就是利用圖文特征“對齊”的能力,再結(jié)合已有的生成模型,實現(xiàn)“以圖生圖”或者“圖+文”生圖。

不過,董未名坦言,圖文預(yù)訓(xùn)練模型的推廣也存在一些爭議,有部分人認(rèn)為,該模型在訓(xùn)練前期,需要用大量的圖形處理器(GPU)進(jìn)行數(shù)據(jù)訓(xùn)練,耗電量大、成本很高,而該模型的應(yīng)用場景卻不夠清晰。但也有人認(rèn)為,也許該模型未來可以打造為通用的人工智能模型,用它完成更多的算法作業(yè),只是這還需要時間的驗證。

誠然沒有一項技術(shù)是完美的,這也為人類探究更先進(jìn)的技術(shù)提供了無限動力。當(dāng)下最流行的擴(kuò)散模型便是其中之一。

“目前最新的AI繪畫技術(shù)采用的就是擴(kuò)散模型,這種模型可以把一個隨機(jī)采樣的噪聲輸入模型,然后嘗試通過去噪來生成圖像?!倍疵硎?擴(kuò)散模型也存在弱點,由于模型對圖片內(nèi)容識別的能力不足,或者難以完全理解識別文字的意義,以及訓(xùn)練數(shù)據(jù)的偏差,有時便會生成“四不像”的作品。此外,擴(kuò)散模型生成圖片的速度比較慢,目前還達(dá)不到實時生成圖片。

互聯(lián)網(wǎng)治理、元宇宙或潛藏應(yīng)用前景

AI繪畫目前的應(yīng)用場景,更多聚焦于社交軟件。近期在國內(nèi)社交網(wǎng)絡(luò)“火出天際”的AI繪畫軟件主要集中在小程序及App。隨著AI繪畫小程序的火爆,短視頻平臺抖音也迅速上線了AI繪畫特效。同時,此前騰訊上線了“QQ小世界AI畫匠”活動,百度也推出了首款A(yù)I藝術(shù)和創(chuàng)意輔助平臺“文心一格”。

有了AI,人人都可以是藝術(shù)家。AI繪畫的出現(xiàn),恰如瑞士藝術(shù)家保羅·克利所言:“藝術(shù)不是再現(xiàn)可見,而是使不可見成為可見?!薄癆I現(xiàn)在已經(jīng)完美實現(xiàn)了這一目標(biāo),人們可以通過機(jī)器計算來繪制出很多現(xiàn)實中見不到的場景?!倍疵麜诚?不遠(yuǎn)的將來,AI繪畫或許還將展現(xiàn)更豐富的應(yīng)用場景。

“現(xiàn)在網(wǎng)絡(luò)上充斥著很多不良內(nèi)容,這些內(nèi)容為了逃避監(jiān)管經(jīng)常以繪畫的形式出現(xiàn),而當(dāng)前很多內(nèi)容識別模型對真實圖片識別得很準(zhǔn)確,但缺乏不良內(nèi)容藝術(shù)作品的相關(guān)訓(xùn)練數(shù)據(jù),所以對不良內(nèi)容識別不準(zhǔn)確。也許可以用AI繪畫技術(shù),積累不良內(nèi)容藝術(shù)作品的數(shù)據(jù),并用以訓(xùn)練識別模型,以提升互聯(lián)網(wǎng)內(nèi)容的安全監(jiān)管能力和識別的準(zhǔn)確率。”董未名建議。

在董未名看來,作為一種藝術(shù)呈現(xiàn)形式,AI繪畫也將在元宇宙、設(shè)計、文旅等行業(yè)催生新的商業(yè)模式。例如AI繪畫目前在AI輔助創(chuàng)作、短視頻、影視制作和元宇宙等方面都有布局,因為這些賽道都離不開創(chuàng)意,AI繪畫可以幫助創(chuàng)作者通過簡單的特征輸入,實現(xiàn)對其創(chuàng)意的預(yù)覽,甚至可以直接進(jìn)行創(chuàng)作。

不過,董未名并不諱言,當(dāng)下AI繪畫仍然存在版權(quán)爭議問題。AI繪畫的核心是模型,而訓(xùn)練模型需要使用大量圖像、文本數(shù)據(jù)。對于未經(jīng)授權(quán)的圖片,經(jīng)過運(yùn)算之后所生成的圖像版權(quán)歸屬尚難界定?!坝械漠嫾绎L(fēng)格特別明顯,如果用畫家的畫去訓(xùn)練算法模型生成作品,那最后的版權(quán)屬于誰呢?”董未名提出的問題,正是多數(shù)AI繪畫作品所面臨的現(xiàn)實問題。

AI繪畫掀起了一場資本的群體狂歡,希望有一天它能走出“照貓畫虎”的尷尬,真正服務(wù)藝術(shù)創(chuàng)作、創(chuàng)造更多價值。

信息流廣告 網(wǎng)絡(luò)推廣 周易 易經(jīng) 代理招生 二手車 網(wǎng)絡(luò)營銷 招生代理 旅游攻略 非物質(zhì)文化遺產(chǎn) 查字典 精雕圖 戲曲下載 抖音代運(yùn)營 易學(xué)網(wǎng) 互聯(lián)網(wǎng)資訊 成語 成語故事 詩詞 工商注冊 注冊公司 抖音帶貨 云南旅游網(wǎng) 網(wǎng)絡(luò)游戲 代理記賬 短視頻運(yùn)營 在線題庫 國學(xué)網(wǎng) 知識產(chǎn)權(quán) 抖音運(yùn)營 雕龍客 雕塑 奇石 散文 自學(xué)教程 常用文書 河北生活網(wǎng) 好書推薦 游戲攻略 心理測試 石家莊人才網(wǎng) 考研真題 漢語知識 心理咨詢 手游安卓版下載 興趣愛好 網(wǎng)絡(luò)知識 十大品牌排行榜 商標(biāo)交易 單機(jī)游戲下載 短視頻代運(yùn)營 寶寶起名 范文網(wǎng) 電商設(shè)計 免費發(fā)布信息 服裝服飾 律師咨詢 搜救犬 Chat GPT中文版 經(jīng)典范文 優(yōu)質(zhì)范文 工作總結(jié) 二手車估價 實用范文 愛采購代運(yùn)營 古詩詞 衡水人才網(wǎng) 石家莊點痣 養(yǎng)花 名酒回收 石家莊代理記賬 女士發(fā)型 搜搜作文 石家莊人才網(wǎng) 銅雕 詞典 圍棋 chatGPT 讀后感 玄機(jī)派 企業(yè)服務(wù) 法律咨詢 chatGPT國內(nèi)版 chatGPT官網(wǎng) 勵志名言 河北代理記賬公司 文玩 朋友圈文案 語料庫 游戲推薦 男士發(fā)型 高考作文 PS修圖 兒童文學(xué) 買車咨詢 工作計劃 禮品廠 舟舟培訓(xùn) IT教程 手機(jī)游戲推薦排行榜 暖通,電采暖, 女性健康 苗木供應(yīng) ps素材庫 短視頻培訓(xùn) 優(yōu)秀個人博客 包裝網(wǎng) 創(chuàng)業(yè)賺錢 養(yǎng)生 民間借貸律師 綠色軟件 安卓手機(jī)游戲 手機(jī)軟件下載 手機(jī)游戲下載 單機(jī)游戲大全 免費軟件下載 網(wǎng)賺 手游下載 游戲盒子 職業(yè)培訓(xùn) 資格考試 成語大全 英語培訓(xùn) 藝術(shù)培訓(xùn) 少兒培訓(xùn) 苗木網(wǎng) 雕塑網(wǎng) 好玩的手機(jī)游戲推薦 漢語詞典 中國機(jī)械網(wǎng) 美文欣賞 紅樓夢 道德經(jīng) 網(wǎng)站轉(zhuǎn)讓 鮮花 社區(qū)團(tuán)購 石家莊論壇 書包網(wǎng) 電地暖 在線新華字典 雅思培訓(xùn)