【天天新視野】人工智能，如何妙筆“生”畫(huà)

2022-12-23 07:08:47來(lái)源：瀟湘晨報(bào)

核心閱讀輸入一段話，“繪”出一幅畫(huà)——人工智能的繪畫(huà)本領(lǐng)，吸引眾多職業(yè)畫(huà)師和零基礎(chǔ)用戶(hù)嘗鮮。人工智能繪畫(huà)的本質(zhì)是計(jì)算，接受“語(yǔ)言描述

核心閱讀

輸入一段話，“繪”出一幅畫(huà)——人工智能的繪畫(huà)本領(lǐng)，吸引眾多職業(yè)畫(huà)師和零基礎(chǔ)用戶(hù)嘗鮮。人工智能繪畫(huà)的本質(zhì)是計(jì)算，接受“語(yǔ)言描述”指令后根據(jù)自身的理解還原出圖像。未來(lái)，人工智能技術(shù)應(yīng)用于藝術(shù)創(chuàng)作等領(lǐng)域，還要注意防范潛在風(fēng)險(xiǎn)，讓技術(shù)進(jìn)步更好地造福社會(huì)。

【資料圖】

不用畫(huà)筆、顏料，輸入一段描述性文字，計(jì)算機(jī)就能自動(dòng)解析，生成相應(yīng)的畫(huà)作。2022世界人工智能大會(huì)上，人工智能繪畫(huà)的展示令觀眾驚嘆。

一些過(guò)去專(zhuān)屬于人類(lèi)創(chuàng)作的領(lǐng)域，比如繪畫(huà)、書(shū)法、寫(xiě)作、作曲，如今人工智能也已開(kāi)始涉足。人工智能是如何繪畫(huà)的？當(dāng)前沿技術(shù)與藝術(shù)相遇，將碰撞出怎樣的火花？在內(nèi)容、版權(quán)等方面又是否存在問(wèn)題？

從文本到圖像，人工智能繪畫(huà)本質(zhì)是計(jì)算

人工智能繪畫(huà)是一個(gè)從文本到圖像的生成過(guò)程，輸入一段話，生成一幅畫(huà)，本質(zhì)是計(jì)算。簡(jiǎn)要地說(shuō)，計(jì)算機(jī)通過(guò)大量學(xué)習(xí)，能識(shí)別特定圖片元素和文本之間的關(guān)聯(lián)。同理，人工智能程序在收到“語(yǔ)言描述”指令后，可以根據(jù)自身的算法還原出圖像。

設(shè)定計(jì)算機(jī)程序作畫(huà)的想法由來(lái)已久。早在20世紀(jì)70年代，就有藝術(shù)家開(kāi)發(fā)了操作機(jī)械臂的電腦程序，讓機(jī)械臂按照指令在畫(huà)紙上作畫(huà)。近些年，人工智能技術(shù)日新月異，科研人員嘗試設(shè)計(jì)自動(dòng)作圖的計(jì)算機(jī)程序。但過(guò)去很長(zhǎng)一段時(shí)間，人工智能“畫(huà)”出的作品普遍不夠好，往往只是一些模糊的圖像元素的組合，還稱(chēng)不上是完整的畫(huà)。

今年以來(lái)，人工智能畫(huà)技迅速“進(jìn)化”。談及技術(shù)突破原因，百度文心一格總架構(gòu)師肖欣延認(rèn)為，這是預(yù)訓(xùn)練大模型的興起、大數(shù)據(jù)的訓(xùn)練和擴(kuò)散模型的出現(xiàn)3方面共同作用的結(jié)果。

具體來(lái)說(shuō)，預(yù)訓(xùn)練大模型增強(qiáng)了人工智能的通用性，成為人工智能技術(shù)及應(yīng)用的新基座；大數(shù)據(jù)的訓(xùn)練中，通過(guò)在眾多高性能GPU（圖形處理器）算力資源中進(jìn)行并行學(xué)習(xí)，計(jì)算機(jī)能夠在短時(shí)間內(nèi)完成大量的數(shù)據(jù)學(xué)習(xí)。近年來(lái)，幾乎所有人工智能的技術(shù)發(fā)展都受益于這兩方面的進(jìn)展。而對(duì)人工智能繪畫(huà)來(lái)說(shuō)，擴(kuò)散模型的出現(xiàn)至關(guān)重要。

擴(kuò)散模型的原理是，通過(guò)人為逐步添加噪聲，讓圖像逐漸變“模糊”，再不斷學(xué)習(xí)去噪過(guò)程，如此人工智能就能從完全是噪聲的圖片中逐漸還原出清晰的圖片，即“畫(huà)”出圖像。

“這一過(guò)程與人類(lèi)學(xué)習(xí)相似。通常，人們學(xué)畫(huà)從臨摹開(kāi)始，機(jī)器也是如此。它最初生成的圖像可能很模糊，但計(jì)算機(jī)會(huì)不斷修正，從而輸出越來(lái)越清楚、層次越來(lái)越豐富的圖像?！毙ば姥诱f(shuō)。

擴(kuò)散模型讓人工智能繪畫(huà)技術(shù)實(shí)現(xiàn)跨越，不僅作畫(huà)質(zhì)量快速提升，生成時(shí)間也縮短到幾秒鐘。

眾多用戶(hù)嘗鮮，大量應(yīng)用加速“畫(huà)技”進(jìn)化

湯林杰是某互聯(lián)網(wǎng)公司的運(yùn)營(yíng)人員。工作中，他需要借助一些圖片來(lái)豐富文案，而網(wǎng)絡(luò)上找到合適的配圖并不容易。今年10月，了解人工智能繪畫(huà)程序后，他嘗試自己“畫(huà)”圖?，F(xiàn)在，人工智能繪畫(huà)工具已經(jīng)是他工作的重要輔助。

隨著算法模型對(duì)公眾開(kāi)放以及訓(xùn)練數(shù)據(jù)成本的下降，人工智能繪畫(huà)門(mén)檻越來(lái)越低，一些簡(jiǎn)易化操作平臺(tái)在國(guó)內(nèi)外興起。如今，不僅一些職業(yè)插畫(huà)師嘗試用人工智能繪畫(huà)程序輔助作畫(huà)、激發(fā)靈感，許多沒(méi)有繪畫(huà)基礎(chǔ)的用戶(hù)也開(kāi)始嘗鮮，并“曬”在社交平臺(tái)上。

大量需求的涌現(xiàn)也加速了技術(shù)的更新迭代?！坝萌斯ぶ悄芾L畫(huà)的人越多，算法就越能理解輸入的描述文本，畫(huà)作質(zhì)量就越高。”肖欣延表示，當(dāng)前人工智能繪畫(huà)水平與今年初相比，已經(jīng)有很大進(jìn)步。

不過(guò)，目前的人工智能繪畫(huà)技術(shù)并不完美。首先，可控性仍然不高，即計(jì)算機(jī)不能很好理解人類(lèi)指令的含義，即便是輸入“畫(huà)兩個(gè)蘋(píng)果，左邊紅色，右邊綠色”這樣的簡(jiǎn)單描述，生成的圖像也可能有很大偏差；其次，細(xì)節(jié)呈現(xiàn)能力還不夠。比如，對(duì)空間、透視和光影的刻畫(huà)就很不如意。不少人工智能渲染出的畫(huà)作，初看上去驚艷，認(rèn)真觀察問(wèn)題卻不少。

但肖欣延認(rèn)為，人工智能繪畫(huà)在技法上的缺陷未來(lái)有望得到彌補(bǔ)。比如，基于跨模態(tài)大模型和強(qiáng)大的深度學(xué)習(xí)框架，百度開(kāi)發(fā)的技術(shù)一定程度上已經(jīng)緩解這些問(wèn)題。此外，未來(lái)人工智能不僅能作畫(huà)，還能根據(jù)文本描述生成視頻，并直接配上解說(shuō)文字，“可以把視頻生成看作是維度更高的繪畫(huà)，從技術(shù)層面看，這是可以實(shí)現(xiàn)的。”

防范潛在風(fēng)險(xiǎn)，守住法律和倫理底線

人工智能進(jìn)入繪畫(huà)領(lǐng)域，計(jì)算機(jī)會(huì)取代人類(lèi)畫(huà)師嗎？

在肖欣延看來(lái)，好的繪畫(huà)與構(gòu)圖、設(shè)計(jì)語(yǔ)言、視覺(jué)情緒息息相關(guān)，即使人人都可以用人工智能技術(shù)作畫(huà)，但通常只有高水平的畫(huà)師才能制作出優(yōu)秀的人工智能繪畫(huà)作品，“人工智能只是作畫(huà)的輔助工具”。此外，雖然有的人工智能繪畫(huà)語(yǔ)言嫻熟，也包含細(xì)膩的情感，但并不意味著機(jī)器有意識(shí)、情感，它不過(guò)是學(xué)過(guò)類(lèi)似的作品，又恰好呈現(xiàn)出來(lái)了。“優(yōu)秀的藝術(shù)作品往往是人的思想的投射，目前機(jī)器并沒(méi)有真正具備思考能力?！毙ば姥诱f(shuō)。

不少業(yè)內(nèi)人士認(rèn)為，不妨以開(kāi)放的心態(tài)擁抱人工智能繪畫(huà)，接受新事物。可以預(yù)想，將來(lái)繪畫(huà)中一些繁瑣、重復(fù)性的工作可能由計(jì)算機(jī)完成，創(chuàng)作者能騰出更多時(shí)間去構(gòu)思想法與創(chuàng)意，調(diào)整構(gòu)圖、色彩、光影氛圍等。

“人工智能可能會(huì)激發(fā)繪畫(huà)創(chuàng)造的活力?！毙ば姥颖硎荆?0世紀(jì)前后，照相技術(shù)讓傳統(tǒng)肖像畫(huà)失去市場(chǎng)，促使一些畫(huà)家向非寫(xiě)實(shí)方向創(chuàng)新。與人工智能技術(shù)融合，或許能激發(fā)畫(huà)家創(chuàng)作出別開(kāi)生面的作品。

不過(guò)，由于人工智能繪畫(huà)發(fā)展剛剛起步，技術(shù)發(fā)展也引發(fā)關(guān)于版權(quán)、內(nèi)容把控等問(wèn)題的爭(zhēng)議。比如，有人認(rèn)為，未經(jīng)授權(quán)人工智能畫(huà)作模仿原畫(huà)的內(nèi)容、構(gòu)圖和風(fēng)格等，侵犯了原作者的版權(quán)，有違法嫌疑。也有人認(rèn)為，“機(jī)器學(xué)習(xí)”過(guò)程是一種類(lèi)人化的創(chuàng)作行為，同樣體現(xiàn)了創(chuàng)造者的思想和勞動(dòng)，應(yīng)當(dāng)獲得版權(quán)保護(hù)。此外，還有人擔(dān)憂，人工智能繪畫(huà)技術(shù)若被濫用，可能滋生暴力等令人不適的圖像。面對(duì)新技術(shù)發(fā)展，有必要前瞻潛在的風(fēng)險(xiǎn)，只有守住法律和倫理底線，技術(shù)進(jìn)步才能更好地造福社會(huì)。

不只是繪畫(huà)，寫(xiě)作、作曲、生成短片，人工智能日益強(qiáng)大的深度學(xué)習(xí)能力，讓它與不同藝術(shù)門(mén)類(lèi)發(fā)生著奇妙的碰撞。展望未來(lái)，業(yè)界專(zhuān)家認(rèn)為，人工智能與藝術(shù)融合，一方面會(huì)降低一些藝術(shù)門(mén)類(lèi)的創(chuàng)造門(mén)檻，讓更多人參與到當(dāng)代的審美創(chuàng)造中來(lái)；另一方面新技術(shù)會(huì)帶來(lái)新的審美風(fēng)格，人們或許能從中擴(kuò)展對(duì)自身和世界的認(rèn)識(shí)。

《人民日?qǐng)?bào) 》（ 2022年12月23日 11 版）

(責(zé)編：袁勃、牛鏞)

關(guān)鍵詞：人工智能人工智能技術(shù) 計(jì)算機(jī)程序技術(shù)發(fā)展技術(shù)進(jìn)步

責(zé)任編輯：hnmd004