一幅由人工智能(AI)生成的“中國情侶”圖片近期在國內(nèi)外社交媒體上被廣泛轉(zhuǎn)發(fā),其逼真的視覺效果令不少網(wǎng)友感嘆:“AI已經(jīng)不遜于人類畫師了?!边@幅作品由AI圖片生成工具M(jìn)idjourney最新推出的V5版本生成,該工具是近期繼GPT-4后又一受到關(guān)注的AI產(chǎn)品。在接受《環(huán)球時(shí)報(bào)》記者采訪時(shí),多名人工智能與互聯(lián)網(wǎng)業(yè)內(nèi)人士認(rèn)為,Midjourney V5版本代表了目前生成式AI的前沿水平,其生成的圖像在某些領(lǐng)域已經(jīng)得到商用,通過繼續(xù)學(xué)習(xí)和技術(shù)迭代,預(yù)計(jì)其能力可以進(jìn)一步增強(qiáng)。不過,上述人士也提到,Midjourney以及生成式AI由于通過公開數(shù)據(jù)進(jìn)行訓(xùn)練,其生成的作品在版權(quán)等問題上存在較大爭(zhēng)議。
“中國情侶圖片”是如何出圈的
由美國一家工作室開發(fā)的Midjourney于去年3月首次亮相,在當(dāng)年8 月迭代至V3版本并開始引發(fā)一定的關(guān)注,而今年更新的V5版本讓Midjourney及其作品成功“出圈”,代表作是上述的“中國情侶”圖片。
在這張圖片中,一對(duì)年輕中國情侶穿著夾克和牛仔褲坐在樓頂,背景是上世紀(jì)90年代的中國城市。由于在光影、人物細(xì)節(jié)、氛圍感等方面的出色刻畫,這張圖片甚至被一些網(wǎng)友認(rèn)為是一張真實(shí)拍攝的老照片,而非AI生成的圖片。
據(jù)外媒報(bào)道,自上線以來,Midjourney在圖像細(xì)節(jié)上一直在不停進(jìn)步。Midjourney官方表示,V5版本的圖像質(zhì)量更高、輸出更多樣化、有更廣泛的風(fēng)格、支持無縫紋理、有更寬的縱橫比、有更好的圖像提示以及更寬的動(dòng)態(tài)范圍等。
此外,該版本還大幅優(yōu)化了此前無法準(zhǔn)確生成人物手部的問題。一名使用過Midjourney的畫師告訴《環(huán)球時(shí)報(bào)》記者,在此前版本中,Midjourney對(duì)手部刻畫有很多問題,例如手指數(shù)量錯(cuò)誤或形態(tài)扭曲,這也是此前分辨圖片是否為AI生成的主要判斷依據(jù)。不過,Midjourney V5版本在這方面有了明顯提升,雖然仍能觀察到手部不自然的情況。
在V5版本之前,Midjourney已得到一系列應(yīng)用。去年9月,一幅名為《太空歌劇院》的作品獲得了美國科羅拉多州博覽會(huì)藝術(shù)比賽的金獎(jiǎng),這幅作品就是由Midjourney完成的。去年6月,英國雜志《經(jīng)濟(jì)學(xué)人》曾使用Midjourney設(shè)計(jì)過一期封面,以呼應(yīng)“AI新前沿”的封面故事主題。
《環(huán)球時(shí)報(bào)》記者近日也體驗(yàn)了Midjourney,該技術(shù)目前主要在通訊軟件Discord上以與“Midjourney bot”對(duì)話的形式使用。通過輸入提示詞的方式,記者可以讓Midjourney bot生成相應(yīng)的圖片,提示詞可以設(shè)定很多,還可以要求分辨率、是否寫實(shí)風(fēng)格等。通常Midjourney bot會(huì)在1分鐘左右生成4張圖片,用戶還可以要求重新生成。
在使用過程中,記者發(fā)現(xiàn)Midjourney的另一個(gè)問題:用戶只能通過提示詞來提出要求,但無法對(duì)圖片生成過程進(jìn)行控制或修改,圖片生成更像是一個(gè)“黑盒”。因此,用戶需要不斷更換或調(diào)整提示詞,讓生成的圖片更符合需求。創(chuàng)作出《太空歌劇院》的杰森·艾倫就曾對(duì)外媒透露,他總共生成了900多張圖片才挑選出滿意的作品。
背后是什么技術(shù)
業(yè)內(nèi)人士告訴《環(huán)球時(shí)報(bào)》記者,Midjourney是一種大模型生成式AI。2015年,谷歌公司的一名研究員創(chuàng)建了首個(gè)用于藝術(shù)創(chuàng)作的機(jī)器學(xué)習(xí)應(yīng)用 DeepDream。此后,AI圖像生成開始走進(jìn)大眾視野中。
一家知名跨國企業(yè)的AI算法工程師李濤告訴《環(huán)球時(shí)報(bào)》記者,基于擴(kuò)散模型,Midjourney打造了自己的閉源模型,通過抓取大量公開數(shù)據(jù)進(jìn)行訓(xùn)練。與此同時(shí),Midjourney也不斷收集用戶反饋數(shù)據(jù)并對(duì)模型進(jìn)行迭代,最終形成目前的成果。
擴(kuò)散模型屬于一種無監(jiān)督生成模型。計(jì)算機(jī)視覺處理開源軟件庫OpenCV負(fù)責(zé)人馬利克在接受外媒采訪時(shí)曾表示,擴(kuò)散模型利用從文本數(shù)據(jù)中獲得的知識(shí)來理解單詞集合在一起的語義,并與真實(shí)世界聯(lián)系起來,這使AI能夠在不依賴特定數(shù)據(jù)集的情況下生成更復(fù)雜和多變的圖像。馬利克認(rèn)為,擴(kuò)散模型是生成式AI的重大進(jìn)步,因?yàn)樗鼈儾灰蕾嚤O(jiān)督學(xué)習(xí)。通過利用從無監(jiān)督學(xué)習(xí)中獲得的知識(shí),這些模型可以生成復(fù)雜多樣的圖像,而無須手動(dòng)標(biāo)記數(shù)據(jù),從而使其更加靈活。
一段時(shí)間以來,不少公司均推出了AI圖片生成模型或相關(guān)產(chǎn)品。近日,微軟Bing宣布接入OpenAI的AI繪畫模型DALL·E,上線了AI生成功能,Adobe也為旗下的Firefly模型新增了AI繪圖產(chǎn)品。
“再無法相信自己的眼睛”
盡管憑借強(qiáng)大的圖片生成功能,Midjourney已經(jīng)獲得上千萬用戶,但它也受到大量的批評(píng)與質(zhì)疑,首當(dāng)其沖的就是版權(quán)問題。
美國《福布斯》雜志網(wǎng)站稱,與所有AI圖片生成工具一樣,Midjourney從互聯(lián)網(wǎng)上搜集了大量圖像進(jìn)行訓(xùn)練,使其能夠創(chuàng)作出看似全新的藝術(shù)作品,這引發(fā)了人類創(chuàng)造者的不滿。目前,已經(jīng)有不少機(jī)構(gòu)和個(gè)人對(duì)Midjourney發(fā)起起訴,指控該公司涉嫌廣泛地侵犯版權(quán)。
另據(jù)媒體報(bào)道,美國版權(quán)局近日宣布,Midjourney等生成的AI圖像不受版權(quán)保護(hù)。在說明文件中,美國版權(quán)局認(rèn)為,通過Midjourney等平臺(tái)自動(dòng)生成的作品,在整個(gè)創(chuàng)作過程中完全由機(jī)器人自動(dòng)完成,并且訓(xùn)練的數(shù)據(jù)是基于人類創(chuàng)作的作品,因此不受版權(quán)法保護(hù)。
上海申倫律師事務(wù)所律師夏海龍對(duì)《環(huán)球時(shí)報(bào)》記者表示,AI生成工具給人類的版權(quán)法帶來巨大沖擊。一方面,相較海量的AI生成作品,即使其中存在侵權(quán)情況,權(quán)利人也很難及時(shí)發(fā)現(xiàn);另一方面,在AIGC(人工智能生成內(nèi)容)時(shí)代,冗長(zhǎng)、昂貴的司法程序?qū)е聦?duì)版權(quán)保護(hù)也會(huì)越來越力不從心。人類的版權(quán)法以及著作權(quán)保護(hù)機(jī)構(gòu)恐怕不得不作出重大調(diào)整。
除版權(quán)問題外,越來越逼真的AI生成內(nèi)容也讓人擔(dān)心這些圖片、視頻可能會(huì)被用作非法用途,例如用AI生成的圖片進(jìn)行欺詐。美國前總統(tǒng)特朗普日前宣布,他將于21日被逮捕。隨后,大量通過AI生成的“特朗普被捕”圖片在社交媒體上傳播,誤導(dǎo)了一部分網(wǎng)友。印度News18新聞網(wǎng)則提到,近期有網(wǎng)友通過AI生成了一張美國前總統(tǒng)奧巴馬與德國前總理默克爾在海邊一起吃冰激凌的圖片,這讓人們更加擔(dān)心未來會(huì)出現(xiàn)怎樣的深度造假。該網(wǎng)站援引網(wǎng)友的評(píng)論稱,“這種技術(shù)正變得越來越可怕。技術(shù)越來越完善,目前的AI可以創(chuàng)建幾乎完美的名人聲音或圖片,我們可能很快再無法相信自己的耳朵和眼睛?!贝送?,也有家長(zhǎng)向《環(huán)球時(shí)報(bào)》記者表達(dá)了AI生成不當(dāng)圖片對(duì)兒童影響的擔(dān)憂。
互聯(lián)網(wǎng)專家郭濤對(duì)《環(huán)球時(shí)報(bào)》記者表示,當(dāng)前AIGC技術(shù)尚處于早期探索階段,相關(guān)法律法規(guī)、標(biāo)準(zhǔn)體系和倫理規(guī)范等還不健全,存在數(shù)據(jù)安全風(fēng)險(xiǎn)、著作權(quán)侵權(quán)風(fēng)險(xiǎn)、深度偽造風(fēng)險(xiǎn)、商業(yè)秘密泄露風(fēng)險(xiǎn)、違法信息傳播風(fēng)險(xiǎn)等問題。有關(guān)部門需要盡快建立健全相關(guān)法律法規(guī)和標(biāo)準(zhǔn)體系,加強(qiáng)內(nèi)容審查及內(nèi)容過濾,推動(dòng)行業(yè)健康可持續(xù)發(fā)展。
本網(wǎng)站及其公眾號(hào)為公益性網(wǎng)絡(luò)平臺(tái),所發(fā)圖文僅供傳播信息、介紹知識(shí)、說明問題之用;相關(guān)版權(quán)歸原作者所有,轉(zhuǎn)載請(qǐng)務(wù)必注明出處和作者。
稿件一經(jīng)選用,即視為作者同意本網(wǎng)免費(fèi)將其使用于本網(wǎng)或與本網(wǎng)有合作關(guān)系的非贏利性各類出版物、互聯(lián)網(wǎng)與手機(jī)端媒體及專業(yè)學(xué)術(shù)文庫等。
由稿件引起的著作權(quán)問題及其法律責(zé)任由作者自行承擔(dān)。
了解更多動(dòng)態(tài),請(qǐng)掃描二維碼,關(guān)注我們的微信公眾號(hào):