撰文/ 張 鷗
編輯/ 吳 靜
(資料圖片僅供參考)
設計/ 趙昊然
來源/ Driving.ca,作者:Elle Alder,圖源:AUTOMOTIVE.AI,STABLE DIFFUSION
如果將豐田Supra送回20世紀50年代會是什么樣子?如果寶馬早在1979年就開始出售與Wagoneer相媲美的X5又會如何?
現(xiàn)在,我們能夠用文字描述這些天馬行空的想象,并且利用計算機算法將它視覺化——新一代“人工智能”軟件可以快速圖像化我們腦海中的任何畫面。
這是一項在短短幾個月內(nèi)推動了整整一代人的技術,幫助人們充實想法,將從未出現(xiàn)過的事情圖像化看起來確實很有趣,但它也引發(fā)了有關創(chuàng)意倫理、數(shù)字權利,甚至整個創(chuàng)意產(chǎn)業(yè)未來的敏感問題。
AI愛好者倫尼·伍德(Rennie Wood)、3D渲染師阿比米萊克·阿雷拉諾(Abimelec Arellano)和底特律汽車設計師亞當·休伯斯(Adam Hubers)是不同類型的設計工作者,而他們的職業(yè)都與這種新技術息息相關。
通過AI文本-圖像生成器,用戶可以使用文字描述他們所想的東西,以此創(chuàng)建圖像。這些生成器通常通過網(wǎng)絡界面訪問,使用計算機學習來分析關鍵詞或句子的含義,利用模型從數(shù)十億現(xiàn)有圖像中學到的“知識”,最終拼湊出所述主題的視覺畫面。
用戶可以用具體的條件和參數(shù)來指導模型,以更緊密地定義他們所期望的結果,例如,“圓形的擋泥板后視鏡”,“在Indy 500的斜坡上賽車”,“數(shù)碼相機拍攝效果”,甚至“使用藝術家的風格”。
AI圖像生成已被證明是這一代最快、最引人注目的技術革新之一,公眾在短短一年的時間里見證了令人眼花繚亂的發(fā)展。2022年初,OpenAI推出Dall-E,標志著在半識別圖像方面的第一個主流文本-圖像生成器的成功。
如今流行的AI生成器將它們的知識建立在有標題的圖像數(shù)據(jù)庫上(從整個互聯(lián)網(wǎng)上搜刮而來),這個“語料庫”通常反映了已經(jīng)存在的圖像材料。一些開發(fā)者的模型訓練語料庫來源公開透明,另一些開發(fā)者則避而不談。對前者的分析顯示,大量未經(jīng)授權或受版權保護的材料來源于Pinterest等標簽豐富的素材網(wǎng)站,包括個人創(chuàng)作、商業(yè)來源,以及其他藝術家作品。
這意味著用戶可以指定某種類型,“借用”別人努力創(chuàng)造而來的美學風格。如果你選擇了梵高的風格去渲染一個物品,那可能沒關系,但如果你輸入的文本借鑒了一個當代藝術家的風格,并且未經(jīng)允許進行二次發(fā)布或商業(yè)用途,那就難堪了。
倫尼·伍德是一名攝影記者,木制玩具修復家和零售商,他同時也是網(wǎng)站Automotive.AI的創(chuàng)立人。這里夢幻般的汽車、場景吸引了成千上萬的Instagram粉絲。
伍德使用網(wǎng)絡上公開可用的AI生成器進行了一次又一次的試驗,他很快就找到了符合自己設想的方案。
“當我接觸到這一技術時,我想做的第一件事就是制作汽車,因為這是我小時候的夢想?!彼f。
網(wǎng)站的一些早期產(chǎn)物看起來相當糟糕,那個時候的文本處理似乎總是顯得不盡人意?!懊看斡腥耸褂盟?,它都在學習,現(xiàn)在的數(shù)據(jù)庫好多了。”伍德補充道。
他為自己的網(wǎng)站設置了公式,一套修飾語,以及一個每周都在改進的工具。一個30-50個字的長提示現(xiàn)在可以可靠地生成一個干凈的圖像。
伍德說:“攝影是一種減法藝術,它從存在的一切開始,然后通過改變你的位置、焦距和曝光,你可以消除東西。AI生成恰恰相反,它從一張空白的畫布開始。所以我很享受。”
在這之前,渲染這樣一個圖片往往需要特定技能,無論是用素描本還是用CAD。阿比米萊克·阿雷拉諾便是一位一直以來使用CAD的數(shù)字藝術家。
阿雷拉諾曾經(jīng)出版過自己的作品,他的“如果”系列作品跨越了50多個概念,設想了從1966年的阿斯頓-馬丁Cygnet到2014年的瑪莎拉蒂克萊斯勒TC。
在他年輕的時候,他沉浸在YouTube和論壇驅動的“虛擬調(diào)?!?,直到Photoshop的二維限制變得陳舊,他開始在Blender中自學三維建模,并使用Keyshot進行渲染,最后用Photoshop進行編輯。他現(xiàn)在使用這些技能為各種客戶承包項目,工作時間從幾小時到幾周不等。
阿雷拉諾承認,當他看到AI模型之后,他感到了一絲憤怒。
“我的工作就這樣沒了?!彼?。直到幾天后,一位轉而使用AI的老客戶重新找到了他——這個客戶稱,雖然人工智能很方便,但它缺乏人類的判斷力。
當然,這種引人注目的新工具總會有合適的用途。早在一些年前,美聯(lián)社已經(jīng)通過自動化系統(tǒng)輸出文章,如今的AI生成器則有可能影響到基本成像領域。
底特律的汽車設計師亞當·休伯斯曾在Stellantis擔任Ram 1500 Rev設計團隊的負責人,他提到了Photoshop剛剛興起的時候,他的許多前輩們一度非常擔心,不過他們很快把這個工具納入了自己的創(chuàng)作過程。
休伯斯表示,專業(yè)設計界的一些人同樣已經(jīng)開始嘗試將AI工具引入自己的工作流程。他說:“我不認為它會消除人類汽車設計者。”
部分原因是,真正的人工智能還不存在——這些系統(tǒng)仍然是參數(shù)化的,并依賴于現(xiàn)有的媒體,它們不會想象、無法表達偏好、不能構思出新的想法或創(chuàng)造根本性的東西。它們的輸出只可以反映現(xiàn)有的東西。
如果僅僅是出于愛好,為車型改朝換代,那就沒關系了。它能夠借鑒特定時代的既定設計語言和現(xiàn)有的模型陣容,使作品具有可信性和可識別性。伍德用AI生成的1979年寶馬X5看起來幾乎以假亂真,因為它主要借鑒了廣為人知的e12代設計線索,并將其延伸到寶馬今天的轎車風格。
令阿雷拉諾感到欣慰的是,他的客戶重視他作為人類設計師的能力——根據(jù)需求進行微調(diào)的能力,能夠處理特別精細的細節(jié)——這是AI無法做到的。
總的來說,三位創(chuàng)意工作者都認為這樣的工具更多的是作為一個墊腳石,幫助塑造或勾勒出模糊的想法。阿雷拉諾進一步強調(diào),這些工具特別有助于闡明那些看起來很直觀的解決方案,因為有時候,人們很容易將某些問題過度復雜化。休伯斯則表示它們提供了一種 “故事板”,可以繪制盲點,給出更多種可參考方案。
AI圖像生成從新奇的學術好奇心發(fā)展到范式轉變只用了不到一年的時間,而像ChatGPT這種語言模型的成熟也為書面文章等領域指向了類似的軌跡(和危機)。通過開放測試版供公眾使用,開發(fā)者甚至有效地加速了大眾的接受度和熱情。
通常來講,一個行業(yè)的專業(yè)化程度越高,受到軟件威脅的可能性就越小。
只不過可以肯定的是,短期內(nèi)的困難似乎是不可避免的,因為一些目光短淺的經(jīng)理人和風險資本類型的人已經(jīng)在研究如何裁員,用AI模型取代創(chuàng)意工作者。
阿雷拉諾表示,他看到的是一個復雜但最終令人鼓舞的畫面:“當它竊取藝術時,它讓你感到憤怒。但是,你可以剖析一下,它實際上根本無法取代一切?!?/p>
Copyright @ 2015-2022 中南網(wǎng)版權所有 備案號: 浙ICP備2022016517號-4 聯(lián)系郵箱:514 676 113@qq.com