• <span id="n97xl"><optgroup id="n97xl"></optgroup></span>
          1. <li id="n97xl"></li>
            <label id="n97xl"><meter id="n97xl"></meter></label>

              【CVPR2024】阿里云人工智能平臺(tái)PAI圖像編輯算法論文入選CVPR2024

                 2024-06-17 5444
              核心提示:在阿里云人工智能平臺(tái)PAI算法團(tuán)隊(duì)和華南理工大學(xué)的老師學(xué)生們一同的堅(jiān)持和熱情下,將阿里云在圖像生成與編輯領(lǐng)域的先進(jìn)理念得以通過(guò)學(xué)術(shù)論文和會(huì)議的形式,向業(yè)界傳遞和展現(xiàn)。
               近期,阿里云人工智能平臺(tái)PAI發(fā)表的圖像編輯算法論文在CVPR-2024上正式亮相發(fā)表。論文成果是阿里云與華南理工大學(xué)賈奎教授領(lǐng)銜的團(tuán)隊(duì)共同研發(fā)。CVPR(計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議)是計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域的頂級(jí)國(guó)際會(huì)議,旨在展示最新的研究進(jìn)展和技術(shù)成就,推動(dòng)這一領(lǐng)域理論與應(yīng)用的前沿進(jìn)展,并通過(guò)精選提交的高水平學(xué)術(shù)論文和實(shí)踐工作,對(duì)學(xué)術(shù)界和工業(yè)界產(chǎn)生深遠(yuǎn)的影響。此次入選標(biāo)志著阿里云人工智能平臺(tái)PAI自主研發(fā)的圖像編輯算法達(dá)到了先進(jìn)水平,贏得了國(guó)際學(xué)術(shù)界的認(rèn)可。在阿里云人工智能平臺(tái)PAI算法團(tuán)隊(duì)和華南理工大學(xué)的老師學(xué)生們一同的堅(jiān)持和熱情下,將阿里云在圖像生成與編輯領(lǐng)域的先進(jìn)理念得以通過(guò)學(xué)術(shù)論文和會(huì)議的形式,向業(yè)界傳遞和展現(xiàn)。

              基于文本引導(dǎo)的圖像編輯任務(wù)允許用戶使用簡(jiǎn)單的文字描述來(lái)指導(dǎo)修改一幅圖像,無(wú)需具備復(fù)雜的圖像編輯軟件或?qū)I(yè)知識(shí)即可實(shí)現(xiàn)編輯效果。用戶可以通過(guò)輸入文本對(duì)圖像進(jìn)行涉及顏色變更、物體添加或去除、風(fēng)格轉(zhuǎn)換等多種編輯的操作。這種交互式的編輯方式大大降低了圖像編輯的門檻,使得創(chuàng)意表達(dá)更加便捷和個(gè)性化。

              目前的一些先進(jìn)圖像編輯方法,例如prompt-to-prompt(P2P),通過(guò)替換與目標(biāo)編輯術(shù)語(yǔ)相對(duì)應(yīng)的源提示中的交叉注意力圖來(lái)改變圖像的特定區(qū)域。而Plug-and-Play(PnP)策略則是先從注意力層提取原始圖像的空間特征和自注意力,再將它們注入到目標(biāo)圖像的生成過(guò)程中。在這些技術(shù)中,注意力層對(duì)于控制圖像布局以及確立輸入提示與生成圖像之間的關(guān)聯(lián)起著至關(guān)重要的作用。但是,對(duì)注意力層的不恰當(dāng)調(diào)整可能會(huì)帶來(lái)意外的編輯結(jié)果或者編輯失敗。例如,在交叉注意力層進(jìn)行編輯時(shí),真實(shí)圖像可能因此而失去預(yù)期效果,如嘗試將人類編輯成機(jī)器人或?qū)⑵囶伾兏鼮榧t色的編輯嘗試可能不會(huì)成功。

               

               

              圖1. 圖像編輯的失敗案例以及我們提出的方法成功編輯的結(jié)果

               

              在我們的研究中,我們介紹了一種名為Free-prompt-Editing(FPE)的簡(jiǎn)潔而高效的算法。FPE通過(guò)在去噪階段替換指定注意力層的自注意力圖進(jìn)行圖像編輯,這一過(guò)程中解放了需要源提示的限制,這對(duì)實(shí)際的真實(shí)圖像編輯場(chǎng)景極有價(jià)值??傮w來(lái)說(shuō),我們的研究促進(jìn)了對(duì)穩(wěn)定擴(kuò)散(Stable Diffusion)中注意力圖的理解,并針對(duì)文本引導(dǎo)的圖像編輯(Text-Image-Editing,簡(jiǎn)稱TIE)提供了切實(shí)可行的解決策略。圖2展示了FPE算法在合成圖像上實(shí)施編輯的具體過(guò)程。

               

               

              圖 2:Free-prompt-Editing 在對(duì)合成圖像進(jìn)行編輯的過(guò)程示意圖

               

              Free-prompt-Editing偽代碼如下:

               

               

              圖 3:Free-prompt-Editing 在合成圖像編輯和真實(shí)圖像編輯場(chǎng)景下的偽代碼

               

              圖4展示了FPE的編輯結(jié)果,它成功地轉(zhuǎn)換了原始圖像的各種屬性、風(fēng)格、場(chǎng)景和類別。

               

               

              圖 4:Free-prompt-Editing 編輯結(jié)果示例

               

              圖5呈現(xiàn)了FPE技術(shù)應(yīng)用于基于穩(wěn)定擴(kuò)散算法的其他定制模型中的編輯效果。觀察這些成果,我們可以發(fā)現(xiàn)FPE技術(shù)能夠高效地適用于各種擴(kuò)散模型。它不僅成功實(shí)現(xiàn)了性別轉(zhuǎn)換,把女孩變?yōu)槟泻?,還能夠調(diào)整人物的年齡,使男孩呈現(xiàn)出10歲或80歲的特征;此外,它還能修改發(fā)型、變換頭發(fā)色彩、替換背景乃至進(jìn)行類別上的轉(zhuǎn)變。

               

               

              圖 5:Free-prompt-Editing 編輯結(jié)果示例

               

              圖6對(duì)比展示了FPE與其他一些SOTA圖像編輯技術(shù)的效果。無(wú)論是對(duì)真實(shí)照片還是合成圖像,F(xiàn)PE均展現(xiàn)出了高效的編輯能力。在所有的案例中,F(xiàn)PE都能夠?qū)崿F(xiàn)與描述提示高度一致的精細(xì)編輯,同時(shí)最大限度地保留了原圖的結(jié)構(gòu)細(xì)節(jié)。

               

               

              圖 6:Free-prompt-Editing 與其他編輯方法的對(duì)比

               

              為了更好地服務(wù)開(kāi)源社區(qū),這一算法的源代碼即將貢獻(xiàn)在自然語(yǔ)言處理算法框架EasyNLP中,歡迎各界從業(yè)人員和研究者使用。

              阿里云人工智能平臺(tái)PAI長(zhǎng)期招聘正式員工/實(shí)習(xí)生。團(tuán)隊(duì)專注于深度學(xué)習(xí)算法研究與應(yīng)用,重點(diǎn)聚焦大語(yǔ)言模型和多模態(tài)AIGC大模型的應(yīng)用算法研究和應(yīng)用。簡(jiǎn)歷投遞和咨詢:chengyu.wcy@alibaba-inc.com。

              論文信息

              論文名字:Towards Understanding Cross and Self-Attention in Stable Diffusion for Text-Guided Image Editing

              論文作者:劉冰雁、汪誠(chéng)愚、曹庭鋒、賈奎、黃俊

              論文pdf鏈接:https://arxiv.org/abs/2403.03431

               

               
              分享到: 0
              收藏 0
               
              更多>同類資訊
              免責(zé)申明
              推薦資訊
              點(diǎn)擊排行
              最新資訊更多>
              最新供應(yīng)更多>
              網(wǎng)站首頁(yè)  |  聯(lián)系方式  |  關(guān)于我們  |  問(wèn)題解析  |  版權(quán)隱私  |  使用協(xié)議  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務(wù)  |  積分換禮  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  粵ICP備1207862號(hào)

              中國(guó)智能化網(wǎng)(zgznh®)--引領(lǐng)工業(yè)智能化產(chǎn)業(yè)發(fā)展 共享智能化+優(yōu)質(zhì)平臺(tái)

              版權(quán)所有:深圳市智控網(wǎng)絡(luò)有限公司 學(xué)術(shù)指導(dǎo):深圳市智能化學(xué)會(huì)

              粵ICP備12078626號(hào)

              深公網(wǎng)安備案證字第 4403101901094 號(hào) | 粵公網(wǎng)安備 44030702001206號(hào)

               
              主站蜘蛛池模板: 亚洲综合色婷婷七月丁香| 99久久国产综合精品网成人影院 | 欧美久久综合九色综合| 欧美激情综合网| 青青综合在线| 国内精品综合久久久40p| 色欲天天天综合网| 伊人色综合久久天天人手人婷| 亚洲综合图色40p| 色婷婷综合久久久久中文一区二区| 亚洲啪啪综合AV一区| 狠狠色狠狠色综合网| 国产在线五月综合婷婷| 一个色综合久久| 亚洲综合国产精品| 亚洲欧美日韩综合| 日韩亚洲人成在线综合日本| 人人妻人人狠人人爽天天综合网 | 婷婷色香五月激情综合2020| 国产福利电影一区二区三区久久久久成人精品综合 | 天天综合久久久网| 久久综合给合久久国产免费 | 国产在线一区二区综合免费视频 | 国产色婷婷五月精品综合在线 | 久久精品桃花综合| 日本一道综合色视频| 99热婷婷国产精品综合| 亚洲国产综合91精品麻豆| 亚洲日本国产综合高清| 亚洲国产综合专区电影在线| 国产成人综合在线观看网站| 一本色综合网久久| 狠狠色婷婷七月色综合| 色欲色香天天天综合网站| 激情综合色五月丁香六月欧美| 亚洲 欧洲 日韩 综合在线| 91精品国产综合久久婷婷| 欧美伊人久久大香线蕉综合| 国产色综合久久无码有码| 一个色综合久久| 亚洲精品第一国产综合境外资源|