當前位置: 華文頭條 > 推薦

新AIGC「擴散模型」一步生成影像,速度提高30倍

2024-03-23推薦

「擴散模型」在人工智能內容生成(圖片生成)等方面具有重要的套用潛力,而自擴散模型問世以來,減少模型訓練的叠代次數一直是研究人員研究的重要問題。

麻省理工學院電腦科學與人工智能實驗室(CSAIL)的研究人員推出了一種新的模型框架——distribution matching distillation(DMD) 將傳統「擴散模型」的多步影像生成過程簡化為一個步驟 其影像質素與「StableDiffusion v1.5」影像生成工具相當,且生成速度比「 Stable Diffusion 」、「 DALLE-3 」模型提高了30倍。

新方法將生成對抗性網絡(GANs)的原理與擴散模型的原理結合在一起,在一個步驟中實作視覺內容生成,與當前「擴散模型」所需的數百個步驟叠代改進形成了鮮明對比,是一種新的生成式建模方法,在速度和質素方面表現出色。

DMD是第一種一步擴散模型生成技術,可以生成與原始、更復雜模型相當的圖片, 且在工業規模的文本到影像生成方面表現出色。在增強設計工具,實作更快的內容建立,支持藥物發現和3D建模等方面具有重要套用潛力。相關工作將在將在6月舉行的「電腦視覺和模式辨識」會議上進行發表。

AI generates high-quality images 30 times faster in a single step | MIT News | Massachusetts Institute of Technology