新AIGC「擴散模型」一步生成影像，速度提高30倍

2024-03-23推薦

「擴散模型」在人工智能內容生成（圖片生成）等方面具有重要的套用潛力，而自擴散模型問世以來，減少模型訓練的叠代次數一直是研究人員研究的重要問題。

麻省理工學院電腦科學與人工智能實驗室（CSAIL）的研究人員推出了一種新的模型框架——distribution matching distillation（DMD） ， 將傳統「擴散模型」的多步影像生成過程簡化為一個步驟 ， 其影像質素與「StableDiffusion v1.5」影像生成工具相當，且生成速度比「 Stable Diffusion 」、「 DALLE-3 」模型提高了30倍。

新方法將生成對抗性網絡（GANs）的原理與擴散模型的原理結合在一起，在一個步驟中實作視覺內容生成，與當前「擴散模型」所需的數百個步驟叠代改進形成了鮮明對比，是一種新的生成式建模方法，在速度和質素方面表現出色。

DMD是第一種一步擴散模型生成技術，可以生成與原始、更復雜模型相當的圖片，且在工業規模的文本到影像生成方面表現出色。在增強設計工具，實作更快的內容建立，支持藥物發現和3D建模等方面具有重要套用潛力。相關工作將在將在6月舉行的「電腦視覺和模式辨識」會議上進行發表。

AI generates high-quality images 30 times faster in a single step | MIT News | Massachusetts Institute of Technology