AILSJ 3月5日最新消息,Stability AI 发布了关于其最新研究成果 Stable Diffusion 3 的研究论文。这篇论文深入探讨了 Stable Diffusion 3 的底层技术,这是一种文本到图像生成系统,据称在字体排版和提示遵循方面超越了现有的最先进系统,如 DALL·E 3、Midjourney v6 和 Ideogram v1。Stable Diffusion 3 采用了新的多模态扩散变换器(MMDiT)架构,该架构为图像和语言表示使用不同的权重集,从而提高了文本理解和拼写能力。
研究论文的主要要点包括:
这篇研究论文将在 arXiv 上提供,并且 Stability AI 邀请感兴趣的人注册等待列表,以参与 Stable Diffusion 3 的早期预览。
- 论文地址:https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf
- 官方博客:https://stability.ai/news/stable-diffusion-3-research-paper
Stable Diffusion 3 详细介绍,点此了解。