Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像
知新了了
2023-11-30 17:11:26

原标题:Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

即使在家里,Stable Diffusion XL Turbo(SDXL Turbo)也可以以惊人的速度创建详细的图像。

周二,Stability AI公司推出了一种人工智能图像合成模型“Stable Diffusion XL Turbo”,该模型可以根据书面提示快速生成图像。事实上,它的速度如此之快,以至于该公司将其标榜为“实时”图像生成,因为它还可以快速转换来自网络摄像头等来源的图像。

SDXL Turbo的主要创新在于它能够在一个步骤中产生图像输出,比其前身所需的20-50个步骤显着减少。Stability AI将这种效率的飞跃归功于一种被称为对抗性扩散蒸馏(ADD)的技术。ADD使用分数提取,其中模型从现有的图像合成模型中学习,以及对抗性损失,这增强了模型区分真实图像和生成图像的能力,提高了输出的真实性。

在周二发表的一篇专注于ADD技术的研究论文中,Stability AI详细介绍了该模型的内部工作原理。SDXL Turbo的优点之一是它与生成对抗网络(GAN)相似,特别是在产生单步图像输出方面。

SDXL Turbo图像不像在更高步数下生成的SDXL图像那么详细,所以它不被认为是以前型号的替代品。但就速度节省而言,结果令人瞠目结舌。

为了进行尝试,我们使用 Automatic111 在Nvidia RTX 3060上本地运行SDXL Turbo(权重与SDXL权重一样下降),它可以在大约4秒内生成3步1024×1024图像,而具有类似细节的20步SDXL图像则需要26.4秒。较小的图像生成速度要快得多(对于512×768而言,不到1秒),当然,更强大的显卡,如RTX 3090或4090,也将允许更快的生成时间。与Stability的营销相反,我们发现SDXL Turbo图像在每张图像大约3-5步处具有最佳细节。

SDXL Turbo的生成速度就是所谓的“实时”。Stability AI表示,在NVIDIA A100(一款强大的AI调整图形处理器)上,该模型可以在207ms内生成一张512×512图像,包括编码、单个去噪步骤和解码。如果能够解决一致性问题,这样的速度可能会导致实时生成AI视频过滤器或实验性视频游戏图像生成。在这种情况下,一致性意味着在多个帧或代之间保持相同的主题。

目前,SDXL Turbo是在非商业研究许可证下提供的,限制其用于个人非商业目的。这一举措已经在Stable Diffusion社区受到了一些批评,但Stability AI表示对商业应用持开放态度,并邀请感兴趣的各方联系以获取更多信息。

与此同时,Stability AI本身也面临着内部管理问题,一位投资者最近敦促首席执行官埃马德·莫斯塔克(Emad Mostaque)辞职。据报道,Stability AI管理层一直在探索将公司出售给更大实体的可能性,但这并没有放慢Stability AI发布的节奏。就在上周,该公司发布了一款名为“稳定视频扩散”(Stable Video Diffusion)的软件,可以将静止图像转换为短视频剪辑。

Stability AI在其图像编辑平台Clipdrop上提供了SDXL Turbo功能的测试版演示。你也可以在 Hugging Face 上免费试用一个非官方的现场演示。显然,所有常见的警告都适用,包括缺乏训练数据的来源和滥用的可能性。即使有这些悬而未决的问题,人工智能图像合成的技术进步肯定不会放缓。

如果朋友们喜欢,敬请关注“知新了了”!

相关内容

热门资讯

华为渠道服突发大规模账号异常,... IT之家 3 月 17 日消息,据多位IT之家小伙伴反馈,华为渠道服游戏今日突发大规模账号异常,大量...
看青少年用机器人助力保障粮食安... 3月15日,联合国“机器人向善青少年挑战”中国区活动在复旦大学举行,来自全国多地的10至18岁青少年...
诺亚方舟塑业取得双面插合式塑料... 国家知识产权局信息显示,山东诺亚方舟塑业股份有限公司取得一项名为“双面插合式塑料托盘”的专利,授权公...
原创 让... 我在2023年开始使用Claude,2025年初被封号,失去所有对话记录,怎么申诉都没用。甚至通过苹...
OPPO Find N6评测:... 过去几年,折叠屏手机完成了从“尝鲜”到“常用”的跨越,也让越来越多人开始爱上这种全新的产品形态。然而...