笔记本也能生成4096x4096图片?SANA轻松生成高分辨率图像!
创始人
2024-10-19 08:20:37
0

NVIDIA、麻省理工学院 (MIT) 和京都精华大学的研究团队发布了一款名为“Sana”的图像生成AI,它可以在几秒钟内生成分辨率高达4096×4096的图像。

以下是用Sana实际生成的图像范例。使用“astronaut in a jungle, cold color palette, muted colors, detailed,8k(丛林中的宇航员,冷色系,柔和的颜色,精细,8K)”的提示词,可以生成这样的图像:

使用“a cyberpunk cat with a neon sign that says“SANA”(一只带有写着“SANA”的霓虹灯的赛博庞克猫)”的提示词生成的图像是:

输入“portrait photo of a girl, photograph, highly detailed face, depth of field(女孩的肖像照片,写实,非常细致的脸部,景深)”的提示词,则生成了逼真的人物图像:

根据Sana的开发团队介绍,相较于传统只能压缩至8倍的自动编码器(Autoencoder),Sana能通过对最大32倍压缩的自动编码器进行训练,进而有效减少潜在标记的数量,实现高效的训练和4K超高分辨率图像的生成。

此外,Sana使用一个名为“Gemma”的语言模型作为文本编码器,专门负责解码器部分,这强化了对提示词的理解与推理表现。不同于以往的T5模型,Gemma具有更强的文本理解能力,这能在应对训练不稳定性时,改善图像与文本的对应关系。同时,为了减少采样步骤,Sana引入了名为“Flow-DPM-Solver”的机制,这使得采样步骤从“Flow-Euler-Solver”的28至50步减少到14至20步,从而实现了更有效的标签生成与选择。

通过这些努力,Sana在保持与“Flux”等最新的高性能图像生成AI相当的竞争力的同时,实现了超过100倍的图像生成速度。开发团队表示,参数大小为6亿的“SANA-0.6B”甚至可以部署在配备16GB内存容量GPU的笔记本上,生成1024×1024分辨率的图像只需1秒钟。以下是Sana图像生成时间的比较图,参数大小为16亿的“SANA-1.6B”可以1.2秒生成1024×1024的图像,15.9秒生成4096×4096的图像。此外,SANA-0.6B可以0.9秒生成1024×1024的图像,仅需9.6秒即可生成4096×4096的图像。

以下是一张Sana与各类图像生成AI的性能比较表,显示Sana的各个模型在生成速度和处理量上都远超其他图像生成AI。

目前,Sana的源码尚未公开,但预计将在近日内发布。

相关内容

热门资讯

字节被曝大模型训练遭实习生攻击... 【CNMO科技消息】10月18日,一则消息在微信群内广泛流传,声称某头部大厂的大模型训练遭遇实习生入...
山水论坛访谈 | 邓文中:发展... 人工智能如何赋能未来城市发展?10月18日,美国国家工程院院士、中国工程院外籍院士邓文中在第七届山水...
喜报!广药集团荣获两项2023... 转自:广药白云山 10月17日,全省科技大会在广州召开,会上颁发了2023年度广东省科学技术奖。广东...
国内首个五星5G工厂,特别在哪... 本文转自【央视新闻客户端】; 日前,国内首个五星5G工厂——中兴通讯南京智能滨江5G工厂通过中国信息...
导尿管扭结稳定性测试仪的性能参... 文章由济南乾元仪器有限公司提供 导尿管扭结稳定性测试仪是一种重要的医疗设备,专门用于测试导尿管在扭结...
数字化趋势中的石英晶体和振荡器 近年来,“物联网”(IoT)这个术语已经变得广为人知。物联网设备能够彼此无线通信,通常使用诸如WiF...
原创 苹... 10月份各大手机品牌都在陆续发布新一代旗舰机,毕竟高通和联发科的新一代旗舰芯片陆续登场。这次的新一代...
三星HBM3E仍未通过英伟达认... 10月17日消息,据韩国媒体ZDNet Korea报导,虽然三星今年以来积极地想通过英伟达HBM3E...
智能计算机模拟:探索复杂系统与... 计算机模拟:探索虚拟世界的工具 Computer Simulation: A Tool for E...
视频号文章跨平台分发有哪些利弊... 视频号文章跨平台分发的利弊分析及抖音批量发布视频策略 随着互联网的发展,内容创作者越来越多地采用跨平...
科技昨夜今晨1018:OPPO... “科技昨夜今晨”时间,大家好,现在是 2024 年 10 月 18 日星期五,今天的重要科技资讯有:...
笔记本也能生成4096x409... NVIDIA、麻省理工学院 (MIT) 和京都精华大学的研究团队发布了一款名为“Sana”的图像生成...
杨利伟曾在太空听见“敲门声”,... 阅读此文前,麻烦您点击一下“关注”,既方便您进行讨论与分享,又给您带来不一样的参与感,感谢您的支持。...
把握交通设备更新政策机遇 交通运输大规模设备更新,推动了老旧设备向高端、智能、绿色方向升级,能够显著提升供给体系质量效益。应强...
星动纪元完成近3亿元融资!大模... 本报(chinatimes.net.cn)记者石飞月 北京报道 大模型的东风刮过,不仅让芯片企业、芯...
微软Azure将调整中国内地O... 近日,微软宣布自2024年10月21日起,将停止向中国内地个人用户提供Azure OpenAI服务。...
建发股份在厦门成立科技公司 含... 松果财经讯,天眼查App显示,近日,厦门建悦钢丰科技有限公司成立,法定代表人为程东方,注册资本650...
广东电网申请设备漏电识别专利,... 金融界2024年10月18日消息,国家知识产权局信息显示,广东电网有限责任公司申请一项名为“设备漏电...
智慧中医元年,记者实探鹰眼智慧... 本报(chinatimes.net.cn)记者王悦 北京报道 弥漫着中草药味道的老药铺、正望闻问切的...
中山大学:解锁“AI+病毒学”... “通过LucaProt,我们发现了许多未研究过的病毒群体,以及具有特殊长度、复杂基因组结构的RNA病...