被StabilityAI滥用1200万张图后,全球最大图片商也训练了一个生成AI,效果逼真
机器之能
2023-09-26 20:21:55
0

原标题:被StabilityAI滥用1200万张图后,全球最大图片商也训练了一个生成AI,效果逼真

机器之能报道

编辑:吴昕

除了版权安全,Getty Images 新工具还有一个明显的特点,就是并不关心现实世界。

高一尺,魔高一丈。

早些时候,全球最有影响力的传统图片经销商之一 Getty Images 起诉 Stability AI 在训练图生文工具 Stable Diffusion 时,滥用超过 1200 万张自家照片。

今天,Getty Images 双管齐下:面向数十万用户,推出一款新的图像生成工具( AI Generator )。自此,用户可以在 Getty Images 授权照片库里放飞创意和想象力。

和 OpenAI 的 DALL-E 3 、Midjourney 等主流文生图平台一样,这款生成工具会根据用户的文本描述或者提示来渲染图像:

比如,「一个布满棕榈树的热带沙滩岛屿」

「黎明时分,一棵拥有巨大手臂的粉红色塑料仙人掌,矗立在沙漠中,超广角。」

森林里,一座粉色棉花糖做的建筑,神奇、蓬松、奇怪并充满幻想。

Getty images 的生成 AI 工具使用了英伟达最新一代的 Edify 模型架构进行训练(该架构也是 NVIDIA Picasso 的一部分),专门接受了 Getty Images 庞大的优质摄影和插图内容库的训练,确保了生成图片高质量、真实的视觉效果。

为此,科技媒体 Verge 记者 Emilia David 亲自体验了一把,看看生成的照片(而不是插图)效果到底有多逼真?

「在背景稍微模糊的舞台上,芭蕾舞演员展示阿拉贝斯克舞姿(单腿站立,另一条腿放在后面)」

Getty Images 生成人工智能工具的屏幕截图

看来,这款工具在渲染逼真的人物形象方面做得很好。她也在 Stable Diffusion 尝试了同样要求,感觉 「Getty 生成的照片更加人性化。

记者将图片发给朋友,后者误将 Getty 生成的图片认为是真实照片。「很明显,这个模型不仅接受插图艺术训练,还接受真实照片训练。

「效果比预期的要好。」在她看来。不过,Getty Images 库存照片本来就有一种「缺乏灵魂、人造的气质」,因此,这种数据集训练出来的生成器也更容易生产类似让人缺乏感觉的图片。

记者坦言,这种感觉并非 Getty 的生成式人工智能工具所独有,OpenAI 即将推出的 DALL-E 3 生成的照片,「也让我也有同样的想法。

与市面上主流图生文大模型不同,Getty images 生成 AI 基于一个「精心策划和干净的数据集」。

除了数据版权合法,他们还事先剔除了有被深度伪造滥用风险内容的图片。比如,涉及知名公众人物(安迪·沃霍尔)、真实地点(五角大楼)、知名品牌(巴黎世家)的内容。因此,类似 「乔·拜登位于白宫前」、「安迪·沃霍尔风格的猫」的要求都不会被支持。

Getty 声称,这个模型实际上不知道教皇、安迪·沃霍尔、乔·拜登或任何其他现实世界的人是谁,也不知道五角大楼、巴黎世家是什么,「因为它不想操纵或重现现实生活中的事件。

当然,最重要的是——这款人工智能生成的图像作品也是「商业安全的」,没有「知识产权风险」。用户可以通过 API 将该工具集成到自己的工作流程中,其使用人工智能生成的所有内容都将属于用户,不会添加到公司现有的内容库中。

工具也会为其创建的所有图像加上一个水印,以表明它们是人工智能生成。Getty Images 也为被使用图片的作者提供了 spotify 式的报酬模式

在过去的一年里,图像和文本的生成人工智能系统蓬勃发展。但人工智能公司也卷入了无数关于版权内容的法律纠纷。著名艺术家和作家——最近的是 John Grisham 、 Jodi Picoult 和 George R.R. Martin ——起诉 OpenAI 和 Stability AI 等人工智能公司侵犯版权。

作为世界上最大的图片机构之一 Getty images 拥有超过 1.6 亿张受版权保护的图像。在推出自己的工具之前,Getty images 一直直言不讳地批评生成 AI 产品,如 Stable Diffusion,该产品是在其图像内容库的一个子集上训练的,却没有通知或补偿 Getty images 的贡献者。

「在许多情况下,对更高质量的数据(如 Adobe 或 Getty 数据集)进行培训比不分青红皂白地抓取网络产生更好的结果。」该公司指出。

不过,一些开发生成式人工智能工具(包括 Stability AI )的公司认为,他们的内容抓取实践受到合理使用原则的保护——至少在美国是这样。

但这个问题不太可能很快得到解决。现在,通过建立自己的生成人工智能图像平台,Getty images 可以削弱其他想要使用其图像库来训练模型的公司。

事实上,Getty images 并不是唯一一家利用其许可数据建立人工智能图像平台的公司。Adobe 发布了 Firefly 模型,在其 Creative Suite 和 Creative Cloud 服务中对其许可图像进行了训练。

人工智能初创公司 Bria 提供了一个生成式 AI 艺术工具,该工具根据 Bria 从合作伙伴那里获得许可的内容进行训练,包括个人摄影师和艺术家,以及媒体公司和库存图像存储库,这些公司获得了公司收入的一部分。

与此同时,最近推出的头像创作者 Ascendant Art 也承诺向自愿提交作品以训练其模型的艺术家支付版税。

Getty images 还表示,客户最终可以添加自己的数据来训练模型并生成具有其品牌风格的图像。此功能和其他服务将于今年晚些时候推出。

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

相关内容

热门资讯

解码人类的“生命天书” 李斌 《生命天书:无尽的探索》 李斌 著 北京联合出版公司 2024年是“现代遗传学之父”孟德尔逝...
赛轮轮胎取得一种吨包解包设备专... 金融界 2024 年 9 月 18 日消息,天眼查知识产权信息显示,赛轮集团股份有限公司取得一项名为...
安凯微申请一种时钟抖频数字电路... 金融界2024年9月18日消息,天眼查知识产权信息显示,广州安凯微电子股份有限公司申请一项名为“一种...
推进文化和科技深度融合 加快发... 导读:随着新一轮科技革命和产业变革的加速推进,5G、云计算、VR、3D视觉传感、人工智能等新技术迭出...
欧康维视生物-B获批准OT-1... 来源:财中社 财中社9月19日电欧康维视生物-B(01477)发布公告,董事会欣然宣布其抗过敏特性的...
EA 首席执行官:AI 现在是... IT之家 9 月 18 日消息,EA 今天召开了投资者大会,其高管们对各种形式的生成式 AI 表达了...
静安多个作品入围“2024上海... 为推动“随申码”扩大覆盖场景、提升使用率、更好赋能城市数字化转型,2024上海“随申码”应用创新大赛...
揭秘“天下第一潮”:钱塘江潮汐... 图片来源:浙江在线 浙江·钱塘江 大家是否曾想象过,那震撼人心的钱塘江大潮,除了月球与太阳的引力牵引...
华为全联接大会聚焦智能化共赢,... 近日,第九届华为全联接大会在上海召开,主题为“Amplify Intelligence 共赢行业智能...
原创 腾... 这互联网江湖真是风云变幻啊!前几天我还在感叹腾讯多厉害,没想到一转眼就被字节跳动给比下去了。这简直就...
山东通维信息工程取得基于物联网... 金融界 2024 年 9 月 18 日消息,天眼查知识产权信息显示,山东通维信息工程有限公司取得一项...
iPhone16卖不动,苹果先... 图源:苹果官网 9月19日,天风国际证券分析师郭明錤在X平台发文称,目前已经有苹果公司员工通过员工...
华为全联接大会2024启幕 华... 9月19日,华为全联接大会2024在上海启幕,华鲲振宇作为华为“鲲鹏&昇腾”唯一双战略级合作伙伴在华...
严牌股份取得一种丙纶机织滤布专... 金融界 2024 年 9 月 18 日消息,天眼查知识产权信息显示,浙江严牌过滤技术股份有限公司取得...
原创 热... 在当今智能手机市场,千元机以其独特的定位——功能全面、价格亲民、日常体验出色,成为了众多消费者的首选...
全球逾3000件工业设计创新成... 中新社雄安9月19日电 河北国际工业设计创新成果展览会公众开放日19日在雄安新区启帷,全球逾3000...
工控机艾讯ipc964:坚固耐... 在工业自动化和智能制造的快速发展中,工业平板电脑因其强大的功能和灵活性,成为提升生产效率和智能化水平...
能源互联岛,陕鼓的双碳转身和雄... 每经记者 夏子博每经编辑 张静 随着“双碳”政策频出,传统产业低碳转型压力越来越大。为企业提供绿色...
2024年高端电视市场:LCD... 大家好,来聊聊电视圈的最新动态!2024年,高端电视市场终于迎来了大复苏,第一季度就展现出了强劲的增...
开创新模式!我国首个深水油田二... 9月19日,记者从中国海油获悉,我国首个深水油田二次开发项目——流花11-1/4-1油田二次开发项目...