AI大模型训练数据版权问题凸显 优质训练数据库价值有望重估
金融界
2024-02-25 01:06:20

原标题:AI大模型训练数据版权问题凸显 优质训练数据库价值有望重估

知情人士称,美国社交媒体平台Reddit已同谷歌达成协议,将其内容用于训练后者的人工智能模型。据悉,协议价值约为每年6000万美元。Reddit已公开提交美国IPO文件,摩根士丹利、高盛、摩根大通及美国银行为牵头行。

近期,新闻出版巨头施普林格出版集团(Axel Springer)与ChatGPT开发机构OpenAI签署协议,成为全球第一家与OpenAI合作将新闻业与人工智能技术进行更深入整合的出版机构。银河证券指出,Open AI与Axel Springer签订的协议表明,人工智能在使用媒体品牌内容进行大模型训练时将需要向媒体品牌付费,这意味着AI大模型向数据提供方的知识产权付费或将成为行业趋势。当前AI政策密集出台,高质量数据集和训练数据版权问题得到重视,未来优质训练数据库的价值将得到凸显。出版行业公司大多拥有丰富的电子化的图文资源,这可以作为国内外大模型训练的重要数据集。出版行业公司在版权和IP上的资源优势有望助力其作为海内外AI大模型研发的重点助力。

据财联社主题库显示,相关上市公司中:

中信出版已尝试与作者和大模型公司合作语言训练,开发智能阅读应用产品。例如,公司旗下的知识服务平台与百度联合发布了“中信书院AI阅读助手”插件。

掌阅科技在文学和阅读领域的版权储备业内领先,这些中文语料可以用于网文行业垂类模型训练。公司与字节目前主要在数字阅读的版权、内容生产、广告商业化等多方面开展了深度合作。

来源:财联社

相关内容

热门资讯

原创 S... 哈喽,大家好呀,我是瑜瑜。王者荣耀 S42 赛季已经上线一段时间了。在当前的全分段中,有一个数据还是...
在东方明珠盖别墅,「姚先生」庆... 喜迎乔迁。 文/王丹 1月15日晚22点40分,上海东方明珠城市广场已闭园。 我在围栏外往里瞅了眼:...
西安纳谱申请电化学腐蚀装置及其... 国家知识产权局信息显示,西安纳谱科技有限公司申请一项名为“一种电化学腐蚀装置及其方法”的专利,公开号...
韩网热议T1战胜HLE,Fak... 2026LCK杯T1以2比1战胜HLE后,韩国FMKOREA论坛网友对此展开热议 大龙组的希望之...
开服不到一周,《逆战未来》遭遇... 开始之前先问问各位姬友,你过生日,朋友本来准备送你一个100元的高达模型,却因一时疏忽送你了一个30...