《专利态势报告 - 生成人工智能 (GenAI)》(内容出品方:世界知识产权组织)全文近7万字
2024 年 7 月 3 日,世界知识产权组织 (WIPO) 发布重磅《生成式人工智能(GenAI)专利态势报告 》。报告显示,中国发明申请的生成人工智能 (GenAI) 专利数量最多,远远超过排名前五的其他美国、韩国、日本和印度的发明。
近年来,人工智能技术在公众和媒体中的关注度急剧上升。然而,人工智能并不是一个新的研究领域。包括理论数学家艾伦-图灵在内的美国和英国科学家早在 20 世纪 30 年代和 40 年代就已经开始研究机器学习,尽管人工智能一词直到 20 世纪 50 年代才开始流行起来(McCarthyet al.
20 世纪 50 和 60 年代,人们对自然语言处理、机器学习和机器人等许多人工智能领域的兴趣激增。当时一些科学家预测,在一代人的时间内,就会出现与人类一样智能的机器(明斯基,1967 年)。事实证明,这些预测过于乐观。由于当时计算能力和算法方法的限制,研究进展停滞不前。因此,研究资金干涸了,这导致了20 世纪 70 年代的第一个 "人工智能寒冬"。在随后的几十年里,人工智能研究强度高的时期与活动较少的时期交替出现。
长期以来,人工智能算法和软件都是根据程序员指定的明确逻辑规则和参数,为特定目的而开发的。即使是现在,许多人工智能应用也依赖于基于规则的决策:如果这样,那么那样。例如,虚拟助手(Siri、Alexa 等)本质上是命令控制系统。它们只能理解有限的问题和请求,无法适应新情况。它们无法将自己的 "知识 "应用于新问题或处理不确定性。
现代人工智能的蓬勃发展始于21st 世纪初,此后一直呈上升趋势。如今,人工智能和机器学习已应用于无数领域,包括搜索引擎、推荐系统、定向广告、虚拟助手、自动驾驶汽车、自动语言翻译、面部识别等。人工智能的兴起主要受到以下因素的推动:
更强大的计算机:1965 年,戈登-摩尔(Gordon Moore)发现,计算机芯片上的晶体管数量大约每两年翻一番,并预测这种情况还将持续 10 年(摩尔,1965 年)。半个多世纪以来,摩尔定律一直有效。这种指数级的增长转化为越来越强大的人工智能系统,通常还具有人工智能特定的增强功能。
大数据:其次,数据的可用性同样呈指数级增长。这为人工智能算法提供了强大的训练数据源,使使用数十亿张图片或千亿个文本来训练模型成为可能。
OpenAI 的 ChatGPT 聊天机器人于 2022 年 11 月发布,大大提高了公众对生成式人工智能(GenAI)的热情。包括英伟达(Nvidia)首席执行官黄仁勋在内的许多人都将其形容为 GenAI 的 "iPhone 时刻"。这是因为 OpenAI 平台让所有用户都能更容易地访问高级 GenAI 程序,尤其是大型语言模型(LLM)。这些模型的性能达到了新的水平,展示了在各种现实世界应用中的潜力,引发了一波研发热潮,并吸引了大量企业投资 GenAI。
过去几年中,GenAI 的兴起主要受到三个因素的推动:更强大的计算机、作为训练数据来源的大型数据集的可用性以及人工智能/机器学习算法的改进。LLM 中的Transformer架构等发展极大地推动了 GenAI 的发展。这使得在许多不同领域开发复杂应用成为可能。
GenAI的技术进步体现在专利活动的急剧增加上。在过去 10 年中,GenAI 的专利族数量从 2014 年的仅 733 项增长到 2023 年的 14000 多项。自 2017 年引入Transformer(已成为 GenAI 代名词的大型语言模型背后的深度神经网络架构)以来,GenAI 专利数量增长了 800% 以上。同期发表的科学论文数量增幅更大,从 2014 年的 116 篇增加到 2023 年的 34,000 多篇。仅在 2023 年就有超过 25% 的 GenAI 专利和超过 45% 的 GenAI 科学论文发表。
腾讯、平安保险集团和百度拥有最多的GenAI 专利。腾讯计划在微信等产品中加入 GenAI 功能,以改善用户体验。中国平安专注于用于承保和风险评估的 GenAI 模型。百度是 GenAI 领域的早期参与者之一,最近发布了最新的基于 LLM 的人工智能聊天机器人 ERNIE 4.0。中国科学院(第四)是排名前十的唯一研究机构。阿里巴巴(第六)和百泰(第九)是进入前十名的其他中国公司。
IBM(第五)、Alphabet/谷歌(第八)和微软(10th )是拥有 GenAI 专利最多的美国公司。IBM 开发了一个 GenAI 平台--watsonx,使公司能够部署和定制 LLM,重点关注数据安全性和合规性。Alphabet/Google 的人工智能部门 DeepMind 最近发布了最新的 LLM 模型 Gemini,该模型正逐步集成到 Alphabet/Google 的产品和服务中。微软是 GenAI 的另一个重要参与者,也是 OpenAI 的投资者。OpenAI 本身最近才申请了第一批 GenAI 专利。排在前十位的是来自大韩民国的电子企业集团三星电子(第七位)。
自2010 年以来,中国科学院发表了 1100 多篇科学论文,在科学论文发表量方面遥遥领先。清华大学和斯坦福大学紧随其后,分别发表了 600 多篇论文。Alphabet/谷歌(第四)是唯一一家进入前20名的公司(556篇科学出版物)。
然而,如果以引用次数来衡量科学出版物的影响力,公司则占据主导地位。Alphabet/Google 以较大优势成为领先机构,另有七家公司进入前 20 名。
根据专利上公布的发明人地址,2014 年至 2023 年间,总部设在中国的发明人负责了 38 000 多个专利族。自 2017 年以来,中国每年在该领域公布的专利数量超过了其他所有国家的总和。
在2014 年至 2023 年期间,美国将拥有约 6,300 项专利家族,是 GenAI 专利申请的第二大重要研究地点。亚洲国家大韩民国、日本和印度是 GenAI 的其他重要研究地点,均位居全球前五位。英国是欧洲的领头羊(全球第六),同期公布了 714 项专利。不过,德国紧随其后(708 项专利),近年来公布的 GenAI 专利数量超过了英国。在与 GenAI 相关的全球专利申请活动中,这些顶级发明地占了大多数(94%)。
由于ChatGPT 的成功,OpenAI 已成为公众眼中 GenAI 的代名词。然而,直到 2023 年初,OpenAI 似乎都没有为其研究活动申请任何专利。对此的一种解释可能是 OpenAI 的非营利性起源。最初,OpenAI 是作为一个非营利组织成立的,该组织鼓励其研究人员发表和分享他们的研究成果,以 "最有可能造福人类的方式实现数字智能"。
中国是所有GenAI 应用的主要发明地。在软件/其他应用、文件管理和出版、银行和金融、能源管理、制图和工业产权、法律、社会和行为科学等领域,中国的相对领先优势尤为明显。
美国位居第二,在物理科学与工程、生命科学与医学、军事、农业、娱乐和教育领域的所有 GenAI 专利家族中占有很高的份额。
大韩民国在商业解决方案、教育和农业领域的 GenAI 专利家族数量相对较多。相对而言,日本在娱乐、艺术和人文领域的研究实力较强。印度在网络和智能城市领域的GenAI专利家族数量高于平均水平。英国在物理科学和工程学领域表现突出。德国在物理科学和工程学以及工业和制造业方面具有良好的科研实力。
GenAI 的出现将对各行各业产生重大影响,为公司、组织和个人提供前所未有的数据创建、合成和操作能力。然而,人们也对 GenAI 模型和工具的使用日益增多感到担忧,从侵犯版权和可能的滥用,到失业风险,不一而足。
GenAI 对劳动力市场的影响:就对就业的影响而言,人们普遍担心的是,随着机器有能力执行以前由人类完成的任务,GenAI 将导致许多行业大量失业。高盛(Goldman Sachs)最近的一项研究预测,GenAI 将极大地扰乱劳动力市场,全球主要经济体中约有 3 亿工人将在一定程度上受到影响。
然而,不同的工作所产生的影响将大不相同。事实上,许多职业都将受益于 GenAI 工具,这些工具可以补充他们的工作,提高他们的能力,让专业人员专注于更高层次、更具战略性的工作。因此,与之前其他形式的自动化一样,GenAI 应能促进 GDP 增长,提高整体收入水平,尤其是对各国而言。
然而工作肯定有被淘汰的风险,对人工智能敏感的个人需要有针对性的支持,以过渡到新的机会,并为新出现的角色进行再培训。此外,与以往主要影响中等技能工人的自动化浪潮不同,人工智能淘汰的风险延伸到某些高薪职位,如某些类型的数据分析师、市场研究分析师、簿记员或律师助理。
GenAI 在版权和知识产权保护方面的作用:人们还对GenAI 艺术、文本和代码以及训练数据的潜在版权侵权问题表示担忧。人工智能模型可能会生成与现有作品非常相似的文本、图像和音频,从而可能侵犯版权。因此,版权问题已经在一些司法管辖区引发了争论。例如,在美国,艺术家、作家和其他人提起诉讼,指控 OpenAI 等大型人工智能公司使用他们的作品。
在未经许可的情况下,受版权保护的作品被用来训练人工智能系统(Brittain,2023 年)。另一个备受争议的问题是人工智能发明是否可以申请专利,因为人工智能模型和工具在创新活动中发挥着越来越重要的作用。例如,美国联邦巡回法院最近的一项裁决指出,纯粹由人工智能机器开发的发明不能申请专利,而人类在人工智能协助下完成的发明则可以申请专利(Nemec and Rann 2023)。
上述例子并非详尽无遗,全面考虑围绕知识产权和GenAI 的各种法律问题超出了本研究的范围。其他值得关注的领域包括 "深度伪造"(deepfakes)。"深度伪造 "是指未经某人同意,将其肖像植入另一视频的虚假图像或视频。由于 GenAI 可以创建高度逼真和令人信服的内容,这些深度伪造的内容可被用于恶意目的,如传播竞选期间的错误信息。
此外,虽然 GenAI 模型的能力近年来有了显著提高,但这些模型有时仍会产生不正确的结果。例如,聊天机器人的回答可能听起来令人信服,但可能是错误的(如人工智能幻觉),或由于训练数据集的扭曲而产生偏差。GenAI 和一般人工智能的好坏取决于其训练数据,而训练数据中存在的偏差将导致结果出现偏差。
GenAI 会发展成为通用人工智能吗?
尽管最新的GenAI 模型使用了类似人类的语言,并且在输出结果中显得富有创造性和智能性,但它们与人类智能仍相去甚远,因为 GenAI 模型并不能真正理解事物,而只能根据输入数据做出非常准确的猜测。至于 GenAI 模型能否进一步改进,使其具备推理能力,人们对此争论不休。一些人工智能倡导者认为,GenAI 是迈向通用人工智能甚至意识的重要一步。有人担心,GenAI 的开发进展需要一种紧迫感,以确保人类仍能控制和管理这些模型。一些专家甚至呼吁暂停人工智能的发展(Narayan 等,2023 年)。
另一些人则认为,人工智能的更快发展将为更好地理解技术提供工具,并使其更加安全。其中一个例子是,OpenAI 利用从人类反馈中强化学习(RLHF)来创建护栏,使 ChatGPT 的反应更加准确和适当(高盛 2023 年)。同样重要的是,专家们对何时实现通用人工智能还存在很大分歧,许多专家认为通用人工智能的实现还很遥远