微软下架争议博文:教用户用盗版《哈利·波特》全集训练AI
创始人
2026-02-21 21:01:22

IT之家 2 月 21 日消息,科技媒体 Ars Technica 昨日(2 月 20 日)发布博文,报道称微软遭到舆论强烈反弹后,删除了 Azure 官方博客上一篇发布于 2024 年 11 月的技术教程。

IT之家援引博文介绍,该文章由微软高级产品经理 Pooja Kamath 撰写,主要演示如何利用 Azure SQL 数据库和 LangChain 技术快速构建生成式 AI 应用。

不过文章的核心演示案例竟是指导用户下载并使用盗版的《哈利 · 波特》全集来训练大语言模型(LLM)。

图源:已删除的微软博客

为了展示新功能的“亲和力”,该教程设计了两个应用场景:构建问答系统和生成同人小说。作者展示了一个由 AI 生成的营销故事:

在霍格沃茨特快列车上,哈利 · 波特遇到了一位新朋友,这位朋友向哈利热情推销微软 SQL 中的“原生向量支持”(Native Vector Support)功能,并将其比作“麻瓜世界的魔法”。

教程还附带了一张哈利与朋友带有微软 Logo 的生成图片。法律专家 Cathay Y. N. Smith 指出,这种利用受版权保护的角色进行商业营销的行为,极易触犯版权法。

教程中提供的训练数据链接指向数据科学平台 Kaggle 上的一个数据集。该数据集包含《哈利 · 波特》全七册电子书,且被上传者 Shubham Maindola 错误地标记为“公有领域(Public Domain)”。

尽管该数据集已存在多年并积累了超过一万次下载,但《哈利 · 波特》系列显然仍处于版权保护期内。在媒体 Ars Technica 联系上传者后,Maindola 承认标记错误并删除了数据集,称其本无意误导版权状态。

相关内容

热门资讯

训练机器人的00后(新春走基层... 本报记者 李维俊 广西柳州市机器人产业园的广西具身智能数据采集及测试中心里,高1.76米的工业人形机...
探讨云手机体验良好的平台,好用... 在当今数字化时代,云手机作为一项新兴技术,为广大游戏玩家和工作室带来了全新的体验。它打破了设备性能的...
消息称第十世代《宝可梦:风/浪... IT之家 2 月 21 日消息,消息源 @Pory_Leeks 昨日(2 月 20 日)在 X 平台...
港股AI、机器人大爆发,智谱飙... 新闻荐读 2月20日港股马年首个交易日,三大指数集体低开,截至10:00,恒生指数跌1.01%,恒生...
原创 春... 正值春节假期出行旺季,某网约车品牌遭大量投诉。 多位消费者指出其乱收费,预估与实际严重不符,“8公里...