AI工具能够揭露匿名账户身份_资讯

AI工具能够揭露匿名账户身份

创始人

2026-03-07 19:04:57

比特币发明者中本聪可能是安全的，但你的Reddit小号可能就不一定了。

你是否有Reddit小号、秘密X账户、finsta账户，或者在Glassdoor上吐槽老板的账户？AI可能让揭露你的身份变得容易得多。这是最近发表的一项研究的结论，该研究暗示了在线保持私密性的一些令人不安的后果——尽管现在还不是为匿名性举行葬礼的时候。

这项尚未经过同行评审的研究来自苏黎世联邦理工学院、Anthropic和机器学习对齐与理论学者项目的研究人员。他们构建了一个使用未指明模型的AI智能体自动化系统——能够像人类调查员一样搜索网络并与信息交互——来测试大语言模型重新识别匿名材料的有效性。该系统"大幅超越"了传统的去匿名化账户计算技术，大规模搜索文本中的个人细节。

该系统通过将帖子或其他文本视为一组线索来工作。它分析文本的模式——写作风格、零散的传记细节、发帖频率和时间——这些可能暗示某人的身份。然后它扫描其他账户，可能数百万个，寻找相同的特征组合。可能的匹配会被标记、更详细地比较，并筛选成可能身份的候选名单。

研究团队没有针对毫无防备的用户，而是使用公开可用的帖子构建数据集来评估系统，包括Hacker News和LinkedIn的内容、Anthropic采访科学家如何使用AI的记录，以及为测试而故意分成两个匿名部分的Reddit账户。论文报告称，在每个设置中，基于大语言模型的方法以90%的精度正确识别了高达68%的匹配账户。相比之下，类似的非大语言模型方法，如连接大型数据集中的分散数据点，几乎无法识别任何账户。

结果在每个数据集上并不一致，可预测的是，当模型有更多结构化信息可用时表现更好。在一项检查Reddit用户在主要r/movies子版块和较小电影社区发帖的实验中，该系统能够以90%的精度将提及一部电影的账户链接起来，成功率约为3%。当用户提及10部或更多电影时，成功率上升到近一半。

与此同时，使用Anthropic科学家调查的实验识别了125名受访者中的9人，召回率约为7%。在该测试中，系统根据受访者答案中的线索构建每个受访者的档案，然后在网络上搜索公开可用的信息寻找可能的匹配。在一个匹配示例中，研究人员强调了对"导师"的提及可能暗示博士生身份，使用英式英语可能暗示与英国的联系。结合物理科学背景和当前生物学研究工作的提及，系统能够将范围缩小到特定候选人。

研究人员仍然认为，从非结构化文本中识别任何受访者的能力值得注意，在几分钟内复制了人类调查员需要数小时才能完成的工作。此外，他们告诉The Verge，随着AI系统变得更有能力并获得更大的数据池，性能可能会提高。更广泛地说，他们警告说，假设化名发帖将保护在线身份（过去或未来）可能不再安全。

"原则上，大语言模型找到的每一个东西都可能被人类调查员找到"

"互联网上的信息永远存在，"苏黎世联邦理工学院研究员、该研究作者之一Daniel Paleka说。研究人员警告说，这种持久性可能转化为依赖化名的记者、异议人士和活动家的具体现实风险，同时也促成"超精准广告"和"高度个性化"诈骗。

去匿名化账户的风险并不新颖，也不是AI独有的。"原则上，大语言模型找到的每一个东西都可能被人类调查员找到，"Paleka告诉The Verge。

Paleka认为，新颖之处在于端到端的自动化。曾经需要勤奋的调查员愿意耐心筛选帖子寻找小块信息的工作，现在可以更容易地进行，并且针对更多的目标。

成本也很便宜。研究人员说他们的实验成本不到2000美元，对每个运行AI智能体的档案成本在1到4美元之间。"现在经济状况完全不同了，"合著者Simon Lermen告诉The Verge，警告说较低的准入门槛可能扩大有能力和动机尝试突破在线匿名性的人群。他说，历史上"低调行事"的群体可能会发现很难继续这样做。

人们"可能会误解这项重要研究并得出隐私已死的结论。"事实并非如此。

重要的是不要夸大这些发现。"虽然这些算法在改进，但它们仍然远不如人类能做的，"牛津互联网研究所副教授Luc Rocher告诉The Verge。这项工作并不能简单地映射到现实世界；实验是在实验室条件下使用经过精心策划和匿名化的数据集进行的。他们说担心人们"可能会误解这项重要研究并得出隐私已死的结论。"事实并非如此，他们争辩说。

尽管旨在揭露匿名用户的技术取得了多年的渐进进步，"比特币发明者中本聪的身份在十多年后仍然是个谜，"Rocher说。他们补充说，举报者仍然可以与记者沟通而不被暴露，像Signal这样的工具"迄今为止在保护我们集体隐私方面是成功的"。

在论文中，研究人员说他们避免在实际的化名用户上测试他们的系统，因为存在伦理担忧。出于类似原因，他们没有发布其方法的完整技术细节，并在被要求时拒绝提供演示。该团队也不会说他们是否在研究范围之外测试了系统，再次引用伦理担忧，留下了它对现实世界账户表现如何可靠的问题。

对于已经深度致力于匿名性的人来说，实际影响可能有限。基本预防措施——保持账户分离、限制个人细节、避免可识别模式如仅在你时区的清醒时间发帖——仍然至关重要。

对于更随意对待化名的人，Paleka和Lermen建议用户仔细考虑在公共论坛发布的内容，即使是感觉匿名的账户，并记住已经存在的内容可以比许多人假设的更容易地拼凑在一起。

研究人员认为，责任不应完全落在用户身上。Lermen说AI实验室应该监控他们的工具如何被使用，并建立保障措施防止它们被用来去匿名化人们。他补充说，社交媒体平台可以打击使这种努力成为可能的抓取和大量数据提取。

换句话说，中本聪可能对AI侦探是安全的。你在Reddit上的随意AITA帖子？那可能是另一回事了。

Q&A

Q1：这个AI去匿名化系统是如何工作的？

A：该系统将帖子或文本视为一组线索，分析写作风格、传记细节、发帖频率和时间等模式来识别身份。然后扫描其他账户寻找相同特征组合，将可能匹配进行标记、比较并筛选成候选身份名单。

Q2：AI去匿名化的成功率有多高？

A：在测试中，基于大语言模型的方法以90%的精度正确识别了高达68%的匹配账户。成功率取决于可用信息量，用户提及一部电影时成功率约3%，提及10部或更多电影时成功率接近50%。

Q3：普通用户如何保护自己免受AI去匿名化？

A：基本预防措施包括保持不同账户分离、限制发布个人细节、避免可识别的发帖时间模式。用户应仔细考虑在公共论坛发布的内容，即使在看似匿名的账户上也要谨慎。

上一篇：国家发改委：将推动电信、互联网、教育、医疗等领域有序扩大开放

下一篇：五大场景重磅亮相，成都国际铁路港加速打造“智慧陆港”

AI工具能够揭露匿名账户身份

相关内容

热门资讯