微软发布 PyRIT 工具,帮专家和工程师识别生成式 AI 模型风险
IT之家
2024-02-24 08:31:57

原标题:微软发布 PyRIT 工具,帮专家和工程师识别生成式 AI 模型风险

IT之家 2 月 24 日消息,微软近日发布了开源自动化框架 PyRIT,这是一款 Python 风险识别工具包,主要帮助安全专家和机器学习工程师识别生成式 AI 的风险,阻止他们的人工智能系统失控。

微软的 AI Red Team 已经使用该工具,检查包括 Copilot 在内生成式人工智能系统中风险。

微软强调通过向公众提供内部工具,以及分享 AI Red Team 方面的其他投资成果,其目的是推动人工智能安全民主化。

IT之家注:Red Team 是在军事演习、网络安全演习等领域中扮演敌人或竞争对手角色的群体,扮演己方角色的则称作蓝队。Red Team 通常定义为敌方部队,通过攻击网络来提高产品安全性。

微软 AI Red Team 专门成立了一个跨学科的安全专家小组,管理复杂的攻击演习。PyRIT 框架的工作原理如下:

  • PyRit Agent 向目标 Gen AI 系统发送恶意提示词;当它收到 Gen AI 系统的回应时,就会向 PyRIT 评分引擎发送回应。
  • 评分引擎将响应发送给 PyRit 代理;然后,代理根据评分引擎的反馈发送新的提示。
  • 这一自动化过程一直持续到安全专家得到所需的结果为止。

微软已经将相关代码托管到 GitHub 上,感兴趣的用户可以深入阅读。

相关内容

热门资讯

天蚕土豆怒斥逆水寒:最烦你强行... 了解天蚕土豆的网友都知道,作为时下最火的网文作家之一,天蚕土豆在写文之余喜欢玩点游戏,来缓解自己写文...
《方舟:生存飞升》发布重大更新... 《方舟:生存飞升》发布更新前瞻,虚幻引擎5.7计划2026年三季度升级,同步推出《世界创造者》模式,...
解锁宇宙密码!“百嘎丽”青少年... 为提升青少年科学素质,厚植暖城科技创新沃土,5月7日,“百嘎丽科普逐星河 仰望星空探秘宇宙”青少年天...
索尼官宣新机5月13日发布,预... IT之家 5 月 8 日消息,索尼官宣旗下新机将于北京时间 5 月 13 日 10 点发布,参考海报...
从“够用”到“好用”:华硕天选... 如果你是关注游戏本的老玩家,在选购时华硕天选6 Pro一定是绕不开的选择,不过165Hz屏幕和部分配...