“力压GPT-4o和Gemini 1.5 Pro”,Anthropic推出Claude 3.5 Sonnet AI模型
创始人
2024-06-21 13:41:00

6 月 21 日消息,Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。

Claude 3.5 Sonnet 在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。

Claude 3.5 Sonnet 属于中等尺寸模型,介于小型 Haiku 和高端 Opus 之间,但 Anthropic 声称,根据内部基准测试,Sonnet 的性能甚至超过了顶级 Opus。

据 Anthropic 称,Claude 3.5 Sonnet 处理输入的速度是 Opus 的两倍。该公司称,在编码挑战方面,Sonnet 超越了之前的 Opus 模型,修复了 64% 的代码错误,而 Opus 只有 38%。

基准测试结果还显示,Sonnet 在 9 个总体类别中的 7 个类别、5 个视觉任务中的 4 个任务上击败了竞争对手。

IT之家翻译官方新闻稿如下:

Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准测试中超过了 Claude 3 Opus,在解读图表等需要视觉推理的任务中,这些阶跃式的改进最为明显。

Claude 3.5 Sonnet 还能从不完美的图像中准确地转录文本,这是零售、物流和金融服务的核心能力,在这些领域,人工智能可能会从图像、图形或插图中获得比单纯从文本中获得更多的洞察力。

为确保安全,Anthropic 将 Sonnet 提交给英国和美国人工智能安全研究所进行外部评估。他们发现,经过改进后,该模型仍处于 ASL 2 级水平。Anthropic 还利用儿童安全专业知识对助手进行了更新,以更好地预防潜在伤害。

【来源:IT之家】

相关内容

热门资讯

砍掉花哨功能!微软正式下架Te... 来源:环球网 【环球网科技综合报道】5月18日消息,据The Verge报道,微软日前宣布将逐步停...
别让科研人员困在“填表”里 近年来,为科研人员松绑减负日益成为各界共识。但也有一线科研人员表示,目前各种非学术负担仍然较重,不少...
任天堂触屏版“宝可梦玩法”专利... IT之家 5 月 18 日消息,任天堂与《幻兽帕鲁》开发商 Pocketpair 就“宝可梦风格的怪...
一场"与玩家共谋&q... 《三国:天下归心》公测已一月,外界的评价莫衷一是。 行业观察者中,既有人对其敢于挑战头部产品、以多元...
世嘉三款游戏大作Steam国区... IT之家 5 月 18 日消息,世嘉宣布旗下《审判之逝:湮灭的记忆》《人中之龙 维新!极》和《索尼克...