Jina AI 推出全球首个开源 8K 文本嵌入模型,号称超越 OpenAI
IT之家
2023-10-26 16:00:49

原标题:Jina AI 推出全球首个开源 8K 文本嵌入模型,号称超越 OpenAI

IT之家 10 月 26 日消息,Jina AI 在其官网发布新闻稿,宣布推出 jina-embeddings-v2 模型,号称是目前是唯一支持 8K(8192 个 token)上下文长度的开源产品,在功能和性能上与 OpenAI 的 text-embedding-ada-002 类似。

在大规模文本嵌入基准 (MTEB) 排行榜方面,IT之家发现,官方进行如下解释:

与 OpenAI 的 8K 模型 text-embedding-ada-002 进行比较,jina-embedding-v2 在分类平均值、重排平均值、检索平均值和摘要平均值方面均优于 OpenAI 的 text-embedding-ada-002

▲ 图源 Jina AI 官网

▲ 图源 Jina AI 官网

官方表示,jina-embeddings-v2 模型,是从头开始构建的。在过去的三个月里,Jina AI 团队进行了密集研发、数据收集和调整

Jina AI 同时声称, jina-embeddings-v2 8K 的上下文长度有利于以下应用场景:

  • 法律文件分析:确保对大量法律文本中的每一个细节进行捕捉和分析。
  • 医学研究:为了进行高级分析和发现,全面地嵌入科学论文。
  • 文学分析:深入研究长篇内容,捕捉微妙的主题元素。
  • 财务预测:通过详细的财务报告获得卓越的洞察力。
  • 会话式 AI:提升聊天机器人对复杂用户查询的响应能力。

相关内容

热门资讯

科普必备“微信里面链接拼三张房... 微信游戏中心:拼三张房卡,添加微信【33699510】,进入游戏中心或相关小程序,搜索“微信拼三张房...
明年乐高星战套装将迎来全新玩法... 积木智能化的风,终于吹到了乐高。 根据目前在玩家圈与爆料渠道中流传的信息,乐高集团正在为 2026 ...
科普必备“微信玩拼三张怎么自己... 拼三张是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:33699510许多玩家在游戏中会购买房卡来享...
房卡普及“6人炸金花如何开房间... 微信游戏中心:炸金花房卡,添加微信【56001354】,进入游戏中心或相关小程序,搜索“微信炸金花房...
科普必备“微信里炸金花好友房卡... 微信游戏中心:炸金花房卡,添加微信【33699510】,进入游戏中心或相关小程序,搜索“微信炸金花房...