B站亮相 2024 世界人工智能大会,首次展出自研大语言模型
创始人
2024-07-05 12:41:14

IT之家 7 月 5 日消息,在 2024 世界人工智能大会(WAIC 2024)上,哔哩哔哩(以下简称“B站”)公布了多项自主研发的 AI 技术成果和 AIGC 多元创意,包括最新定制的 AI 语音声库、自研音视频大模型必剪 Studio 以及自研 AI 动态漫技术等。

此外,B站自研的大语言模型系列也在此次 WAIC 2024 大会上首次展出,包括开源的 Index-1.9B chat 和 Index-1.9B character 两个模型。

IT之家查询 GitHub 获悉,Index-1.9B 系列模型于 6 月开源,包含基座模型、对照组、对话模型、角色扮演模型:

  • Index-1.9B base: 基座模型,具有 19 亿非词嵌入参数量,在 2.8T 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先
  • Index-1.9B pure: 基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响
  • Index-1.9B chat: 基于 index-1.9B base 通过 SFT 和 DPO 对齐后的对话模型
  • Index-1.9B character: 在 SFT 和 DPO 的基础上引入了 RAG 来实现 fewshots 角色扮演定制

在B站 15 周年演讲上,B站董事长兼 CEO 陈睿表示,2023 年,B站 AI 相关内容的日均视频播放量同比增长超过 80%,爆款内容涵盖科普资讯、AI 技术应用、数字人和创意应用等领域。

根据B站透露的数据,当前超过 8000 万用户每月在B站观看 AI 相关的视频,其中 6 成为 00 后。

Index-1.9B 系列模型开源地址:

相关内容

热门资讯

快把这个秘密告诉你身边的左撇子... · 正 · 文 · 来 · 啦 · 在这个世界上,为什么90%左右的人都偏好用右手干活,只有约10...
原创 炸... 大约十年前,苹果组建如今的视觉产品团队研发头戴设备时,产品路线图截然不同。公司当时同步推进三款截然不...
一千个现代人,有一千种《颈椎病... 玩过都说颈椎痛。 在此前的Steam新品节中,很多玩家大概都和我一样,被《颈椎病》的封面图片吸引着点...
原创 L... 英雄联盟LPL第二赛段的比赛,于4月4日正式拉开序幕。基于2026年第一赛段的排名,14支队伍将划分...
原创 被... 在王者荣耀中,有些皮肤可以说是非常稀有的,而且有些皮肤不只是因为限定那么简单,因为它的获取方式也比较...