用于大模型的首批中文基础语料库发布
千龙网
2023-12-24 18:57:56

原标题:用于大模型的首批中文基础语料库发布

中新网北京12月21日电 中国网络空间安全协会人工智能安全治理专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。

据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去重、过滤等技术手段,形成并对社会发布首批120G中文基础语料,包括1亿余条数据,500亿个token。用户登录中国网络空间安全协会网站,点击“中文基础语料库”链接,通过注册、认证等程序,就能够下载相关语料。

网安协会人工智能安全治理专委会负责人表示,语料库建设是一项长期性、专业性的工作,需要遵循相应法规、标准和规范,需要合力共建、突破创新,推动形成科学有效的语料库汇聚、处理、使用机制,为国家人工智能技术创新和产业发展赋能。

来自专委会成员单位、大模型备案机构和相关领域科研、企业、社会组织代表近100人参加发布会。

相关内容

热门资讯

原创 拼... 放眼整个2026年,拼多多的核心玩法依然离不开:强付费和自然流两种玩法。也就是,大家做拼多多,如果不...
顶流主播集体扎根,天下贰经典版... 《天下贰・经典版》公测近半年,服务器依旧火爆,金价稳如老狗,新服世外桃源刚开时上号更是人满为患,刚开...
原创 被... 大家好我是指尖,一般来说,一款皮肤的优秀是有侧重的角度的,要么建模做的好,要么创意不错,也有可能是特...
原创 国... 新英雄六耳已经上线几天的时间了,现在大家如果再来评价这个英雄,你觉得是强,还是弱呢? 我的评价依然是...
继“大司马官宣办第二届PUBG... 前言:现在互联网大环境不好,很多游戏主播都叫苦不迭,因为相较于几年前来说,现在直播人气又低,挣钱又少...