用于大模型的首批中文基础语料库发布
千龙网
2023-12-24 18:57:56

原标题:用于大模型的首批中文基础语料库发布

中新网北京12月21日电 中国网络空间安全协会人工智能安全治理专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。

据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去重、过滤等技术手段,形成并对社会发布首批120G中文基础语料,包括1亿余条数据,500亿个token。用户登录中国网络空间安全协会网站,点击“中文基础语料库”链接,通过注册、认证等程序,就能够下载相关语料。

网安协会人工智能安全治理专委会负责人表示,语料库建设是一项长期性、专业性的工作,需要遵循相应法规、标准和规范,需要合力共建、突破创新,推动形成科学有效的语料库汇聚、处理、使用机制,为国家人工智能技术创新和产业发展赋能。

来自专委会成员单位、大模型备案机构和相关领域科研、企业、社会组织代表近100人参加发布会。

相关内容

热门资讯

数智住建⑨|AI驱动物业革新!... 梅林街道创智云中心。 深圳新闻网2026年3月19日讯(记者 黄卓坚 通讯员 胡信均 李欣 马倩)从...
“人工智能+家电”改变居家生活 今年的《政府工作报告》首次提出“打造智能经济新形态”,要求深化拓展“人工智能+”。当前,以人工智能为...
AI工厂时代 产业竞争逻辑重构 证券时报记者 陈霞昌 英伟达CEO黄仁勋在GTC大会做了一场演讲,其中一个核心主题是“AI工厂”时代...
水稻“返老还童”!上海科学家破... “返老还童”——如此奇妙的事情在水稻身上发生了! 北京时间2026年3月20日凌晨,一棵“多年生”的...
原创 物... 相信大家都知道,所谓的能量守恒定律,就是指能量既不会凭空产生,也不会凭空消失,它只能从一种形式转化为...