金融界2024年2月26日消息,据国家知识产权局公告,广东轩辕网络科技股份有限公司申请一项名为“一种基于机器学习的数字出版智能标识标引方法“,公开号CN117591684A,申请日期为2023年12月。
专利摘要显示,本发明公开了一种基于机器学习的数字出版智能标识标引方法,包括以下步骤:包括以下步骤。S1:首先采用基于CRF算法识别数字资源中的命名实体,构建一个可视化的数据标注平台;S2:知识抽取,建立实体关系联合抽取模型;S3:建设数字资源语料库,从一个标注任务开始,需要创建标注规格说明、设计标注指南、创建一个语料库;S4:实体和关系抽取方面,面向数字资源,使用联合学习(Joint Learning)技术。本发明通过机器学习算法创建模型后,可以为后续标引工作提供自动分类标引。对已分类的数据再次学习,不断优化模型后,逐渐替代人工标引,从而建立完善的数字资源标引体系;实现我们对复杂事务处理的自动化要求。
来源:金融界