金融界2024年12月21日消息,国家知识产权局信息显示,蜜度科技股份有限公司申请一项名为“古文标点预测方法、系统、电子设备及介质”的专利,公开号CN 119150864 A,申请日期为2024年11月。
专利摘要显示,本申请提供一种古文标点预测方法、系统、电子设备及介质,所述古文标点预测方法包括:获取训练数据;对所述训练数据进行拆分处理,利用拆分后的数据块获取训练数据集;利用最小哈希算法构建索引库,以获取所述训练数据集的参考文本;利用所述参考文本和所述训练数据集的原始文本对初始语言模型进行训练,以获取古文标点预测模型;利用所述古文标点预测模型对待预测文本进行预测,以获取预测结果。此种古文标点预测方法能够避免连续标点预测的漏报问题,提高古文标点预测的准确度。
来源:金融界