证券之星消息,根据天眼查APP数据显示中孚信息(300659)新获得一项发明专利授权,专利名为“基于知识蒸馏的涉密文本识别模型训练方法、系统及装置”,专利申请号为CN202111390073.2,授权日为2024年12月24日。
专利摘要:本发明提出的一种基于知识蒸馏的涉密文本识别模型训练方法、系统及装置,所述方法包括:准备保密领域的无标签语料库A;根据保密业务数据构建文本标签层级树,并标注得到有标签数据集B,准备无标签数据集C;对无标签数据集C中的文本进行文本增强;通过无标签语料库A进行知识蒸馏,使IDCNN模型从Bert模型中学习语义特征抽取能力;构建基于Bert模型的标签路径分类模型Bert?clf,通过有标签数据集B对Bert模型进行监督分类训练,得到标签路径分类模型Bert?clf;构建基于IDCNN模型的标签路径分类模型Idcnn?clf;通过有标签数据集B和无标签数据集C对标签路径分类模型Idcnn?clf进行知识蒸馏;保存标签路径分类模型Idcnn?clf。本发明能够有效的提升涉密文本识别模型的预测速度和分类准确率。
今年以来中孚信息新获得专利授权32个,较去年同期减少了23.81%。结合公司2024年中报财务数据,今年上半年公司在研发方面投入了1.07亿元,同比减28.23%。
数据来源:天眼查APP
以上内容为证券之星据公开信息整理,由智能算法生成,不构成投资建议。