证券之星消息,根据企查查数据显示掌阅科技(603533)新获得一项发明专利授权,专利名为“语料样本集合的构建方法、计算设备及计算机存储介质”,专利申请号为CN201910528366.9,授权日为2024年5月31日。
专利摘要:本发明公开了一种语料样本集合的构建方法、计算设备及计算机存储介质。其中方法包括:步骤S1,对语料库的语料进行识别,得到初始的语料样本集合以及利用初始的语料样本集合训练得到的语料识别模型;步骤S2,利用语料识别模型对书籍语料进行识别,得到书籍语料样本;步骤S3,将书籍语料样本添加入语料样本集合;步骤S4,利用更新后的语料样本集合对语料识别模型进行训练;重复执行上述步骤S2至步骤S4,直至更新后的语料样本集合满足第一预设条件。本方案最初的数据来源的语料库,实现了零样本的语料构建与学习,构建出的语料样本集合适用于电子书领域,并且语料样本兼具多样性和准确性的特点。
今年以来掌阅科技新获得专利授权23个,较去年同期减少了17.86%。结合公司2023年年报财务数据,2023年公司在研发方面投入了2.3亿元,同比增4.94%。
数据来源:企查查
以上内容由证券之星根据公开信息整理,由算法生成(网信算备310104345710301240019号),与本站立场无关,如数据存在问题请联系我们。本文为数据整理,不对您构成任何投资建议,投资有风险,请谨慎决策。