证券之星消息,根据企查查数据显示东方财富(300059)新获得一项发明专利授权,专利名为“实现高质量文本相似度计算的SimBlock算法及实现方法”,专利申请号为CN202111636855.X,授权日为2024年7月9日。
专利摘要:针对大数据文本排重场景,如:搜索引擎、资讯专题模块聚合,内容原创和内容剽窃的识别,以及重复灌水帖子、评论相关的内容治理等。本发明一个技术方案是提供了一种能实现相似度计算的SimBlock算法(相似分块矩阵算法),弥补了传统相似度算法“字符交集”和“字符串向量化余弦”丢失有序信息的缺陷,补充局域有序信息,提高相似度计算质量:给出的相似度打分对两个字符串的长度不敏感,还能判断逻辑包含关系,相似子字符串的位置和一一对应关系。本发明的另一个技术方案是提供了一种上述算法适用的分布式计算技术架构,将高并发计算压力分解到高并行度的算法微服务集群中,将高并发读写压力也分解到高速缓存集群中,使得多进程Source/Trans./Sink单体保持轻量级。
今年以来东方财富新获得专利授权5个,较去年同期增加了400%。结合公司2023年年报财务数据,2023年公司在研发方面投入了10.81亿元,同比增15.49%。
数据来源:企查查
以上内容由证券之星根据公开信息整理,由算法生成(网信算备310104345710301240019号),与本站立场无关,如数据存在问题请联系我们。本文为数据整理,不对您构成任何投资建议,投资有风险,请谨慎决策。