九坤投资与微软亚洲研究院近日刊文称,首次成功复现了DeepSeek-R1,特别是其在强化学习领域的成果,同时在技术层面提出了创新性的见解。该学术文章名为Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning,为微软亚洲研究院、Ubiquant及其他独立研究人员共同撰写。据悉,同为量化巨头,九坤投资在数据、算法、算力方面有着强大的技术储备和人才储备,近年来持续在AI前沿技术领域展开系统且深入的研究,不仅长期探索通用技术并推动其场景应用,还在多个细分领域进行了多元化的研究拓展 ,力求构建更为全面的AI技术体系。在业内看来,DeepSeek的模型全部开源,全球掀起复现DeepSeek-R1的热潮,此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,并取得一定的成果。