瞄准底层技术,这家头部量化私募向NIPS投递AI基础研究论文
===2025-5-22 9:02:07===
5月15日,国内知名百亿级量化私募念空科技向国际顶级学术会议NIPS(Neural Information Processing Systems,神经信息处理系统大会)投递了其与上海交通大学计算机学院合作的大模型研究论文。5月20日,该投递论文网址链接公布(https://arxiv.org/abs/2505.13026)。 业内人士表示,念空科技联合国内高校向NIPS投递AI基础研究论文,显示出中国金融科技不止于应用落地,还具备一定底层创新能力。 念空科技向NIPS投递的论文 来源:网站截图 实证研究“更高效的大模型训练方式” 念空科技成立于2015年,是市场上较早将AI应用于金融领域的头部量化私募。其机器学习应用覆盖期货、股票等多类金融数据,经过多年技术迭代,公司自2019年起全面转向神经网络算法,并于2020年搭建全流程投研平台。2021年,公司管理规模突破100亿元。 2023年,OpenAI的ChatGPT的出现,为量化行业提供了全新算法工具。不过,念空科技创始人王啸结合近两年的相关研究及实践发现,ChatGPT存在使用成本高、权限受限等问题,难以支撑AI大模型的大规模训练。而DeepSeek的开源特性打破这一限制,通过监督微调(SFT)与强化学习(RL)交替训练的方式,验证了强化学习对大模型推理能力的重要性。 受人类学习中“高频切换刷题与测试总结”启发,念空科技提出一种自适应切换SFT与RL的训练框架。具体而言,模型在每一步训练前,通过自适应算法动态选择下一阶段采用SFT还是RL。其联合上海交通大学计算机学院开展的长期深度实验数据显示,在三个公开数据集上,该框架的表现显著优于单一使用SFT、RL或简单混合两者的传统方法。这一成果证明,新框架能够在同等训练量下提升模型的“聪明度”,有助于提升训练效率。 念空大模型论文中的研究图片 来源:念空科技 业内人士分析,这一研究成果不仅体现了念空科技对AI算法的深刻理解,更展现了中国头部量化机构在AI底层技术研究上的潜力。 成立专门AI企业不断探索技术边界 王啸在接受中国证券报记者采访时表示,为深入探索大模型技术边界,其于2025年成立全资子公司AllMind(上海全频思维人工智能科技有限公司)。与念空科技聚焦金融场景不同,AllMind定位于通用大语言模
=*=*=*=*=*=
当前为第1/2页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页