百亿私募大动作,成立AI公司
===2025-5-27 10:22:17===
【导读】念空科技成立AI公司,联手交大计算机学院撰写大模型相关论文,量化私募展开AI军备竞赛 百亿量化私募,纷纷加入人工智能(AI)“军备竞赛”。 记者从业内获悉,近期,沪上百亿量化私募念空科技成立了上海全频思维人工智能科技有限公司(中文简称全频思维,英文简称AllMind),探索AI的前沿课题。该公司还和上海交通大学计算机学院合作撰写论文《面向特定任务大型语言模型的监督微调与强化学习分步式自适应集成》,于今年5月投向NIPS(神经信息处理系统大会)。 今年截至目前,九坤、宽德、鸣石、黑翼等多家百亿私募积极布局AI。业内人士认为,DeepSeek火爆,量化行业备受鼓舞。机构依靠自身人才和技术方面的优势,积极探索AI领域。此举不仅能提升自身竞争力,而且可以拓展业务边界,为科技创新出力。 成立人工智能科技公司 与高校合作撰写涉及大模型论文 5月19日,念空科技成立了全频思维(AllMind),为一家专注于研究通用大语言模型(LLM)相关底层算法和工程技术的创新型科技公司。 念空科技创始人王啸告诉记者,AllMind更着眼于大模型的基础学术研究和应用,短期内并不以盈利为目的,“公司致力于探索人工智能的前沿课题,短期内会着眼于训练一个基于金融数据的专项大模型,也会着眼于解决当前大模型存在的一些痛点,比如提升其逻辑推理能力,减轻大模型的幻觉问题,探索大模型是否能进行自主创新。未来我们还会和学术及产业界合作,在新材料、医药研发、AI助手等领域尝试大模型的应用。” 记者还了解到,由念空科技和上海交通大学计算机学院合作撰写的《面向特定任务大型语言模型的监督微调与强化学习分步式自适应集成》(英文名称为“Step-wise Adaptive Integration of Supervised Fine-tuning and Reinforcement Learning for Task-Specific LLMs”),于5月20日投向NIPS,目前尚未发表。 王啸表示,ChatGPT的诞生依赖于大量的预训练和监督微调(SFT),2025年DeepSeek问世,表明了大量基于强化学习(RL)的后训练对大模型的推理能力非常重要,在DeepSeek的论文中介绍了整个训练过程被分成SFT-RL-SFT-RL四个过程。“就像我们人类学习
=*=*=*=*=*=
当前为第1/3页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页