第一财经星翼大模型联动DeepSeek,财经智能体服务能力再升级
“这是一个非常好的模型!我们将生产出更好的模型,但领先优势将比前几年有所减弱。”当地时间1月31日,OpenAI CEO山姆·奥尔特曼(Sam Altman)在发布新一代推理模型o3系列的mini版本(o3-mini)后还点评了一家中国公司的模型。它由中国杭州的深度求索人工智能基础技术研究有限公司(下称“DeepSeek”)研发,其同名App DeepSeek一举登顶美国和英国苹果应用商店最受欢迎免费应用榜单,成功吸引了全球对大模型领域的新一轮关注。这款中国模型让美国新任总统特朗普宣称其崛起“为美国科技企业敲响了警钟”,引发投资者思考它对英伟达股价的威胁有多大,而第一财经星翼大模型的技术开发团队知道,当初做的技术模型基座选择,对了!
第一财经星翼大模型是由上海广播电视台旗下第一财经自主研发的一款专为财经领域设计的大模型技术底座及智能应用平台,目前已迭代到3.0版本。作为服务于财经融媒体内容生产的AI智能体,第一财经星翼大模型可调用多个开源模型,依托超10亿token的高质量财经媒体数据和专业领域知识,并运用创新的跨模型融合推理技术,实现高精准度的内容输出,在财经内容创作和智能分析领域始终保持着领先地位。
“最早注意到幻方量化这家公司,是因为新闻报道中有提到它当时是少数几家拥有英伟达万卡的公司之一。”DeepSeek是幻方量化旗下的AI公司,而第一财经技术中心团队正是凭借新闻敏感性和专业能力,持续关注了公司和产品。这是第一财经“专业创造价值”的基础,由敏锐的洞察力、准确的判断力、快速的反应能力和深入的挖掘能力来支撑。
2024年5月7日,DeepSeek发布了MoE架构的DeepSeek V2。两天后,第一财经技术中心就对DeepSeek发布的技术报告和模型进行了深度分析与研究。经过严谨的评估,团队认为DeepSeek V2在架构设计、性能表现等方面与财经垂类大模型的需求高度契合,于是果断决定将基座模型迁移至DeepSeek V2,并迅速启动了以DeepSeek V2为主力基座模型的财经垂类大模型的训练与应用研发工作。
2024年7月,在世界人工智能大会上,第一财经星翼大模型正式亮相,重磅推出了财经智能生产套件及财经智能助手两大系列应用,为财经融媒体内容生产及资本市场分析提供了强大的智能化支持。
在随后的半年时间里,第一财经技术团队持续对星翼大模型进行优化升级,先后完成2次大版本升级。其中,主力基座模型版本进一步升级,复杂任务由本地部署且自行微调的DeepSeekV2.5模型完成,使星翼大模型在财经数据处理、语义理解、智能分析等方面的能力得到了显著提升。在此过程中,第一财经与DeepSeek一直保持密切沟通,围绕模型技术细节、应用场景等方面进行了多次深入的技术交流,同时也就潜在的合作方向展开了多轮洽谈。
如今,星翼大模型3.0将多模态能力扩展至视频领域,实现图、文、视任意模态的跨模态内容检索。升级后重磅推出的新闻传播数据分析AI智能体——星眼,不仅能为内容创作团队提供多维度的AI智能辅助与数据诊断,还能为读者理解纷繁复杂的商业世界提供对照和分析。
“未来,第一财经将继续依托DeepSeek的技术优势,结合自身海量优质的财经数据和专业的行业洞察,持续优化星翼大模型,深入挖掘财经数据价值,进一步提升模型在复杂财经场景下的分析能力,为金融从业者、投资者以及广大财经内容爱好者提供更具深度和前瞻性的智能化的财经信息服务。”第一财经技术团队负责人说。
目前,第一财经已依据相关规定,正式向网信办提交星翼大模型备案申请。在备案材料中,明确阐述了第一财经星翼大模型以DeepSeek V2.5为基座模型,同时辅以多个分类模型构建基础架构,以确保模型在财经领域的专业性、准确性和稳定性。
页:
[1]