作者 | 尚恩
编辑 | 邓咏仪
传闻中的“蚂蚁大模型”,这次真的来了!
今年6月,就有传闻蚂蚁集团正在自研多模态大模型。而就在9月8日的上海外滩大会上,蚂蚁集团副总裁、蚂蚁金融大模型负责人王晓航正式发布蚂蚁金融大模型,并喊出“1 1 2”的大模型战略矩阵。
来源:蚂蚁官方
蚂蚁金融大模型是基于蚂蚁自研的基础大模型上打造,其底层算力集群达到万卡规模。目前已在蚂蚁集团的财富、保险平台上全面开启内测。
当天,蚂蚁集团还同时发布了基于金融大模型能力的两款产品:智能金融助理支小宝2.0和智能业务助手支小助1.0。后续面向C端用户的支小宝2.0,通过“支付宝”就可上手玩。
另外,还推出一款金融专属任务评测集Fin-Eval,从五大维度28个分类进行评估,当前测评集已开放可用。
来源:蚂蚁官方
千亿级Token金融知识,还有专业测评集
“因为大模型的幻觉问题,只有确保模型拥有领域知识和专业逻辑的严谨性,才能真正赋能金融服务”,蚂蚁集团副总裁、金融大模型负责人王晓航表示。
因此,基于金融场景中的大量实践,蚂蚁金融大模型以“大模型 知识 服务”为驱动的架构方式,来让大模型“说真话”。
据介绍,蚂蚁金融大模型拥有1万亿Token优质通用语料,目前被誉为全球最强开源大模型的Llama 2语料也不过2万亿。另外,还有5000亿Token全网金融语料,并从300 真实产业场景中提取了60万 高质量指令数据,目的就是打造一个金融行业的专家模型。
对于内容生成的安全可控问题,团队选择采用意图识别与事实性校验相结合的方式来解决。
来源:蚂蚁官方
知识面很广,具体能力怎么样?蚂蚁也有一套自己的测评方法。
为了系统化评估AI在金融领域的表现,蚂蚁从真实金融场景定义了金融AI任务评测集“ Fin-Eval”,数据集由“认知、生成、领域知识、金融逻辑、安全合规”五大维度共28个分类组成。
经过一系列的系统测试,目前大模型已率先在理财和保险领域进行应用测试,并成功通过了“证券从业资格、保险从业资格、执业医师资格、执业药师资格”等在内的专业试题测试。
智能助手上线,保险理赔都拿捏
当天,蚂蚁集团也发布了首个基于金融大模型的应用产品——智能金融助理“支小宝2.0”,以及面向金融行业专家的智能业务助手 “支小助1.0”。
来源:蚂蚁官方
具体来说,“支小宝2.0”就是一款主要面向个人用户的智能金融助理,可为用户提供“行情分析、持仓诊断、资产配置和投教陪伴”等专业服务。经过团队测试,“支小宝2.0”已具备高精度的意图理解,金融意图识别准确率高达95%,金融事件分析推理能力已完全不逊于真人行业专家。
“支小助1.0”则是一款面向大企业的智能业务助理,针对不同金融场景的从业人员,蚂蚁分别推出“服务专家版”、“投研专家版”、“理赔专家版”、“保险研究专家版”等六个版本。
以“投研支小助”为例,实测数据显示,支小助每日能够帮助每位投研分析师高效完成100篇研报和资讯的金融逻辑和观点提取,以及40多个金融事件的推理和归因,可大幅度提升分析效率。
此外,支小助1.0还能基本替代基础的金融工程代码编写,显著提高了量化研究效率。
目前,“支小宝2.0”已内测半年时间,待完成备案即可上线开放,“支小助1.0”则正与蚂蚁平台的合作机构开展内测中。
未来,蚂蚁集团将持续探索和精进大模型的五大能力方向,集团与金融机构合作的所有数字金融业务也将全线接入大模型。
长按添加「智涌」小助手入群, 备注:公司 职务