“(做大模型),主要是看怎么做,怎么说的意义不是特别关键。”
9月19日,字节跳动旗下火山引擎总裁谭待在接受澎湃新闻等媒体采访时,谈到了大模型“打法”。
作为互联网巨头之一,字节跳动的大模型路线图一直广受外界关注。9月7日,腾讯正式发布混元大模型,并宣布通过腾讯云对外开放,至此,包括阿里、百度、腾讯、京东等多家科技公司已经官宣入局“百模大战”,而字节跳动的自研通用大模型“云雀”始终保持低调,甚少公开披露信息。
9月19日,火山引擎在其举办的“V-Tech数据驱动科技峰会”上宣布,火山引擎数智平台VeDI推出“AI助手”,通过接入人工智能大模型,帮助企业提升数据处理和查询分析的效率。
即使是不会写代码的运营人员,和大模型对话也能做好业务运营数据的取数、看数和归因分析。
这也是字节首次公开披露“云雀”的相关应用。据字节跳动数据平台负责人罗璇向澎湃新闻记者介绍,在技术上,AI助手主要背靠的大模型就是自研的“云雀”,以及火山方舟上的一些合作伙伴。
原生AI应用成熟要等年底
通俗而言,此次发布的AI助手,是为了让企业更方便地进行数据消费。谭待认为,数据资产的检索和开发非常依赖专业人员,使用大模型之后可以极大降低门槛。非研发人员使用AI助手能够更高效地搜索到相应数据,更高效地进行数据开发。
罗璇表示,目前AI助手还不算完全成熟的状态,希望一点点逐渐打磨产品,和客户深度共创,更成熟以后,再大规模对外公开。
此前6月28日,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service),目前集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研团队的大模型,类似于为各行各业提供了一个“大模型商场”。
谈到目前火山方舟上一些大模型具体的商业表现,谭待坦言,目前相比全球最高水平,国内的一些大模型还存在差距,目前更多厂商还是在测试阶段,“等到AI原生应用真正成熟,可能要期待底座大模型达到GPT-3.5以上的水平,到了年底这件事才会清晰一些。”
值得注意的是,谭待曾在接受采访时坦言,火山引擎本身不做自研大模型,而是将接入多家大模型深度合作,为大模型厂商提供服务。
火山引擎智能算法负责人吴迪曾告诉澎湃新闻,和其他很多云厂商单纯提供算力不一样,火山方舟一方面会在资源和优化上与模型提供商进行深度合作,把推理成本往下打。另外一方面,火山算法团队会和客户做重点的应用共建和应用落地。“我们想催化整个大模型大算力在千行百业的落地速度,这应该是两者最大的不同了。”
多箭齐发,进军AI和大模型
业内的共识是,目前大模型的“幻觉”问题还未能彻底解决。所谓的“幻觉”,指的是大模型在回答提问时会出现答非所问、胡说八道的现象。
罗璇介绍,可以通过将大模型的思维过程、分析过程展现出来,从而使客户意识到大模型的推理存在错误。另一方面,模型能力本身的能力提升,例如从GPT3.5升级到GPT4,也能缓解这个问题。此外,还能对模型进行精调,在通用基础上加上一些领域的专业知识,也有利于在具体领域内让幻觉变得更小、准确率更高。
虽然火山引擎主要定位于大模型服务商,但这只是字节跳动在AI布局的一部分,字节仍在低调进军自研大模型。
公开资料显示,早在2016年,字节就成立了人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。
8月17日,字节跳动公测基于云雀大模型开发的AI对话产品“豆包”,有网页端、iOS和安卓客户端,预置了英语学习助手和写作助手两个功能。
云雀大模型的定位是一个自然语言内容生成和内容理解的AI大模型,该模型基于字节机器学习平台开发,它可以通过自然语言处理技术与用户进行对话,回答用户的问题,提供相关的信息和建议。
除了语言产品“豆包”,字节研究团队还曾公布一个多模态大模型的学术研究项目BuboGPT,该模型能够处理包括文本、图像和音频在内的多模态输入,即指,不仅可以理解图像、音频和文本,并将这些理解与文本输入和输出相结合,还可以定位和描述图像中的物体以及声音的来源。