还有像林妹妹,说话语气里带有些许婉转诗意~
据刘庆峰介绍,这一功能上线12小时,已有3000 人设由开发者自创。
此次大模型的专业性上也有所提升,比如在医疗领域,问上这样一个常识问题。
我24小时尿量<100毫升,我怎么了
可以看到,在「可能的原因」上双方的回答基本一致。讯飞星火风格则简单直接,还给出了「严重性」提醒。而GPT-4更为完备一些。
最后再来简单总结一下测评结果:
- 基础能力:语义理解、时效把握以及代码生成能力上都有很大的提升;
- 多模态生成表现不错,尤其在空间感知能力的表现;
- 个性化上也有人格表现,但会出现原形的情况;
- 专业性表现也基本无事实性错误,尤其医疗能力水平,给出适时诊疗提醒。
除了星火大模型本身,此次科大讯飞1024开发者节可谓是干货满满——
不光有编程产品iFlyCode、科技文献大模型、医疗大模型等这些垂直领域大模型落地应用;还有同与行业龙头共创12个行业大模型、10万家企业用户,通用大模型产业生态初见雏形;另外,超脑计划2030也在有序进行。
可以说是眼花缭乱了。