10月24日,第六届世界声博会主论坛上,科大讯飞重磅发布星火认知大模型V3.0。根据科大讯飞现场给出的数据,相较上一版本,星火认知大模型新版本的七大能力均有一定程度的提升。
根据《通用认知大模型评测体系》,基于真实用户数据,新版本的文本生成能力上升3%;语言理解能力上升6%;知识问答能力上升7%;逻辑推理能力上升8%;数学能力提高3%;代码能力提高9%;多模态能力提升7%。
值得注意的是,新版本进一步升级了数学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。
国务院发展研究中心国研经济研究院测评报告显示,星火大模型V3.0综合能力超越ChatGPT,国内领先,达到国际一流水平。
两个半小时内星火干了啥?
第六届世界声博会主论坛上,科大讯飞重磅发布星火认知大模型新版本。科大讯飞称:星火认知大模型V3.0版本全面对标ChatGPT。“其中文能力客观评测超越ChatGPT,英文能力对标ChatGPT48项任务结果相当。”
在昨天的主论坛上,穿插在科大讯飞董事长刘庆峰的演讲之中,科大讯飞研究院院长刘聪操纵星火认知大模型在两个半小时内完成多项任务。
一、为孩子们即兴创作主题为“小兔子登月,并遇到月球探测机器人”的绘本,并现场朗诵绘本。
二、围绕认知大模型,解放生产力写了一篇发言稿。
三、以孔子的身份,围绕认知大模型,解放生产力写了一篇发言稿。
四、现场学习科大讯飞研究院院长刘聪的语言风格,以刘聪的名义,围绕认知大模型,解放生产力写了一篇发言稿。
五、现场学习刘聪和女儿萱萱的聊天记录,以刘聪的名义,给女儿写了一封道歉信。
六、和星火大模型虚拟出的“哪吒”一起讨论了哪吒和孙悟空的战力对比。类似人设星火大模型已经拥有三千个。
七、以刘备的身份,和星火大模型虚拟出的“诸葛亮”一起讨论了三国争霸的局势和对策。
八、翻译了军事科学院系统工程学院李德毅的一篇论文综述《人工智能基础问题:机器能思维吗?》
九、给刘聪同学一篇论文润色,修改了其英文表达。
十、就“量子计算”生成一段文献综述。
十一、手把手教刘聪做一篇关于毕加索的英语阅读理解,重点讲解该篇阅读理解该如何起标题。
十二、给一位最近总是发烧的儿童看病,通过读医学检测报告生成重点及健康提醒。
十三、人机共创,30分钟共创生成一篇通用稿件。
皖版大模型已有1200万用户
安徽商报记者获悉,当前讯飞星火已有1200万用户。
“大模型正日益成为解放生产力工具。”科大讯飞创始人、董事长刘庆峰表示。
与此同时,随着大模型持续突破,讯飞AI开发者生态持续领先。自5月6日星火发布以来,讯飞开放平台新增143.4万开发者团队,同比增幅331%,汇聚553万AI生态开发者团队。其中新增大模型开发者17.8万,讯飞正与10万+企业客户用星火创新应用新体验。大模型也显著降低了开发者门槛,在讯飞星火上,已有1.5万助手开发者,开发超2.9万个助手应用。
尽管国务院发展研究中心国研经济研究院测评报告显示,星火大模型V3.0综合能力超越ChatGPT,国内领先,达到国际一流水平。
但是刘庆峰也在主论坛提出,国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。”
他表示,唯有秉持科学精神,才能真正实现超越。“大模型时代的大幕才刚刚揭开”。
值得注意的是,科大讯飞已经联合华为开发基于昇腾生态的“飞星一号”大模型算力平台。刘庆峰透露,对标GPT-4的更大参数规模的星火大模型正式启动训练,2024年上半年将实现对标GPT-4。
(安徽商报融媒体记者 梁巍)