科大讯飞,少有人走的路
来源:安徽商报 责任编辑:张雪子 分享到 2025-01-28 16:40:28

在科技领域,技术发展周期Gartner曲线将技术发展周期分为:技术萌芽期、期望膨胀期、泡沫幻灭期、爬升恢复期、稳步增长期。

大模型爆发两年,膨胀期的狂热已经散去。有公司随泡沫幻灭而消散,有公司则步入艰难爬升恢复期。

无论是对于初创公司还是大厂,大模型都是一次全新出发。有能力跨越周期、独一无二道路的公司,两只手就能数得过来。

这是一条少有人走的路。

01/

打开大模型的天花板

进入2024年下半年,大模型天花板在不同场合被讨论。

底座大模型的训练,投入大、收效渐慢,到底还有没有必要?

在应用上,大模型到底是效率工具还是能力工具,能不能成为创新工具?

1月25日,科大讯飞年会上,董事长刘庆峰认为:通用大模型的天花板仍然在被持续打开。

OpenAI连续开了12天发布会,最后一天发布的OpenAI o3几乎所有复杂任务都比o1又高出了10个点以上;英伟达正式提出要把大模型从虚拟世界引入到真实物理世界,并且定义2025年是通用人工智能在物理世界落地的元年。

刘庆峰透露,硅谷一些研发机构未来一两年即将发布的那些系统,很多性能远远超过现在能够公开看到的各种各样的模型,“背后的技术路径,都是科大讯飞已经掌握的。”

在中国先行一步的人可以摘到最丰硕的果实,尽管他们有着不同的路径。

互联网大厂“因地制宜”,字节跳动斥资800亿做AIGC应用“豆包”,借助抖音生态,其月活迅速攀升;新锐势力“前仆后继”;Kimi和DeepSeek深入聚焦一个领域,挖深井出活水;以B/G见长的科大讯飞,也找到了大模型红利兑现的钥匙。

看似平平无奇,但含金量极高,归纳为“十八字诀”:「建算力、理数据、训模型、落场景、保安全、精运营。」

大模型红利的兑现,不仅需要创新力,更需要解决现实需求的能力。底层逻辑是:能不能用更少成本、更低算力、更高效率推动应用落地。

背后是全栈工程。这也意味着,一种结合“大模型底座”、工具链和知识工具,从顶层规划到执行落地的全套方法,被讯飞跑通了。

借助这把钥匙,讯飞星火大模型交出了2024年成绩单:央国企市场中标数量和中标金融第一;行业上,教育、医疗、金融等多个领域应用第一;在C端,搭载讯飞星火的高端学习机、办公本、翻译机等销量也是第一。

大模型落地关键

02/

不松弛的选择

科大讯飞在大模型领域一直是被“双轮”驱动的:一个轮子是坚定不移地做自主可控的通用大模型底座;另一个轮子则是“以GBC联动的方式,推动大模型落地”。

2024年1月到2025年1月,科大讯飞连续5次升级了讯飞星火的底座能力。

首发星火多语言大模型、端到端的星火语音同传大模型、极速超拟人数字人交互、多模态影像大模型等近十项专业方向的大模型技术能力,其中包括国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1,解决了国产算力大规模集群训练在深度思考和长思维链推理方面面临的挑战。用更少的算力,更小的尺寸,达到业界一流效果。

字节跳动过去一年在C端表现抢眼,呈现出后来者居上的姿态。现在,全球范围内,从月活规模看,豆包App已经成为仅次于OpenAI的ChatGPT的AI应用。

但在另一边,科大讯飞在To B赛道呈现出了领跑之姿。

字节跳动与科大讯飞也被业界称之为大模型之战的“A面”和“B面”。

但是刘庆峰对大模型落向何处有自己的逻辑。“讯飞不是不做C端,只是不做那些泛娱乐的,信息服务类的C端。”

在他看来,星火大模型最终要落向那些可以解放生产力、要解决社会刚需、要赋能民生刚需和国家战略需求的领域,B端如此,G端如此,C端也如此。“我们的道路不一样。”

第三方机构智能超参数发布的《中国大模型中标项目监测报告(2024)》指出:2024年,在通用大模型厂商中标排行榜中,科大讯飞以91个中标项目、披露中标金额84780.8万元,排名第一,成为2024年度标王。

2024ToP6通用大模型厂商中标排行榜

从披露的中标金额来看,它是百度的两倍、智谱AI的八倍。

实际上,科大讯飞始终面向国家战略和民生刚需。哪怕是在C端,学习机、办公本、录音笔,也都是面向刚需的学习和工作场景,讯飞星火App的用户更多的是学生、白领等群体。

上述领域都缺少“松弛感”,硬核,要求更高,推广也更不容易。

“这也是我们从创业之初就坚定选择的道路。”刘庆峰说。

正因为坚定的战略、扎实的技术和多年行业的积累,央国企和行业头部公司都坚定地选择讯飞星火。

他强调:一是因为通用底座大模型讯飞星火能力强,尤其是在行业企业刚需的科研、生产、工作等场景上表现优异;二是因为讯飞星火是唯一基于全国产化算力平台的全民开放大模型;三是科大讯飞在实践中形成了整套方法论,可以助力企业更好地落地和应用大模型。

03/

少有人走的路

刘庆峰坦言,2024年,算力少、需求多,是“风雪交加、狼烟四起”的一年。

2024年9月13日,OpenAI o1推出。一个月之后,讯飞研究院首席科学家魏思就告诉刘庆峰,星火X1的逻辑部分已经跑通了。“如果用英伟达的卡早就推出来了。”

但是,科大讯飞并没有英伟达卡。国产卡只有300多G的卡间互联,而英伟达卡的卡间互联一般在600G以上。这也导致科大讯飞在今年1月才推出星火深度推理模型X1。

研究机构Omdia报告显示,2024年字节跳动投入近800亿元,订购了约23万片英伟达的芯片,成为英伟达采购数排名第二的客户;阿里投入超百亿,也拥有几万张英伟达H卡;炙手可热的DeepSeek则拥有数万量级H100。

讯飞2019年就被美国列入“实体清单”,囤卡之路早已堵死。

这逼着科大讯飞和华为一起做全国产算力化平台“飞星一号”、“飞星二号”,在国产卡基础上构建星火大模型底座能力。

和华为合作的首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”在2023年10月24日启动;2024年1月30日,首个基于全国产化算力平台训练的全民开放大模型——讯飞星火V3.5发布了;2024年10月24日,由科大讯飞联合华为、合肥市大数据资产运营有限公司共同打造的国产超大规模智算平台“飞星二号”启动;2025年1月,“飞星二号”首批算力交付。

一年过去了,讯飞星火仍是唯一一个基于全国产算力训练的全民开放大模型。

“这件事很不容易。”刘庆峰告诉元新闻记者。产业火线上的公司谁也不愿付出额外代价把算力国产化;偶尔有央国企愿意投资,但技术要求非常之高。

“所有算法要自研发,需要最好的硬件工程师,就算与华为有史以来最高规格的特战队联合去打,可能也没法做成。”

一件事变成两件事。第一件事是大模型训练,别人做讯飞也要做;第二件事只有讯飞要做,就是不断调整算力平台。如果用英伟达的卡,生态体系是健全的;可是自建算力平台是“第一个吃螃蟹”,等于要再趟一个“无人区”。

根据刘庆峰,估算第二件事至少要耗掉了30%精力。

相当于本来你有十个师,要派三个师先修路。如果多出三个师齐装满员奔赴战场,战斗力不是增加30%,而是3/7,接近40%。

科大讯飞广发英雄帖

04/

总要有人去栽树

“都说前人栽树后人乘凉,总得有人去做那个栽树的人。”刘庆峰后来说。

创业25年来,科大讯飞一直在走一条人迹罕至的“栽树之路”。

科大讯飞牵头的“多语种智能语音关键技术及产业化”刚刚在去年6月荣获国家科学技术进步一等奖。若缺失这块拼图,中国手机及汽车厂商出海就会被卡住脖子。

相较语音技术,人工智能的博弈对国家、民族、区域以及企业发展更加重要。

2023年年底的中央经济工作会议将“以科技创新引领现代化产业体系建设”列为九项重点任务之首。今后所有科学研究可能都要用通用人工智能大模型的方法重新走一遍。

去年,诺贝尔物理学奖和化学奖都颁给了人工智能相关的专家,一个是Science for AI,给了物理学家,一个是AI for Science,给了化学家。

中国科学院将AI for Science大模型底座的支撑选定科大讯飞。讯飞星火已经把合肥的“人造小太阳”全超导托卡马克核聚变实验装置的模拟实验时间从做一次二十天降到一个小时,准确率从93%提升到97%。

如果科大讯飞做不到“without NVIDIA”,无法实现国产自主可控,怎能担此重任?

“过去中国出现过教训。CPU、操作系统,都想别人去试错、探路,自己摘果子,结果芯片和操作系统的课今天还在补;但华为和比亚迪坚持自主研发,反而博出空间。”

刘庆峰

05/

讯飞的“阳谋”

大模型爆发至今已接近两年,新技术的早期狂热已经散去,AI 投资热潮消散。

AI大模型的发展,正在从顶层分叉,从预训练走向推理应用;越来越多的玩家开始选择放弃超大模型的预训练,迟早要从卷参数和算力的游戏中摆脱出来,并面对应用场景的深度探索和对技术与商业的全面整合。

这一变化也揭示了一个核心问题:技术红利的真正兑现,不仅需要创新力,更需要解决现实需求的能力。

2025,进入大模型“决赛圈”里还剩下三股力量了:一是阿里巴巴、字节跳动代表的互联网大厂、云服务商;二是科大讯飞代表的人工智能国家队,G/B/C联动;三是智谱、DeepSeek等AI创业公司。

讯飞对于自己要走的路无比坚定,战略生态位包括四个方面:第一,是坚持自主可控;第二,是面向民生刚需;第三,是面向国家战略需求;第四,赋能科研和生产,最后成为全栈自主可控的大模型国家队。

新的一年,讯飞星火要打响5场“必赢之战”:

讯飞要在认知大模型,全栈自主可控,数学、代码、语言理解等重点能力要做到业界领先;

讯飞要在教育、医疗、司法、公安行业做到第一;

讯飞要在学习、办公领域的软硬件一体化领域要引领行业,做行业第一;

讯飞要在AI for Science行业引领;

讯飞还要在多语言大模型领域,为世界提供第二种选择。

为了打赢这场仗,科大讯飞要做三件事:

一是持续探索国产算力大模型无人区,加速建成飞星二号;在全国产化算力平台的基础上持续升级大模型底座能力。

二是持续进行战略聚焦,加强C端、做深B端,选择G端。

在C端,要选准像“讯飞学习机”一样真正能够跨越鸿沟的产品;在B端,要在运营商、金融、汽车等领域将核心产品的壁垒做高,构建央国企等新的根据地业务;在G端,则要“有所为有所不为”,做对国家和人民有用的事。

三是利用自主可控的技术能力和行业合作优势,构建高质量数据飞轮。

这也一直是讯飞的“阳谋”。

所谓“阳谋”:就是我明牌了,但我做的,你可能依旧做不到,或者说你不想做。

自主可控这条路又困难、又辛苦,需要坚定的战略定义和长期主义的坚持,正因如此,这条路成了“少有人走的路”。平底起高楼,埋头建国产算力,“绝不能把大楼建在别人的院子里”,入窄门,行长路,见微光。

窦文涛问陈其钢,你们做音乐的,标准是什么?陈说,没标准。窦说,没标准,我怎么知道你好。陈说,如果你自己都不知道自己是谁,你的生命力不够强,那你怎么可能做出来打动其它生命的东西。

不一样的地方,往往就是长出生命力的地方。

踏平坎坷成大道

(通讯员 汪日贵 元新闻记者 梁巍

声明:
凡本报记者署名文字、图片,版权均属安徽商报、安徽商报合肥网所有。任何媒体、网站或个人,未经授权不得转载、链接、转贴或以其他方式复制发表;已授权的媒体、网站,在使用时必须注明 “来源:安徽商报或安徽商报合肥网”,违者将依法追究法律责任。