“AI孙悟空”对话全球:讯飞星火AI大模型亮相大阪世博会中国馆
来源:安徽商报 责任编辑:陈卫华 分享到 2025-04-14 15:57:20

精通三国语言的“数字大圣”,为全球游客提供幽默问答和智慧导览。记者4月14日获悉,在4月13日开幕的日本大阪关西世博会上,科大讯飞依托自主可控讯飞星火大模型打造的支持中、日、英三语实施交互人工智能大模型展项“AI孙悟空”正式亮相,为中国馆唯一大模型展项。

“悟空,你好!”打招呼间,只见身穿西瓜裙、手拿金箍棒的“AI孙悟空”腾云驾雾现身于水墨云海中,以动画《大闹天宫》高还原声线说道:“俺老孙来也!”

“中国にはたくさんの美しい景色があるそうですが、紹介していただけますか?(听说中国有很多美景,你能帮我介绍一下吗?)”一位日本观众也将手机镜头对准画面问道。

话音刚落,“AI孙悟空”迅速切换日语答道:“この孫悟空にとっては、もちろん詳しいんだ!中国の美しい景色は数えきれないほどたくさんあるよ。万里の長城は雄大で威厳があり、まるで巨大な竜が山間に這いつくばっているようだ。杭州の西湖は柔らかく美し、四季折々の景色にそれぞれ独自のおもしろみがある。そして黄山は奇抜な松、奇妙な岩、雲の海があり、どこも素晴らしくて言葉では表現しきれないんだぞ!(那俺老孙可太懂了!中国美景多到数不过来,万里长城巍峨雄伟,像巨龙盘踞山间;杭州西湖柔美秀丽,四季景致各有风情;黄山更是有奇松、怪石、云海,每一处都妙不可言呐!)”

“AI孙悟空”带给观众新奇人工智能互动体验

虚实交织的展台中央,“AI孙悟空”正通过讯飞星火大模型展现技术内核——以全国产自主可控的讯飞星火大模型为基础,融合了多语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,跨越覆盖文字、图像、语音等多模态。在聚集众多观众的世博会现场,“AI孙悟空”也能听清、听懂观众说的问题,生动还原孙悟空惟妙惟肖的动画角色形象和声线,以中、日、英三种语言与观众展开自由深度的交流。

当日本观众提问:“即将去中国旅游,你有什么美食推荐?“AI孙悟空”立即推介:“要说中国美食,俺老孙可有太多想推荐的了,北京烤鸭薄如蝉翼,四川火锅辣似老君炉,江南小笼包汤汁烫舌,山西刀削面耍得比俺金箍棒还溜!记得地道的老字号品尝品尝!”

据介绍,该展项由科大讯飞与上影元联合共创,呈现上海美术电影制片厂在20世纪60年代创作的经典动画《大闹天宫》中的孙悟空形象。科大讯飞对经典形象进行技术化赋能与重构,通过形象建模、语音合成、唇形预测、图像处理等AI核心技术,在讯飞星火大模型的加持下,成功让领先的技术与经典动画形象结合,让每个腾云驾雾的姿态都承载着跨越甲子的文化记忆。

技术赋能下的传统文化新生,在观众提出“画一幅春江水暖鸭先知”时尤为显著。只见屏幕中的“AI孙悟空”手指一点,“俺老孙可不会画画,但你既有求,定不叫你失望,变!”一张有古诗意境的画作快速呈现。

日本大阪西关世博会中国馆

科大讯飞相关负责人介绍,依托讯飞星火大模型底座,让“AI孙悟空”具有了认知能力;还深入挖掘“孙悟空”的文化精髓,通过讯飞AI虚拟人交互平台构建了与大阪世博会紧密融合的交互式知识库,让“AI孙悟空”不仅能够面对面与用户亲切交流、幽默解疑,还能实现即时响应的问答互动及精确无误的导览服务,让每一次互动都充满趣味与便捷。

在星火大模型基础之上,融入并加强了多语种能力而成的星火多语种大模型是“AI孙悟空”精通中、日、英三语的核心支撑。目前,星火多语种大模型已实现支持中、英语外的8个语种,包含日语、阿拉伯语、俄语、西班牙语、法语、葡萄牙语、德语及韩语,最新版本在M-MMLU、XStoryCloze、MGSM、FLORES等十多项覆盖综合考试、语言理解、数学、翻译等能力的国际权威多语种相关开源榜单测试中,能力平均值超越最新的GPT-4o和DeepSeek V3、R1,处于国际领先水平,给世界提供第二种选择。目前,多语种大模型已在汽车、家电、办公、翻译等领域应用。

目前,在人工智能国际生态方面,科大讯飞开放平台国际站的上线为全球开发者提供语音识别、语音合成、机器翻译、图文识别等人工智能服务,目前海外开发者团队数已达49.6万。

(安徽商报 元新闻记者 郜征 通讯员 许可亮)

声明:
凡本报记者署名文字、图片,版权均属安徽商报、安徽商报合肥网所有。任何媒体、网站或个人,未经授权不得转载、链接、转贴或以其他方式复制发表;已授权的媒体、网站,在使用时必须注明 “来源:安徽商报或安徽商报合肥网”,违者将依法追究法律责任。