上个月,香港立法会来了一位“AI同事”,被大家亲切地称为“AI字幕君”。
7月16日,香港立法会正式推出智慧誊录系统“智识听”AI实时字幕功能。公众可以通过立法会网站的网上广播等平台收看带有实时字幕的立法会大会会议直播。这标志着香港立法公开透明化迈出关键一步,也为粤港澳大湾区数字政务建设树立了新标杆。
香港立法会主席梁君彦在社交平台为其点赞,称其是“人机结合的科创成果”,他还表示要将其推荐给英联邦国家。
元新闻获悉, “AI字幕君”出自安徽,由科大讯飞旗下“讯飞听见”团队打造。该项目在港落地,前后历时三年。
“AI字幕君”三年入港,背后是科大讯飞的出海战略。香港,正在成为内地大厂都要抢占的一个桥头堡。这个高度开放、消费多元、连接中外的市场,正在被寄予了出海练兵、品牌渗透的重任。
01/
“AI字幕君”,三年入港
“AI字幕君”入港,历经三个阶段。
“智识听”1.0版本始于2022年,一开始功能很简单,就是“录音转文字”。
香港立法会是中华人民共和国香港特别行政区的立法机关,同时,立法会会议的过程会逐字记录,一般被称为议事录,在立法会结束后向公众发放。
“立法会开会频繁,一天通常开会 8 到 10 个小时。”讯飞听见项目经理张坤说。
每次开完会后,香港立法会的工作人员会手动将录音导入系统,完成转写,由秘书处工作人员修改,再按特定格式输出为誊录稿;与此同时,系统还大量自动处理历史录音,“将录音转成文字”。
张坤说,以前立法会 10 个小时的录音转写需要五六个小时,但1.0上线后,“ 14 天产出的誊录版,7 天就能完成,效率大大提升。”
2021年,科大讯飞与全国人大信息中心签署战略合作协议;两年后,全国人大“智慧简报”系统正式上线。也是从2021年开始,讯飞听见服务开始全面覆盖全国人大、政协各驻地。香港立法会在看到相关成果后,开始寻求引入实时会议专业系统。
2023 年,2.0版本开始建设;2024 年上半年,智慧誊录系统二期上线。
“2.0版本中,转写是实时的。所有立法会会议能实时将议员的讲话内容转化为文字,这也是首次在实时会议中引入中英粤语混读识别引擎。”张坤说。
二期上线同时,香港立法会宣布建设智慧誊录系统三期(“智识听3.0”),特点是“配备实时字幕和后置字幕”——这也就是7月16日香港立法会推出的智慧誊录系统“智识听”AI实时字幕功能。
香港立法会网上广播系统
02/
融入香港,首用三语混读引擎
从1.0到3.0,皖产 AI系统一直克服在本地化难题。
香港立法会会议使用香港本地化、口语化的粤语词汇,这些词汇需要转化为书面语,也涉及翻译问题;而会议中法律相关专业术语较多,不同于香港人使用的日常语言。
另一方面,立法会中约有 10% 议员讲英语,粤语、普通话、英语同时出现;部分从内地到香港的议员,为融入环境讲粤语,连本地人都听不懂。
为此,香港立法会专门提供了包含 2 亿字的中英对照语句表,提升文本翻译和文档翻译效果;秘书处还准备了2亿5000万字议事录、400小时会议录音音频以及20万组关键词。
“香港立法会项目也是首个使用‘中英粤三语混读引擎’的项目,立法会提供的大量真实会议语料标注训练,经过数据和算法的优化和不断的训练,立法会会议实时字幕的准确率达96%。”张坤称。
今年,科大讯飞还将底层引擎从 CPU 版本换成了 GPU 版本,大模型也升级为星火 X1 版本,底层能力得到大幅提升。
梁君彦在向媒体解释“实时字幕”功能时说:“智识听”在立法会会议期间会记录与会者发言,将粤语转化为书面语,AI会根据上文下理和语言学特征智慧断句。幕后秘书处会在字幕自动生成后,在10秒钟之内把关、修改,做到“人机合一”,字幕随后加到直播画面中,过程不足20秒。
“这种人机结合的科创成果,有赖于科大讯飞团队努力不懈研发实时字幕、对接立法会应用场景,以及立法会秘书处各部门的全力投入,共同孕育出这套AI系统,让它茁壮成长。”
香港立法会会议 实时字幕显示
03/
伏笔三年,开始抢滩香港
伏笔埋了三年,香港立法会成为讯飞出海战略的关键一手。
梁君彦后来在接受媒体采访时表示,要将“智识听”推荐给英联邦国家:
「科技是时代的高铁,你如果上不去,就会被社会的发展抛下。这几年,内地在人工智能领域的发展日新月异,香港也不能掉队,要积极与内地科技企业合作,推动立法会智慧化转型。」
在“智识听”1.0版本上线的2022年底,《香港创新科技发展蓝图》对外发布,为未来5至10年香港创科发展制订清晰发展路径和系统的战略规划,明确了香港创科发展的四大方向,包括“完善创科生态圈,推进香港‘新型工业化’”“壮大创科人才库,增强发展动能”“推动数字经济发展,建设智慧香港”和“积极融入国家发展大局,做好连通内地与世界的桥梁”。
从2024年开始,科大讯飞启动国际化战略升级。刘庆峰说,科大讯飞要坚定不移地为世界提供“第二选择”。
而讯飞出海的“桥头堡”就选定在香港。
2024年11月,讯飞医疗入选香港特区政府引进重点企业办公室的“重点企业伙伴”,并于12月成为港交所主板上市的“医疗大模型第一股”;同年7月,科大讯飞宣布在香港投资4亿港元设立国际总部,并建立国际研发中心。
科大讯飞香港国际总部的设立与讯飞医疗的分拆上市形成了战略协同。
科大讯飞(国际)有限公司开幕仪式
香港是一个很复杂的市场,但人多、钱多、人口密度大。以香港为基地,讯飞正积极响应国家人工智能全球战略,展开顶层布局,和欧洲、中东、东盟等国家开展紧密合作;而服务粤港澳大湾区“三语互通”需求的多语种会议系统可能正是破局先锋。
今年6月,科大讯飞香港公司开幕。科大讯飞面向中、粤、英多语种混合的港澳市场同时发布了基于讯飞星火大模型底座能力研发的医疗、教育、会议、办公等多领域人工智能产品。
发布会的核心亮点,正是讯飞听见多语种会议系统的正式发布。迄今为止,该系统在香港贸发局、香港联通等单位均有应用。用科大讯飞副总裁王玮的话说“已打通三关”。
今年,科大讯飞在海外市场再次突破。一年来,海外开发者数从38.6万增加到50.9万,同比增长31.9%;海外AI营销业务营收,从去年1-5月份的900万增加到今年1-5月份的2.3亿,同比增长25倍;海外C端硬件的营收增加3倍。更值得一提的是,科大讯飞自主研发的星火X1已支持130+语种。
讯飞星火AI大模型展项亮相大阪世博会中国馆
04/
科大讯飞,已成高规格会议标配
7月26日,诺贝尔奖与图灵奖双料得主杰弗里·辛顿现身2025世界人工智能大会(WAIC)。杰弗里·辛顿演讲完后,中国外交部原副部长傅莹告诉他:“杰弗里,今天你的演讲我听得非常清楚,屏幕上有实时中文翻译字幕,AI一直在翻译你的话。”她接着还告诉杰弗里·辛顿:
「AI在聆听你。(AI is listening to you!)」
傅莹口中的“语音同传”,和梁君彦口中的“智识听”出自同门。科大讯飞是2025WAIC唯一翻译合作伙伴。杰弗里·辛顿的演讲内容横跨AI发展史、认知科学、科技伦理、人类未来、量子计算隐喻等复杂领域,但杰弗里·辛顿演讲的中文字幕体验却极为流畅,几乎达到无感程度。
科大讯飞相关人士告诉元新闻,讯飞听见已经服务全国人大四年,服务全国政协七年。其中:
在2025年的十四届全国人大三次会议上,提供了160套智慧简报系统,服务34个代表团,完成1290小时会议记录和转写1875万字,识别率96.2%;
在全国政协十四届三次会议上,提供了60套智慧简报系统,支撑372场分组会议,覆盖58个界别。
2022年,讯飞多语种技术还助力北京冬奥会和残奥会,使之成为人类历史上首个信息沟通无障碍奥运会;科大讯飞还是2023布达佩斯世界田径锦标赛语音技术及多语种翻译合作伙伴和2024年巴黎奥运会“中国之家”人工智能技术独家供应商。
“在整个高端会议领域,讯飞已经掌握了绝对的话语权。”一位业内人士称,“严肃会议、规格会议、高权威会议用科大讯飞已成为一种共识。”
元新闻了解到,由于前三个版本识别和翻译效果良好,香港立法会正在建设4.0版本,该版本将建设“英语字幕和多语种字幕系统”;与此同时,香港立法会还拟沿用成熟技术开发“智慧办公系统AI 助手”和基于讯飞星火大模型的“知识问答和智能摘要”功能。
“4.0版本预计将在今年8 月启动建设多语种实时分布系统,方便香港不同文化的市民看到更丰富的语言字幕。”
(安徽商报 元新闻记者 梁巍 “出海”系列报道⑤)