【明报专讯】近年,先后出现了多个演唱会以「元宇宙」概念为卖点。有本地科技公司认为,与其局限在少数演唱会上使用,倒不如将有关技术标准化、普及化,扩大应用到大型会议、研讨会甚至创业比赛等,以协助打破语言和地域限制,以及加强参加者的互动体验。有关方案已开发完成,未来两个月将会有两个活动率先使用。
明报记者 薛伟杰
MUXIC Limited行政总裁邹健宏表示,最初是因为该公司接到生意,为演唱会开发技术,以加强互动,「例如,观众可以(在网上)向歌手派心心、留言鼓励或点唱。甚至,观众间也可以『虚拟拥抱』等」。
当时他觉得,每接到一单这种生意,公司都要花大半年开发,但这种生意不是常有,好像不太划算;是否可以将有关技术标准化、普及化、重用,以扩大市场和应用范围?他想到,大型会议模式和演唱会相近,但数目和举行频率高得多。而且,现时很多研讨会都同时在线下和线上举行,该公司以往为演唱会开发、?重虚实结合的技术,正派上用场,于是决定将相关技术作进一步整合、开发、优化和标准化,成为一套「元宇宙会议方案」。
支援多种语言 数字化身与真人同步
邹健宏指出,元宇宙会议方案有几个特点。第一,透过语音辨识和翻译技术,支援多种语言,暂时为英语、广东话、普通话。讲者以任何其中一种语言演说,系统可自动辨识,即时翻译,让现场大屏幕同时出现多种语言字幕,方便现场观众。至于在网上收看的观众,可在登入时选定一种语言,之后所有讲者演说都会自动翻译。网上同时参与的观众,最多可达5000人或以上。理论上,方案可支援很多种语言,但广东话和其他语言互译较复杂,为保持较高准确率,该公司初期只支援英语、广东话、普通话。
第二,网上观众可选择观看讲者真人或「数字化身」。数字化身的动作和真人相同,以及接近同步。因为元宇宙会议方案会使用人工智能技术分析讲者的动作,然后控制其数字化身做出相同动作。
第三,当讲者正在演说时,任何观众都可以透过网上发问,让讲者选择是否回应。而且,考虑到讲者逗留的时间有限,元宇宙会议方案特别有一个「左右脑」功能,可以在会议之后代替讲者,来继续回答网上的问题(事先需获得讲者的同意和授权)。
「左右脑」功能代讲者回答问题
「左右脑」是指会用到两个人工智能大型语言模型(LLM),来代替讲者回答问题。第一个大型语言模型是该公司自行开发和训练的,视作「右脑」,讲者需要事先将其讲稿或者简报档案交给该公司,让该公司对这个大型语言模型进行「加操」;第二个是ChatGPT,视作「左脑」。
实际运作时,观众在网上发问而讲者未有回答的问题,会先传给「右脑」;若「右脑」能够全部答到,就即时输出答案。若「右脑」有资料不齐全或不肯定(尤其涉及最新经济或金融数据等),未能完全回答,则会交给「左脑」去找。之后,「左脑」再将有关资料传送回「右脑」。「右脑」对那些资料筛选,将具有政治、宗教、暴力或色情敏感字句过滤,结合它原有答案,才输出成最终答案。
这个「左右脑」功能,一方面有如让讲者「分身」,满足到大批想发问的观众;另一方面也相当稳阵。时间方面,即使是用到「右脑→左脑→右脑」这个模式,亦只需两至三秒,已可输出答案。而且,在网上发问的观众还可以自由选择,公开或不公开问题;若选不公开,只有他自己能够看到问题和答案。所以,理论上,可以让数千个观众都有不同的体验。
元宇宙会议方案现已完成开发,将会应用在12月一个财经界颁奖礼,以及明年1月一个上市公司年会。邹健宏表示,现时仍然有些属于试??u性质,该公司未定下正式收费计算方式,所以对这两个活动主办机构收费只属「象徵式」。但他相信,只要证实到运作畅顺,将来可能会有不少活勾x??用,每个月几场也不出奇。
尤其是涉及到科技、学术的研讨会,未必很多人可抽时间搭飞机到场出席。若采用元宇宙会议方案,可让不同国家的人参与和认知,甚至部分讲者也不必亲身出席。此外,大型展览会、创业比赛等同样适合采用,尤其是连续数日举行的「黑客松」比赛。
今年7月中举行的「虚拟经济博览及会议」,已应用这个方案的技术。当时,参加开幕礼的现场观众可进入一个投票网站,自由输入字词。最多人输入、屏幕上出现频率最高的几个字词,就被AI系统采用,成为创作歌曲的主题。然后,AI系统即时生成了一首英文歌,由主办机构负责人的数字化身唱出来。