当前位置：活动网 / 活动快报

微现场带你了解AI智能会议同传系统

2020-12-17 95

文章摘要：开会从来不是件轻松的事，开大型会议尤其如此。除了会议前的大量准备工作，会议中还要有人负责会议记录，如果演讲者和听众语言不一致，还要有专门的同传人员进行翻译。随着语音转写

开会从来不是件轻松的事，开大型会议尤其如此。除了会议前的大量准备工作，会议中还要有人负责会议记录，如果演讲者和听众语言不一致，还要有专门的同传人员进行翻译。

随着语音转写和机器翻译技术的日渐成熟，出现了语音输入法、智能翻译机等C端产品，满足了速记笔记、旅游翻译等用户需求。在中大型会议场景下，也广泛存在会议速记、会议同传等需求，但市场上能满足相关这种需求的产品却寥寥无几。因此，我们尝试将语音转写和机器翻译应用于中大型会议场景，用AI技术让会议速记、会议同传更加更加方便。

本文介绍了智能会议系统的产品分析过程和详细设计方案。

微现场AI智能同传系统性能强大，支持多种语言，欢迎咨询

场景和需求分析

会议场景有很多种，抛开会议规模、多媒体设备等因素，仅考虑发言人角色，就有产品发布会这样的单人演讲、博鳌论坛这样的多人对话，也有记者会这样的主持人与观众的对答。

后两种场景下存在多个输入音源，对话过程中有话筒传递、对话被打断、音源输入重叠等情况，会极大影响语音识别的准确率。因此在第一个版本中，我们只考虑单人发言的情况。

除了上面提到的产品发布会以外，单人发言的典型场景还有政府工作汇报、学术汇报和各种形式的大会演讲等。

微现场带你了解AI智能会议同传系统

这一场景中的需求除了速记和同传，还包含转写/翻译结果投屏等需求，详细需求描述如下：

准确地将语音转写为文本需求
转写准确率直接决定转写结果的可阅读性，也间接影响了翻译效果，是决定该系统是否可商用的最重要因素。目前各大竞品所宣称的转写准确率普遍在95%以上，我们的准确率不能低于该标准。
转写结果实时翻译需求
很多知识分享大会（如 I/O开发者大会、IxDC大会）、学术报告、产品发布会都存在发言人语言与听众不一致的情况，因此转写结果支持实时翻译也是基本需求之一。从团队算法能力出发，会议系统前期需支持中英互译。
转写和翻译结果延迟低需求
为确保阅读效果，文本展示延迟要做到1s以下才可用，参考同类竞品，会议系统的延迟应该在200～300ms。
转写和翻译结果实时投屏需求
将翻译结果传达给听众有两种方式，一种是将文本结果投影在大屏幕上，一种是将文本结果合成语音后播放，后一种技术不成熟，目前采用投屏的方式。
转写和翻译结果支持编辑的需求
受限于算法能力和声音采集效果，目前的转写和翻译结果还无法做到完全正确，因此结果需要支持编辑。为了提高出稿效率，最好在发言人演讲的同时就能对结果进行编辑。
内容安全保密需求
行业内部展会、企业高层会议、政府人员讲话等会议场景对会议内容保密性要求较高，会议系统需要确保内容不能轻易泄露。

除以上几个高优先级需求外，较低的需求还包括投屏字幕样式可调整、转写翻译结果可导出等，此处不再详细说明。