声网发布aPaaS灵动会议 AI成为下一代视频会议的新方向
9月24日消息,声网正式发布aPaaS “灵动会议”,该产品采用RTE Core 和 AI Core 的双引擎深度融合,能够灵活适配多种会议场景业务需求。
基于声网自研的AI Agent 框架,“灵动会议”能够兼容市场上主流的 ASR(自动语音识别)、LLM(大语言模型)和 TTS(文本转语音)技术,具备Workflow编排能力。尤其是声网的 AI 框架支持多模态大模型的集成,这意味着企业不仅可以使用单一模型(如语音识别模型),还可以将多模态的大模型能力(如图像、音频、文本处理等)融合到一起,满足更复杂的会议场景需求。
同时,通过“灵动会议”产品底层的AI框架,开发者可以高效地集成会前、会中、会后场景的多种 AI 功能,如AI会议纪要、实时翻译、AI助手等,满足实时互动和会议场景的需求。
开发者还能通过“灵动会议”的产品架构将这些 AI 功能独立对外赋能其他产品,这意味着企业不仅能在会议场景中实现智能化升级,还可以通过灵动会议的 RTC 与 SIP 网关互通功能,应用于如 AI 电话客服等场景,大幅降低客服成本,提升运营效率。
在集成方式上,“灵动会议”采用aPaaS低代码设计,通过提供模块化的API、UI组件和即插即用的集成功能,使得开发者可以在较短的时间内完成集成,无需进行大量的底层开发。如果UI不能满足,“灵动会议”可提供多层次API接口与插件机制,支持基于SDK Core层和 RTE PaaS 层的定制,满足多场景需求。
“灵动会议”支持 SFU+MCU 混合架构。“MCU 模块与 SFU 模块直接集成,抛弃了传统的网关架构,通过裸流通信技术,实现终端设备与云端的直接互通,解决了网关集成时的画质损失问题,并且混合架构支持 MCU 上的多个硬件终端与云端 SFU 的软终端之间的多画面灵活组合,用户可以自主选择多个视频流进行合成,不再局限于画中画模式。
此外,在部署方式上,“灵动会议”支持多种部署模式,包括私有化、混合云、公有云等,能够灵活适应企业的不同安全和合规要求。同时,“灵动会议”还支持混合云和公有云的无缝备份与切换,确保业务的连续性和数据的安全性。
会议系统正在经历从“信息通道”向“智能决策引擎”的转变,过去的会议系统只承担信息传递的功能,而如今,AI 赋能为会议提供了更多智能化的支持。那么,AI浪潮下,应该如何重塑会议与协作体验?
在谈到AI为视频会议带来的改变时,会畅通讯产品总监王晖提到,利用 AI 为企业客户提供定制化的功能,在会前、会中、会后都加入AI,让会议沟通更加有效率,开会体验更佳。科达-摩云视讯销售总监俞中则认为,随着底层音视频能力与AI自身学习能力的提升,视频会议的整体效果会演变得更加优秀,比如沉浸式的3D场景将会是 AI 大显身手的方向。
声网数字化会议解决方案负责人尚敬超认为,“AI 技术会让视频会议脱离工具属性,真正融入生活,例如原本成本较高的同声传译场景,通过 AI 也可以让多语言视频会议的成本进一步压缩,降低所有人的使用门槛。”
关于会议AI 的想象空间,京东科技协同办公业务部产品经理曾冠认为,“通过 AI 和穿戴设备,未来的沟通方式将从信息沟通变为“所见即所得”,帮助用户快速获取想得到的内容,从而更好的服务于工作。”尚敬超认为,“未来的会议主要是AI参与,人只需要最终下一个指令做决策,从而摆脱无穷无尽低效会议的束缚。而这背后,实时性和辅助决策也是最重要的两点。”(周小白)