后稷网 > 文化产业网往期影视表演

智能语音技术对配音行业的影响

2023年05月12日 00:00

伴随信息技术日新月异的发展，人工智能技术愈加成熟且完备，被广泛应用于各个领域。其中，与人工语音创作相比，智能语音技术成本低、效率高，还有高精度的语言语料库，同时具有规范语音，表达错误较少，随时在岗，应用成本低廉等优势。因此，智能语音技术被广泛应用在各个场景中。这给配音行业带来了机遇和挑战。现着重探讨智能语音技术对播音主持专业分支配音专业带来的影响，从目前智能语音技术在配音行业的应用情况以及智能语音技术对配音领域的各个分支的冲击等方面着手，讨论市场用户的收听喜好情况对配音市场未来的影响，以期在培养配音专业人才中调整培养内容与方向，探讨“人工智能+配音创作”的未来发展方向。

目前智能语音技术在配音领域的应用情况

随着新一轮产业的变革和5G技术的进步，人工智能技术愈加成熟并渗透到各个领域[1]。在此背景下，智能语音合成技术逐渐进入人们的生活中，从早晨起床打开微信推文《早啊！新闻来了》听到康辉的智能语音播报，到唤醒家里的天猫精灵收听智能语音播报获取当日天气情况，到上班路上开车时听到的车载导航沈腾智能语音包，到休息时打开短视频收听文本转换语音后的解说，再到打开喜马拉雅收听用tts技术完美还原的单田芳老先生声音的评书等。智能语音技术成本低、效率高的特征和丰富的语言语料库给配音行业的真人配音员带来了巨大的挑战。

目前，语音播报领域如天气播报、导航播报、游戏语音等已被智能语音所占领；在有声书配音领域，向读者提供了人工配音、智能语音配音或者人工加智能配音多种选择方式；在纪录片配音领域，先进的tts技术重塑了很多著名配音员的声音，因纪录片的情感变化幅度相对较小，音高和情绪相对稳定，后期的调节工作也很方便，但目前只应用在复原一些著名配音员的经典声音上；在动漫配音领域，语音合成演示成熟度高到语调、情绪、停顿都很融洽，与真人的区别不大，因其势头刚起，目前还在尝试推行阶段，尚未被广泛运用；在广告配音领域，因智能语音智能化程度不够，配音的情绪无法贴合画面，且语言生硬、腔调固定，故而对高端声音市场的影响尚且不大；在影视配音领域，因其艺术化程度较高、形式生动丰富，智能语音达不到要求，所以目前很难取代真人配音员。

智能语音技术对人工配音领域各个分支的冲击与影响

语音播报领域已大幅度被占领

随着智能化时代的到来，在人工智能语音环境下，智能语音播报已经融入人们的生活场景中。语音播报是利用语音合成技术将文字迅速转换为清晰的智能语音，主要运用在话费查询、车站播报、信息咨询、语音信息播报等服务场景中。

智能语音播报需要在后台系统设置播音员的声音，然后选择播报行业的音库，操作人员可以输入文字或者导入TXT文本文件，再通过设置音量、音频、数字读法、英文读法等控制选项对播音内容进行操控，根据需要还可以加入背景音和播音的发音风格，直接生成本次播报，也可以保存项目下次调用[2]。

在电信服务、交通服务等行业，智能语音播报已被常态化使用；在手机客户端中，随着配音软件越来越多，听众可以直接使用文字转语音的功能；家居生活中的机器人更是能通过识别用户语音迅速查找信息并完成实时对话播报；出行的导航系统更是推出了定制播报语音的功能，让用户录制自己的专属语音包。智能语音播报一是具有便利性；二是提升了各行业的服务效率，缓解了播音员的压力；三是用户能够及时获取信息；四是大幅度降低了人工播报出错率。因此，传统的人工语音播报已经无法更好地满足用户日益增长的个性化需求，语音播报领域已大幅度被人工智能语音所占领。

对有声书人工配音市场影响参半

口述故事和声觉空间构成了有声故事书的内核和外衣，用户在有声书的非线性互动叙事中创建自己的故事。有声读物从印刷书籍的外围副产品转变为数字出版和阅读的中心，从实体发展为纯数字形式，逐步成为大众娱乐休闲的一种方式，其不仅数量庞大、形式多样，阅读量也遥遥领先[3]。

有声书市场上已经出现人工配音、AI主播配音与AI真人相结合的听书模式，但目前大多有声书平台热门的有声书仍采用以配音员为主导的传统模式。随着市场的不断扩容，人工配音存在生产效率低、制作成本高等问题，而中文在线的文本转换语音技术一天即可实现500万字的内容转录，大大节约了制作成本，实现了高效的音频生产，因此文本转换语音的快速合成方式被各大有声书生产商尝试使用，如咪咕阅读为其售出的电子书提供语音朗读功能。

同时，智能语音技术能够给受众提供多种选择，如讯飞有声书采用科大讯飞语音合成4.0技术，拥有几十位风格不同的男声、女声朗读主播，还支持多种方言、趣味童声及外语听书，但声音空间与用户使用场景的匹配度不够高，如听众在睡前需要沉浸式声音体验，在休闲场景需要轻松愉悦的声音体验等，目前科大讯飞正在开发声音空间匹配听众使用场景的功能。

另外，逐渐成熟的语音合成技术使得听众可以听到经典名人配音员的作品，如喜马拉雅平台上线的用语音合成技术完美还原单田芳先生声音的评书深受用户喜爱，长期位列热播榜前列，AI配音的优势愈发明显。

但AI配音的声音仍存在壁垒，一方面，缺乏温度，语气转换不灵活，轻重音变化不明显等，使得文字包含的情感难以有效传达；另一方面，智能语音的音量是比较恒定的，听众难以感知立体化的声觉空间。有声读物应该给听众打造更加直观的视觉立体场景，听众收听后会被唤起听觉感知，产生情景感，而AI在进行讲述时由于恒定的音量导致听众只能自己发挥想象，自行在大脑中构建故事场景。

因此，在短期内，AI配音难以完全替代人工配音，但生产商为了提升工作效率和节约成本会选择出品在AI辅助下人机结合的有声书。

对电视纪录片配音解说的影响有待观察

纪录片《创新中国》是世界首部采用人工智能配音的大型纪录片。在制作中，制作团队利用智能语音和人工智能技术，让已逝的著名配音艺术家李易老师的声音重现荧幕，并将李易老师的声音分为三类分别运用在情绪高昂的宣传片、平缓叙事的纪录片、声调较低且松弛的自然类纪录片中，团队把音色、韵律和内容三方面进行量化，再解决断句、重音及连贯性的问题，然后进行精剪，最后呈现出的作品让人赞叹！

但是纪录片需要有配音员自身独特的思想性、创造性及分寸感，稳定的发音状态及有微妙变化的情绪，这些是计算机的精妙算法所无法实现的。人与人之间的沟通表达经历了漫长的变化，这种技能人工智能学习起来尚且困难[4]。因此，真人解说具有独特的优势。

语音合成技术可以还原经典名人的声音。这需要掌握语料中个人声音的独有特质，再模拟出与本人非常相似的声音，通过后续细节调整才能让合成音基本贴合本人。纪录片制作周期长，对解说时间的要求比较宽松，与智能语音相比，人工配音解说能够更好地传达出纪录片独特的内涵。因此，智能语音在影视纪录片领域的应用情况有待进一步观察[5]。

对动漫配音领域的影响正在开启

目前，动漫配音在我国处于蓬勃发展的阶段，动漫配音要求声音富有弹性，生成的声音符合动漫人物或动物的个性，而人工智能语音做出固定强调和适当夸张的语音成分是其擅长之处，情绪起伏变化也在不断突破和更新。目前，市场推出的部分智能语音作品已经基本听不出太多生硬的痕迹。由于人工智能具有极大的优势，人工动漫配音领域未来很有可能被其分一杯羹。

广告配音的低端市场将被挤占

广告配音是通过声音展现出某一产品的特点，使得观众产生购买欲望，其主要目的是宣传产品特性，引发消费者情感共鸣，让消费者产生购买行为。此外，情声画有机结合才是一条完整的广告。因此，广告不仅需要适合特定产品的声音形象，也需要分析用户的消费心理、产品定位等，以形成独特的配音风格，还要贴合画面对声音进行有机变化，而这些都是机器目前难以量化和实现的[6]。

在传统配音市场中，固定腔调的表达和音质较差的作品在语音合成中可以轻易实现甚至被超越。当前智能语音合成在标准统一化和个性发展化中有足够的优势，工作效率高和成本低的优势使其迅速占领低端市场。但是高质量、符合产品特性、迎合消费者心理、树立品牌形象的人工配音创作的宣传片和广告片在市场上仍具有极强的竞争优势。

对影视剧人物配音的影响不大

影视人物配音是由配音员或者演员本人面对拍摄的画面以有声语言为表现手段，为片中角色进行后期配音的创作活动。影视人物配音是建立在剧作家一度创作和演员二度创作基础上的三度创作。在配音前，配音员需要和配音导演进行深入沟通，理解一度创作表达的思想情感，然后结合视频成品观看演员台词和剧情情境进行备稿、创作，通过一次次调试完成贴合作品情景画面，贴合演员动作及口型以及贴合台词情绪的成音。而这些对人工智能语音来说非常困难，其很难识别和理解丰富的人物情绪、细微的动作变化，并配出相应的声音，即使启用后期调试功能，一是画面中一帧帧变化耗费时间较长，二是机器难以思考和表达出导演及演员想要表达的情感内容。因此，人工智能语音合成技术对影视剧人物配音的影响微乎其微。

用户收听喜好的发展对配音市场的影响

一项针对人工智能配音适应性的抽样问卷调查显示，在资讯消息和语音播报等场景中，超过半数人从一开始就没有排斥；将近五分之一的人在使用中不适感逐渐消失；只有16%的人认为人工智能配音缺乏独特性，更倾向真人配音。这些场景中，人们的情感交互需求并不强，绝大多数人也没有明显的排斥，因此在一些用户情感要求不高的配音作品中，智能语音占据极大优势。

调查还显示，在一些情感交互较强的文本中，用户更倾向高质量的真人配音，无思想感情的智能语音本身就不存在独立思考的能力，它必须依附人类为其提前设定好的编码程序才能工作，即使拥有丰富的语料库，具备停连、轻重音、语气的综合处理能力，但对于艺术性、创造性、个性化有要求的广告配音、纪录片配音作品来说，智能语音无法满足其需求。另外，对于部分情绪及声音变化丰富的影视人物、动漫角色、有声小说角色，如果使用智能语音，就需要大量的后期调节工作，处理起来麻烦且不一定能达到很好的效果。

因此，随着合成技术的不断升级，人工智能语音技术不断提升，其能够更加逼真地还原出真实的人声，但在理解用户意图、独立思考和呈现丰富的声音变化上，还要走很长的路。而在一些情感交互要求较强的配音作品中，其仍然无法替代人工配音。

结语

综上所述，人工智能语音的发展给配音行业带来了巨大的冲击。“人工智能+配音创作”已经成为时代发展的必然趋势，也是顺应市场发展和满足用户需求的必然方向。在未来，应当顺应时代发展，提升行业整体水平，在培养配音专业人才方面：第一，着力于提升语言功底，创作内涵丰富、深刻、独特、独具魅力的作品；第二，加强对多学科基础的学习，如语言学、社会学、心理学等，通过分析文本需要传递的精神实质及用户心理创作出更多深入人心的作品；第三，对有声书、广告片、宣传片、影视配音等进行深刻研究，打磨好每一个细节，创作出更好的配音作品。在人工智能辅助下，人工配音创作应找准方向，发挥出自身的独特优势，碰撞出璀璨的“创新之花”。

注释

[1]郭栋,肖爱云.“互联网+”趋势下人工智能在配音中的应用[J].西部广播电视,2018(20):186+188.

[2]翁佳.智能语音技术对播音主持专业与行业影响探究[J].电视研究,2017(12):57-59.

[3]刘银娣,杨杨.媒介本体论视域下有声故事书智能生产研究[J].出版发行研究,2022(03):32-39.

[4]吴婉璐.我国影视剧配音现状及发展研究[D].南昌:南昌大学,2018.

[5]曾谁飞,王仁波.语音合成技术在智能语音播报系统中的应用探析[J].电信科学,2010,26(03):64-68.

[6]王伟.广告配音的个性化传达与实现路径[J].记者观察,2022(23):25-27.

责任编辑：史偌霖

原文地址：http://www.whcyzzs.cn/html/2023/0512/4024.shtml