广州商学院艺术设计学院

学校主页

您所在的位置：首页 - 艺术讲堂

艺术讲堂

艺术设计学院开展“美与时代”博士系列沙龙（九十）：AI在音频制作中的应用与局限

作者: 王康 | 日期:2025-06-06 | 点击量:

2025年6月5日，艺术设计学院在艺术楼210工作室开展了一场主题为“AI在音频制作中的应用与局限”的学术沙龙。本次沙龙面向艺术设计学院数字媒体艺术专业学生，由王康博士担任主讲。

活动伊始，王康以一首钢琴演奏开启了本次声音的论坛，并以互动交流的方式开场，引导师生们围绕“在动画与影视作品制作中大家如何选用音频”“对音频通常有哪些修整及处理”“分享个人生活中相关录音、录歌、配音经历”以及“在音频制作领域你了解并使用过哪些AI手段”问题展开探讨与分享，大家各抒己见，从实际经验出发，分享了不同的音频制作方式与见解。

随后，王康进入本次沙龙的核心内容讲解，围绕AI在音频制作中的应用、局限以及我们还能做什么三大板块展开，为师生们带来了一场极具深度与实用性的知识分享。在“AI 能做什么”板块，王康详细列举并剖析了当下各类AI音频赋能软件技术。以视频剪辑软件为例，其不仅可以对录制人声进行变音等声效处理，还能依据输入文字一键生成声音形成文本解读音频；提及豆包时，着重介绍了利用智能体克隆声音的功能，像父母可克隆自己声音为小宝贝讲故事，充满趣味性与实用性；在歌曲制作领域，AI展现出强大的创作能力，从作词、作曲、编曲到配器、制作伴奏、演唱，均可生成一首完整的音乐，同时还推荐了即梦、天工AI等相关平台以及 Cubase、Fl Studio 等软件插件的自动生成伴奏功能，此外，AI还能精准查找音效素材包并推荐合适的音效资源网站，体现了强大便捷精准的搜索功能，在影视声音获取部分，王康提供了RX11、UVR5等三种音频分离软件的讲解。丰富的案例与细致的讲解，让师生们全面了解到AI在音频制作中的多元应用。

在“AI 不能做什么”环节，王康引导大家结合分享内容与音频课程知识进行思考，深入探讨了AI在音频制作中的局限性。AI无法进行实时拟音录制，只能提供网络上现有的固定音效素材，难以给予艺术创作深度的理解与情感表达；在影视声音与画面的精准匹配及声学空间布局方面，如声场、声向、音量参数等细微调节上，AI存在明显不足；AI一键校对音准的结果存在错误，无法做到完美输出；在自动生成伴奏时，存在音源质量难以保证、模版化严重、风格不够全面等问题，难以达到发行级别要求。这些分析让师生们对 AI 在音频制作中的边界有了清晰认知。

最后，在“我们还需要做什么”部分，王康强调，人类在艺术创作中不能局限于 AI 现有的算法，要保持创新能力，为算法注入新灵感；面对 AI 生成的艺术创作结果，师生们需具备审美、评价、评判和验收的能力，同时掌握相关技术对结果进行修订；还要能够精准向AI下达指令，用清晰的语言表达需求，提升艺术创作的总结能力。

此次沙龙分享会让参与的师生们收获满满。大家不仅系统学习了AI在音频制作中的应用与局限，更意识到在AI技术快速发展的当下，如何将其与自身专业能力相结合，既发挥AI的优势，又保持人类艺术创作的独特性与创新性。这些知识将助力师生们在未来的音频制作与艺术创作实践中，提升作品质量与专业水平，也为学院在音频制作相关专业的教学与研究提供了新的思路与方向。

沙龙现场（一）

沙龙现场（二）