您所在的位置:首页 - 人文与艺术讲坛

人文与艺术讲坛

艺术设计学院开展“美与时代”博士系列沙龙(九十):AI在音频制作中的应用与局限

2025年6月5日,艺术设计学院在艺术楼210工作室开展了一场主题为“AI在音频制作中的应用与局限”的学术沙龙。本次沙龙面向艺术设计学院数字媒体艺术专业学生,由王康博士担任主讲。

活动伊始,王康以一首钢琴演奏开启了本次声音的论坛,并以互动交流的方式开场,引导师生们围绕“在动画与影视作品制作中大家如何选用音频”“对音频通常有哪些修整及处理”“分享个人生活中相关录音、录歌、配音经历”以及“在音频制作领域你了解并使用过哪些AI手段”问题展开探讨与分享,大家各抒己见,从实际经验出发,分享了不同的音频制作方式与见解。

随后,王康进入本次沙龙的核心内容讲解,围绕AI在音频制作中的应用、局限以及我们还能做什么三大板块展开,为师生们带来了一场极具深度与实用性的知识分享。在“AI 能做什么”板块,王康详细列举并剖析了当下各类AI音频赋能软件技术。以视频剪辑软件为例,其不仅可以对录制人声进行变音等声效处理,还能依据输入文字一键生成声音形成文本解读音频;提及豆包时,着重介绍了利用智能体克隆声音的功能,像父母可克隆自己声音为小宝贝讲故事,充满趣味性与实用性;在歌曲制作领域,AI展现出强大的创作能力,从作词、作曲、编曲到配器、制作伴奏、演唱,均可生成一首完整的音乐,同时还推荐了即梦、天工AI等相关平台以及 Cubase、Fl Studio 等软件插件的自动生成伴奏功能,此外,AI还能精准查找音效素材包并推荐合适的音效资源网站,体现了强大便捷精准的搜索功能,在影视声音获取部分,王康提供了RX11、UVR5等三种音频分离软件的讲解。丰富的案例与细致的讲解,让师生们全面了解到AI在音频制作中的多元应用。

在“AI 不能做什么”环节,王康引导大家结合分享内容与音频课程知识进行思考,深入探讨了AI在音频制作中的局限性。AI无法进行实时拟音录制,只能提供网络上现有的固定音效素材,难以给予艺术创作深度的理解与情感表达;在影视声音与画面的精准匹配及声学空间布局方面,如声场、声向、音量参数等细微调节上,AI存在明显不足;AI一键校对音准的结果存在错误,无法做到完美输出;在自动生成伴奏时,存在音源质量难以保证、模版化严重、风格不够全面等问题,难以达到发行级别要求。这些分析让师生们对 AI 在音频制作中的边界有了清晰认知。

最后,在“我们还需要做什么”部分,王康强调,人类在艺术创作中不能局限于 AI 现有的算法,要保持创新能力,为算法注入新灵感;面对 AI 生成的艺术创作结果,师生们需具备审美、评价、评判和验收的能力,同时掌握相关技术对结果进行修订;还要能够精准向AI下达指令,用清晰的语言表达需求,提升艺术创作的总结能力。

此次沙龙分享会让参与的师生们收获满满。大家不仅系统学习了AI在音频制作中的应用与局限,更意识到在AI技术快速发展的当下,如何将其与自身专业能力相结合,既发挥AI的优势,又保持人类艺术创作的独特性与创新性。这些知识将助力师生们在未来的音频制作与艺术创作实践中,提升作品质量与专业水平,也为学院在音频制作相关专业的教学与研究提供了新的思路与方向。

沙龙现场(一)

沙龙现场(二)