近期为迎接温州园博园开园,温州市温州学研究联合会联合多家单位AI园博“12+12”共创计划,指导一批优秀的AI创作者围绕园博园12景创作了12部AI作品,助力园博会宣传和展示。
《塘河竞渡》的作者郑坚,从事传媒行业十余年,从剪辑师、特效合成师到担任AIGC课程特聘教师,他始终活跃在影像创作的一线。当这位深植于本土的“传媒老兵”拿起AI工具,其作品《古港十二时辰》《对鸟》《我堡永昌》便屡次登陆央视、世博会,斩获金奖。
如今,他作为一名温州学传播大使投身AI园博“12+12”共创,执掌“塘河竞渡”的创作。我们与郑坚导演对话,探寻他如何用AI的引擎,为温州母亲河的千年竞渡,注入新时代的浪花。
专访人物简介
郑坚,AIGC导演,温州今朝传媒工作室主理人,温州学传播大使、温州城市大学AIGC课程特聘教师、温州多所高校AIGC社团校外指导老师,是温州AIGC创作领域一位活跃的实践者和社群推动者,并成功将AI技术应用于地方文化传播。
代表作《古港十二时辰》《对鸟》等,作品获第十六届巴黎中国电影节、2024世界人工智能大会(WAIC)及央视网等展播,荣获2024温州市公益广告创意大赛金奖、2024温州AIGC华严砚创作大赛冠军等荣誉。
专访内容

Q:您有多部作品都深深扎根温州本地文化,如《古港十二时辰》《我堡永昌》。接到“塘河竞渡”这个主题时,您脑海中第一时间浮现的是什么画面或记忆?
郑坚:说实话,接到“塘河竞渡”这个主题,我心里有种很特别的激动。温瑞塘河,那是我们温州的母亲河,依水而生的温州人,千百年来都把家门口的塘河当作龙舟竞渡的天然赛场,这种文化已经深深融入了温州人的血脉里。我脑海中第一时间浮现的,不只是锣鼓喧天、百舸争流的宏大场面,更是那种“一村一船遍一邦,处处旗脚争飞扬”的历史纵深感和沸腾的生命力。
作为一名龙湾人,塘河对我而言是有温度的。小时候父亲带我在塘河边看龙舟,两岸人山人海,那种全城沸腾的场景至今记忆犹新。从童年初见的震撼,到如今以AIGC导演的身份回望这条母亲河,塘河见证了我个人的成长,也见证了我们这座城市的变迁。我希望这部作品,能让世界感受到温州人那种同舟共济、奋勇向前的精气神。
Q:“竞渡”通常指龙舟赛,但也可以有更宽广的解读。在您的AI短片中,您将如何定义和呈现“塘河竞渡”?它可能是一场体育竞赛,一段历史回溯,还是一种象征性的时代叙事?
郑坚:这部片子的叙事逻辑很明确——造船、竞渡、胜利。我将“塘河竞渡”定义为一场从匠心到浪尖的完整奔赴。
第一层竞渡,在匠人手中。 开篇是温州老匠人造龙舟:选木、雕龙头、上漆。一凿一斧间,是手艺与时间的“竞渡”。AI用来还原木屑质感、开光那一刻的神采。
第二层竞渡,在水上。 龙舟停在水面中央,划进温州园博园。AI聚焦破水的力量感、桨手的协同韵律。
第三层竞渡,在胜利之后。 终点不是奖杯,是文化完成了一次从创造到传承的闭环。
以匠人为起点,园博园为舞台,这才是我想呈现的“塘河竞渡”。

Q:技术实现上,动态的“竞渡”场面(如龙舟破水、桨手动作)对AI视频生成的连贯性是巨大挑战。您是如何攻克这一难题的?能否分享一个让“水”和“运动”看起来更真实、更有力的技术秘诀?
郑坚:这确实是最具挑战的部分。AI生成动态的、高强度的物理交互场面——比如龙舟破水、桨叶入水、水花飞溅——非常容易产生画面崩坏、动作不连贯等问题。攻克这个难题,我有一套 “传统硬桥硬马打底 + AI精准微操” 的工作流。
秘诀其实在于“图生视频”前的提示词精准控制。在生成关键帧前,不能只给AI一个模糊的指令,而是要通过极其详尽的提示词搭建出画面的物理逻辑。比如,我会在提示词中精确描述:“古代龙舟雕刻龙头威严,数十名壮汉桨手奋力划桨,人物手臂与船桨产生连续性的动态模糊,木桨剧烈破开深色水面,激起巨大白色水花与泡沫。”这能强制AI去理解人体动力学和水体交互的复杂性。
Q:您的《对鸟》将温州民歌与AI视觉结合,广受好评。在“塘河竞渡”中,声音设计(如号子声、水声、现代城市音效)是否会扮演同样重要的角色?您如何构思声音与画面的AI协同创作?
郑坚:声音在这部片子里的分量,绝不亚于画面。我的创作习惯通常是画面与声音双向奔赴。在《对鸟》的创作中,我把自己关在房间里,循环听了上百遍原曲,让自己完全沉浸在那个故事场景中,直到画面在脑海中自然浮现。这种“以声入画”的方法也会沿用到“塘河竞渡”中。
我会先确定影片的声音基调:以激昂的龙舟号子和厚重的擂鼓声为核心骨架,配以温瑞塘河的流水声、桨叶破水声作为环境肌理。在声音生成上,我会利用AI音乐定制工具,先输入关于“竞渡”主题的文本描述,生成带有强烈节奏感的基底配乐。随后,我会根据这段配乐的节奏和情绪,反推去生成画面。这种“音画协同”的创作方式,能让龙舟破水的爆发点、鼓点的重音与画面的切换剪辑达到情绪上的同频共振。
来源 | 高温青年

夜雨聆风