故事灵感来源于英年早逝的电音大神Avicii, 被资本驯化受尽折磨的童星Justin Bieber以及内娱那些被迫不当人当工具的顶流偶像们。他们被资本异化,有些人选择自我异化顺应资本,慢慢的他们失去的是本身的人性。本短片改编自我的小说《仿生人不会梦见电子羊》,讨论的是在赛博朋克的未来世界,一个顶流偶像明星在一次意外后,发现自己早就在18岁那年为了反抗资本自杀的事实,而现在的自己不过是一个仿生人。当偶像这个已经很工具化的“产品”再次被真正的流水线仿生人产品所替代,那娱乐产业所面对的大众喜欢的到底是什么呢?
(剧情补充说明:为了怕剧情看不懂,简单说下,片中银白色头发时期的卡戎是真正活着时候的人,黄色头发的是第一代仿生人,主角黑色头发的是迭代后的第二代仿生人)
整个短片全部用Seedance 2.0完成视频生成,其中有一个近景的镜头用了可灵3.0生成。生图是用Midjourney生成。
在初始创作的时候,我并没有写剧本,因为脑子里大概知道故事的走向和发展。所以很多镜头都是即兴发挥,想测试AI生成的水平。在测试过程中发现了,因为seedance 最多15秒的限制,没有办法完整的还原一整个“场”的发展,15秒里最多能出三句台词,想要再生成下一个连续的场,即使有环境参考图的情况下,再一次生出来的镜头,人物的站位可能是错误的,视线也可能有问题,也有可能跳轴拍摄,所以在拍摄对话戏上着实非常费劲。耗片比高达10:1. 所以我选择用分章节,和交叉蒙太奇的方式来对前两章进行叙述(虽然说看起来乱一些),但这种配合AI技术去写故事目前是主流的方式。至于是镜头控制,纯靠运气抽卡。抽几十次正反打视频,总有一条是拍的还不错的。
整个过程令人头疼的技术问题还有音效,前后两个镜头生出来的环境音不接,前后配音不一样,这都是目前技术痛点。
作为个人创作者,自己摸索出来的一套思路就是,尽量让AI去发挥。作为传统影视工作者,我摒弃了剧本。整部片子创作是没有任何剧本,台词对话也是想到哪里写到哪里,我的脑子里就只有一个小说大概的思路和故事框架。我不用剧本的原因是,我不希望AI搞我的心态。面对AI,我们需要做到真正的心态管理。你如果写了一个自己认为完美的剧本,生不出来想要的效果,很容易被AI搞崩心态,尤其是现在seedance排队那么久。所以反而不如不写剧本,给个思路,放开手脚让AI去搞,抽卡十几次总有满意的。我的对话中有很多带关系的正反打镜头,如果用现在的生图或者首尾帧只能给到对话的大全或者特写镜头,现在看起来正反打完全让AI自己去弄反而会有一些比较好的效果,虽然里面也有些跳轴的技术错误,但还是拍的挺好看的,我就给留下了。如果你看到特别离谱的穿帮或者是字幕问题,相信我,纯是我搞不动了。我将我的这种无剧本创作方式称之为:运动式创作。其最核心的原因就是对内管理好自己的心态,要不很容易被AI搞崩溃。
其实通过和AI的沟通,或多或少可以探索出AI的技术底线,你会知道哪些动作能够生成,哪些不能生成。所以这点也是不写剧本的关键,要配合AI所能够理解和达到的技术来选一条中庸之道来随时调整和创作自己的故事。
实在是不会调色,不然片子的风格会更加统一。
选择做这部短片的原因,很大程度是想要测试seedance 2.0的水平以及想实现自己的小说影视化的改编。测试过市面上很多的视频生成大模型,个人认为seedance 2.0无出其右,断崖式领先其他模型。其15秒连续生成的水平已经可以在真人短剧的赛道上成为真正的商用工具。但是,通过对seedance 2.0极限的使用,我认为也正是15秒连续视频的限制,让其在短片/电影/电视剧上面略逊一筹,当然这可以理解是目前的算力的确达不到。个人认为有以下几个技术问题,一旦攻克,真人AI电影或许即将到来:
1. 场景一致性的问题。目前看来seedance 2.0的民用版算力应该是不够,所以无法做到场景一致性的问题;
2. 多人出现的场面调度问题。目前两人之间正反打感觉还可以,有些镜头会明确穿帮但不影响整体。但是三个人或者更多人,AI所接受的指令与达到的效果会有很大落差,这也可能是算力问题导致的。所以大的人物场面调度,比如《教父》里的种种群戏,AI可能无法做到精确控制每个人的调度。
3. 音效问题。同一批次视频的环境声可能不一样,后期剪辑全靠音效堆。
4. 民用版seedance 2.0无法镜头调度
最后音乐版权问题:
最近做视频真的太累了,如果能有机会入选一定用suno替换掉版权音乐,不给主办方麻烦,请各位评委老师先将就看个氛围。