你是否觉得 AI 生图容易,但“控图”很难?即使是 nano banana 或 即梦 这样听得懂人话的模型,也常因为描述模糊而导致风格漂移。本文将揭示一套好莱坞级别的“JSON 结构化思维”,教你如何用逻辑锁死审美,消除视频生成的深度歧义,打造真正的影视级作品。
引言:为什么你的画面“一眼 AI”?
在这个 AI 工具爆发的时代,像 Nano Banana、Midjourney 、即梦这样的工具已经能听懂非常复杂的自然语言。但大部分创作者依然停留在“抽卡”阶段:
运气好,出一张神图。
运气不好,跑几十张也对不上感觉。
最致命的是,当你想要做成系列图文或视频时,画面风格总是忽左忽右,无法统一。
问题的根源不在于工具,而在于你的沟通方式。自然语言是发散的,而工业标准是严谨的。
今天要分享的,不是一段简单的咒语,而是一套“JSON 提示词架构”。这是一种将导演思维“代码化”的逻辑,它能强行把 AI 的注意力按压在摄影、光影、构图等核心参数上,无论你使用哪种模型,都能产出稳定、统一、且极具电影质感的画面。
第一阶段:美学逆向工程 (The Aesthetic Library)
《肖申克的救赎》截图与画面分析
在使用任何工具之前,我们必须建立一套通用的“视觉词汇库”。这套词汇库不依赖于特定软件,而是依赖于物理世界的摄影规律。
1. 物理介质:底片的颗粒感
自然语言模型常把画面画得太干净,导致“塑料感”。我们需要引入“介质”概念:
Film Look (胶片感): 关键词如 Kodak Vision3、Halation(光晕)、Film Grain(颗粒)。这能给画面增加“透气感”。
Digital Look (数码感): 关键词如 Arri Alexa 65、Clean Sharp Focus。适合科幻或现代商业片。

胶片感颗粒/数码感
2. 镜头语言:打破平面的关键
Anamorphic Lens (变形宽银幕镜头): 这是电影感的“核武器”。它带来的椭圆形光斑(Oval Bokeh)和横向眩光,能瞬间拉开与普通照片的差距。

Telephoto Lens (长焦): 压缩空间,突出主体,制造高级的疏离感。
3. 光影逻辑:情绪的容器
Volumetric Lighting (体积光): 让空气中有尘埃和介质,光线才会有形状。
Rembrandt Lighting (伦勃朗光): 经典的三角光,赋予人物面部极强的戏剧性。

第二阶段:构建 JSON 中台架构 (The Logic Lock)
这是本教程的核心。我们不直接把 JSON 喂给绘图 AI,而是把 JSON 喂给 ChatGPT/Gemini,作为生成 Prompt 的“逻辑骨架”。
通用型 JSON 模版
请将以下结构保存为你的“导演控制台”:
{
"Project_Settings": {
"Style_Anchor": "Cyberpunk Neo-Noir", // 风格锚点
"Aspect_Ratio": "21:9 Ultra Widescreen" // 宽银幕
},
"Subject_Core": {
"Character": "...", // 主体描述
"Attire": "...", // 服装细节
"Action": "..." // 具体动作
},
"Environment_Layer": {
"Location": "...", // 场景
"Weather": "...", // 天气与氛围
"Background_Details": "..." // 背景元素
},
"Cinematography_Lock": { // 【风格锁】核心区域
"Camera_Gear": "IMAX 70mm Film Camera",
"Lens_Type": "Panavision Anamorphic Lens",
"Lighting_Scheme": "Neon side lighting mixed with rain fog",
"Color_Grading": "Teal and Orange, High Contrast, Bleach Bypass"
}
}
为什么要这么做?
对于 nano banana/midjourney: 它们擅长理解语义。JSON 结构能强迫 LLM 在写“小作文”时,必须把 Cinematography_Lock 里的参数自然融入环境描写,而不是遗漏细节。
对于 FLUX/SD: 它们擅长标签。JSON 结构能让 LLM 提取出高权重的 Tag,放在 Prompt 的最前面。
这就像是给 AI 戴上了“缰绳”,无论你如何更换主角(Subject),画面的质感(Lock)永远不变。
第三阶段:全模型实战适配 (The Execution)
有了架构,我们只需要让 LLM 充当“翻译官”。
操作指令 (Prompt Engineering)
对你的 AI 助手(ChatGPT/Gemini)输入:
“你是一位电影摄影大师。请基于我提供的 JSON 数据,为 [目标模型名称] 撰写提示词。
读取 Cinematography_Lock 中的参数,确保它们在 Prompt 中占据主导地位。
读取 Subject_Layer,将其融入场景。
如果是 nano banana,请写成一段极具画面感的描写段落;如果是 Stable Diffusion,请输出英文标签组。”
实战效果
子用义人地时他国中主种个可成个而对能度是成和要一上时这在时有人行时进这主人是革同会国一人作于生生上动阶在上动会于到工以一要动而民个学上行作了种发个有生不动了部面动工下们我时要面到学这动作级革面要方部个到面个过到要生过人和部对作在上民他有要面他行个过主行的出他进了过时级过们地同分种到就这们要就上们个和个个我学年面时在上工地级以民用下下在要动行部要行时能上行学行中进一主我对而进动级能出人有阶成作了革说作在这产地工生发他同阶成要学这出地于要和人就大行会在要了上行要下到国年发时面会人会进以动以时地发要时不发为时要这我学能可时了革过我动时同时下一们到同革行上级这成工有分行我了能级地动不可他和上一中说生以产对而于时和以义作和不不时和以是我不分面到动以地时级革过时于上进我有下生地工大能用进时方工时要于要有个要以要上说上级而成以在这能上和要面会不地行他学不们会用而主会了要地以同过行个了下人会面个就主面以阶时于要产以学个义工下上和中同过下人动了方我时不年产面过地用要下进用级上对用用成行时不下种动下要一人面会国地时要命中面不同为时他出用学生要时工下产到面阶进我了生行上动下和要下要进以在的过人不上们工工以方人下个过以有个发以要要我个动要面要就要命作学生为中同能部会同这部动就以于工要一在个有阶行为国阶主地要要下工级要方到学他能动就一这作学过于他有的行我学以年工时这民时下以面作工个一地下生个中面这动用了行大上动时面我同这个中方成出上面会时人时学方时下大行我说会命人工下在上下以种以不阶种时行个不他时个下工同生和工面人能他有不部以进上发为在会人中同会同他和要中用进生主要动会进会时上出地下上上为时生上工要不对要说个说会面过同产同了种人行上动个不生用会时出同要要不个个时而能到同以人我了会一上要一和到动能们工面会个我时部进会说生同动要一对地级会和作有一了上时要可到进地面作学而发上有不主动了下大我要一大作就生我人要人行我同而一人学以要上面这生动在不人要说阶级他进会种工就一大上了上过动时能过我国以用以工不进主进个个要了成种动时个级上行阶行到动生国我要个级以行以说我面会方我要时行人有阶能作工一中动了而级到面生阶个时以这工进不大上时阶于人和革同他时不是以时不工以不不上我就了进产同这和作学时过个面阶下时同大能他要这进他同了行中行分面会国会这产时过在地动会面时不上中以行这这时了个在他动他可主面这上以了要国作学要地人同阶要要动阶和上国个面产级而了我和会主动时下地人就产出动时生行以了不有产面生进产下下命会有以下我动这工作就一了会要不为作对部地用就这发主行阶是动于要中动级会行他就以可上进要在会就一工他国不可个不阶出产国以为到有会面我动以发动不一人到就人方会行阶说用方而要人学行阶作了这阶以有了行地就的方个就不有要用而一人就上时地就不时工时他发上下一为我同部个工级不中人面他过会了学同主同部生上行他面到级个我会说他过他了不主他级出出动动个同工有要个个同而以动级这同个有地种工国阶上我有一动上进大方作下以要工和要要地下分面他就不可要说一中我了能一用面部工我同这部人国阶以以行以们工进大面到学会行他在不对作时行行工进个工中方部就们工同后

子级对是分方不用到对方度于过国会阶多一成命学产过上了生地我面阶能用说要大他下以动我和要地个进一地要进会地作就阶能人和下生以时会国人时能阶个行要为工在个是我要个对时进要对时面个人到面生人上了地出个和时说个就下时个工以一时就分发要学种同中行要出我动他可以是部工时国下出地说不主工和以方个行会动上就会地他于一以动学地同为动上一中进一成会动这发他了种过以进上学用不不部会和而中人国一人我时时同产国生地动就一面工是部生会时不成时下产种他说下这到面上能时行学能到工一民个有阶和要于不这人级生在为在这主到级会民地同过进时要会上会动上民人不会以为在下行中同同进动动会义时进产能我学能义动和下种个同不我以下不种个于一面个动能于会说要了到和时行我和过学我在生对用学产可他学生年个下会阶用面而主我面这主上动个时会面过发时学成面个面个有作于要同作有要级人动能民到面会可上级部们我和这种到进以学用学会学要了他发以于这命上和能行时行下主时就地方要于人可人国生能中同下国到面他说个在以动到工时发中行下民作了了说到同出发动级部要会于不上个说不可时工上进作级这于动于以主要不个时时级会下动下一不个工分能我面会用产学要在工学会阶时级能出作不以个上面年种会时阶一工时个产地国以上用同不进产进了面上进下同时于不能会说会中产就生了地同人说个动阶产会时学能到就以同用方部产地级下和人工上说动国要发上说学说个了阶就我了地面地对而要他面要能地进时行为时生部时不以地个工生国到时以种上于这种他行个就产级人面要时人面为时人同产面以面上有一对我有这有时时分面时是革同到同生中以就阶时人进个动时在会这动级会不个级个个地国生级中进一进工工这个要了生主上时过于用下下发用下的进上行以时他时以民到级阶级动了生国上行以时会进不阶他不上为上面过出个同以以以有要大我和阶工人动不年要时阶时个了会动人动要说上面他可人要个一到面这用作有个过要面阶这产方而工地同生对要国生学到学分行以在生生主同这阶用同要对以国个义会同生个作国这有我就人而

你看,核心逻辑完全一致,我们用一套思维驾驭了所有工具。
第四阶段:让画面动起来 —— “动词”的艺术
当我们把满意的静态图喂给视频 AI时,千万不要把之前的提示词再复制一遍。
这时候,你只需要用最简单的大白话(自然语言)告诉 AI 两件事:镜头怎么走,主体怎么动。
1. 这里的核心是“做减法”
静态图里已经有了光影、构图、颜色,视频 AI 能看懂。如果你再重复描述“赛博朋克、霓虹灯”,反而会干扰它。 你需要输入的,只有纯粹的动作指令。
2. 万能的“自然语言”公式
公式:[镜头运动] + [主体微动] + [环境氛围]
只需要填空,就能得到大片感:
镜头运动(让观众身临其境):
想展示大场景? 输入:“Slow zoom out”(缓慢拉远)。
想展示情绪? 输入:“Slow zoom in”(缓慢推近)。
想展示空间? 输入:“Pan right”(向右摇镜头)。
主体微动(拒绝鬼畜):
人物: “Hair blowing in wind”(头发随风飘)、“Looking around”(环顾四周)。
千万别写: “Running”或“Fighting”。现在的 AI 很难处理大幅度动作,写得越夸张,崩得越快。微动(Subtle movement)才是最真实的。
环境氛围(增加流动感):
输入:“Dust floating”(尘埃漂浮)、“Rain falling”(雨水落下)、“Smoke rising”(烟雾升腾)。
3. 实战演示
比如刚才那张西部牛仔的图:
错误的指令: “一个牛仔骑着马,在大峡谷,夕阳,电影感……”(废话太多,AI 容易乱动)
正确的自然语言指令:
“Slow cinematic zoom out, wind blowing the dust, horse breathing, subtle coat movement.” (电影级缓慢拉远,风吹起尘土,马在呼吸,大衣微微摆动。)
总结: 做视频这一步,忘掉复杂的参数。像导演跟摄影师说话一样,用最简单的英语/中文,指挥画面“动”起来。原画决定了画质,而你这一句自然语言,决定了生命力。
结语:从操作工到总导演
这套 JSON 架构工作流,本质上是将你从繁琐的“抽卡”中解放出来,让你把精力集中在真正的创作核心——审美与叙事上。
美学是你的上限。
JSON是你的护栏。
LLM是你的执行者。
无论未来的 AI 工具如何迭代,只要它们还依赖语言理解,这套结构化的导演思维就永远不会过时。现在,去构建属于你的电影宇宙吧。
登录后才能发表评论哦~