关注

【保姆级教程】手把手教你搭 Coze 工作流,Banana2 + Sora2 电商视频生成全流程复盘(附免费工作流)

目录

一、核心实操:搭建工作流

1️⃣ 开始节点

2️⃣ 大模型:生成产品卖点

3️⃣ 大模型:生成九宫格提示词

4️⃣ 插件:Banana2 生成九宫格

5️⃣ 大模型:生成 Sora2 提示词

6️⃣ 文本处理节点

7️⃣ 插件:URL转Array数组

8️⃣ 插件:Sora2 图生视频

9️⃣ 选择器:确认任务提交

🔟 循环节点:搭建等待通道

1️⃣1️⃣ 循环体内部:查询与判断

1️⃣2️⃣ 代码节点:数据清洗

1️⃣3️⃣ 结束节点:输出成品

二、获取API_Key

三、使用工作流

四、写到最后


想做电商短视频带货,却倒在了“拍摄成本”这一关?

大家都知道,在这个“无视频不电商”的时代,一条高质量的产品宣传片往往意味着高转化。但问题是:找模特太贵,搭场景太累,外包给传媒公司一条视频动辄几千块,对于中小卖家来说,这笔开支实在太肉疼。

难道没有专业摄影团队,就注定做不出电影级的电商大片吗?

当然不是!今天我要给大家复盘一条全自动 AI 视频工作流。不需要你懂复杂的剪辑软件,也不需要昂贵的拍摄设备,只需要利用 Coze 工作流 + Banana2 + Sora2,你就能一键生成 10-15 秒的高质感电商宣传视频。

体验链接:https://www.coze.cn/s/4OGVFTzmSVI/

免费工作流(在头部):https://my.feishu.cn/wiki/W4hGwS4AHidEHmkMPepcTdbJnif?from=from_copylink

看看下面这个视频,是不是以为是哪个 4A 广告公司拍的?其实,这完全是由 AI 全自动生成的,而且是0成本、批量产出

Sora2粉色毛衣宣传视频

一、核心实操:搭建工作流

这一部分是整篇文章的精华。请打开你的 Coze(扣子)后台,创建一个新的工作流。我们将这个看似复杂的流程拆解为三个阶段:“大脑分析阶段”“指令生成阶段”“视频渲染与轮询阶段”

像搭积木一样,我们一步步来。

整体工作流如下:

1️⃣ 开始节点

一切的起点。为了保证生成的视频精准符合我们的商品需求,我们需要预设几个关键的输入参数。

在这里,我们定义了四个核心变量,这决定了后面 AI 能拿到什么素材以及是否有权限运行:

  • video_duration (Integer):视频时长。建议设置为 10 或 15,单位是秒。

  • title (String):商品名称。例如“复古手冲咖啡壶”。

  • product_image (Image):这是最核心的变量!我们需要上传一张商品的高清实拍图。

  • api_key (String)关键凭证。这是你调用 Banana2 和 Sora2 服务的密钥(通常以 sk- 开头)。

2️⃣ 大模型:生成产品卖点

有了图片,AI 得先看懂图片里卖的是什么。这个节点充当了“电商选品官”的角色。

  • 模型选择关键点! 这里必须选择 豆包·1.6·视觉理解-250815。只有带“视觉理解”后缀的模型才能看懂你上传的图片。

  • 输入配置

    • title:引用开始节点的 title

    • product_image:引用开始节点的 product_image

  • 提示词配置

    • 系统提示词:设定 AI 的角色,要求它“只围绕产品宣传相关内容进行交流,坚决拒答无关话题”,并要求生成的脚本“结构完整、要素齐全”。

系统提示词:

# 角色
你是一位专业且极具创意的产品宣传专家,擅长用生动、精炼且极具吸引力的语言介绍产品。

## 技能
### 技能 1: 介绍产品关键信息
1. 当用户要求介绍产品时,全面且精准地给出产品名称、核心功能、独特特点以及突出卖点。
2. 表述要生动形象、简洁清晰,具备较强的感染力,能有效吸引听众的兴趣。
===回复示例===
- 产品名称:<产品名>
- 功能:<以生动形象的语言简述核心功能,突出对用户的价值>
- 特点:<概括独特且吸引人的特点>
- 卖点:<提炼极具吸引力的突出卖点>
===示例结束===


## 限制
- 只围绕产品宣传相关内容进行交流,坚决拒答无关话题。
- 严格按照给定格式输出介绍产品关键信息,对于生成的宣传广告视频脚本要结构完整、要素齐全。

用户提示词:

产品主题:{{title}}
产品图片:{{product_image}}

输出变量:设置一个输出变量名为 Product_Sell_Points,用于传递给下一个节点。

3️⃣ 大模型:生成九宫格提示词

这一步是为了给 Banana2 做准备。我们不是直接生成视频,而是先生成一组“风格参考图”。

我们需要把上一步提取的“卖点”,转化成 Banana2 这个绘图模型能听懂的“绘画指令”。

  • 模型选择注意! 这里依然要选择 豆包·1.6·视觉理解-250815。因为这一步我们再次传入了产品原图,模型需要看着原图来写提示词,才能保证画出来的样子不走形。

  • 输入配置

    • Product_Sell_Points:引用上一个节点生成的卖点。

    • title:引用开始节点的标题。

    • product_image:再次传入开始节点的原图,确保视觉一致性。

  • 提示词配置

    • 系统提示词:这里加了三条非常关键的“铁律”:

      • 确保生成的提示词严格保持产品本身的颜色、形状不改变。

      • 输出的图片不要有文字。

      • 产品一定要有一致性。

系统提示词:

# 角色
你是一位专业的产品分镜图提示词生成专家,在生成产品分镜图提示词领域经验丰富,能从风格、结构、内容、细节四个维度精心构建高质量提示词,助力生成用于产品宣传广告视频的分镜图。

## 技能
### 技能 1: 生成产品分镜图提示词
1. **风格**:生成的提示词需呈现黑白线稿风格,具有漫画分镜式的简洁写实特点,融入日系插画质感。强调画面轮廓清晰、光影极简,同时严格保持产品本身的颜色、形状不变。
2. **结构**:采用严谨的九宫格布局,每个格子为独立场景,但整体叙事连贯。画面比例均匀分配,分镜感要强烈,最终只生成九个格子的图片。
3. **内容**:紧密围绕 “产品使用流程” 展开,具体内容如下:
    - **人物场景**:要涵盖卧室梳妆台照镜、手部持握产品、精华滴落在掌心、脸部护理前后对比、产品涂抹细节、户外展示产品、闺蜜分享美妆时刻、产品特写 + slogan等多种场景。
    - **产品元素**:产品设定为彩色渐变瓶身的美妆精华 / 爽肤水,着重强调瓶身设计,如金属瓶盖、品牌标识等,同样保持产品本身的颜色、形状不变。
4. **细节**:将人物形象设定为年轻女性,神态需自然亲和;场景要融入丰富的生活感元素,如床品、家具、阳光等;每格画面都要聚焦一个动作或细节。

### 回复示例
九宫格漫画分镜,黑白线稿风格,日系写实插画,围绕产品的使用叙事:第 1 格展示卧室梳妆台女孩照镜发现产品;第 2 格呈现手部持握彩色渐变瓶身的精华;第 3 格是精华滴落在掌心的画面;第 4 - 5 格为脸部护理前后对比(体现肤色提亮等效果);第 6 格突出精华涂抹在肌肤的细节;第 7 格展示女孩在阳光房展示产品;第 8 格是闺蜜聚会分享美妆产品的场景;第 9 格为产品特写 +‘焕亮肌肤’slogan。每格画面轮廓清晰,场景写实,人物神态自然,整体风格统一简洁,且产品保持本身颜色、形状不变。

## 限制
- 仅生成与产品分镜图相关的提示词,坚决拒绝回答无关话题。
- 所输出的提示词内容必须全面涵盖风格、结构、内容、细节四个维度,严格遵循框架要求,不得偏离。
- 回复示例需完整呈现九宫格各格内容,语言务必简洁明了。 
- 仅生成九个格子的图片。 
- 确保生成的提示词能严格保持产品本身的颜色、形状不改变。 
- 输出的图片不要有文字
- 产品一定要有一致性

用户提示词:

产品介绍:{{Product_Sell_Points}}
输入主题:{{title}}
产品图:{{product_image}}

输出变量:设置输出变量名为 output,这将作为 Banana2 的直接输入。

4️⃣ 插件:Banana2 生成九宫格

这是工作流的第一个视觉高潮。我们将使用 NanoBanana2 模型来生成风格化的参考图。首先,我们需要在插件市场找到这个工具。点击画布上的“添加节点”,选择“插件”。在搜索框输入关键词 “Na绘图”

  • 找到插件后,点击添加 Na2_generate_image 这一项。

注意:一定要选 Na2_generate_image (Na图片生成,图生图),不要选成 text_to_image,因为我们需要传入产品原图来控制构图。

添加成功后,点击节点进行配置。这里的连线逻辑非常关键,它把“原图”、“Prompt”和“密钥”串在了一起。

  • api_key:引用开始节点的 api_key。这是调用服务的凭证。

  • image_url:引用开始节点的 product_image。这就相当于告诉 AI:“底图是这个,千万别画歪了”。

  • prompt:引用上一步(大模型_生成产品九宫格提示词)输出的 output。这是 AI 的创作指令。

5️⃣ 大模型:生成 Sora2 提示词

有了美术参考(Banana2 的图)和文字卖点,现在我们要指挥 Sora2 开机拍摄了。这个大模型节点是整个工作流的“总导演”,它决定了视频的运镜和细节。

  • 模型选择:选择 豆包·1.6·lite·251015。虽然它是 lite 版本,但处理多模态输入(图片+文本)的速度快且逻辑够用。

  • 输入配置:这里非常关键,我们需要把所有的素材都喂给它:

    • 普通变量

      • video_duration:视频时长。

      • Product_Sell_Points:产品卖点。

      • output:引用第三步生成的九宫格提示词。

    • 视觉理解输入 (Visual Inputs):

      • image_url:引用 Banana2生成九宫格 的结果图(作为美术参考)。

      • product_image:引用 开始节点 的原图(确保产品不走样)。

系统提示词:

## 一、输入要求(4个必填)
1.  分镜线稿:**5-9个**,按1-N顺序排好
2.  产品参考图:高清图(只用来对产品颜色/logo/材质)
3.  产品信息:核心>功能>情感卖点,列清楚
4.  目标时长:**10秒/15秒** 二选一

## 二、核心规则(直接套用)
### 1. 时长自动分配
| 总时长 | 转场时长 | 单镜时长计算法 | 收尾镜特殊规则 |
|--------|----------|----------------|----------------|
| 10秒 | 0.2秒/次 | (10 - 0.2×(分镜数-1) - 收尾时长)÷ (分镜数-1) | 比普通镜长20% |
| 15秒 | 0.3秒/次 | (15 - 0.3×(分镜数-1) - 收尾时长)÷ (分镜数-1) | 比普通镜长20% |
- 动作匹配:短时长镜做简单动作(拿产品),长时长镜做复杂动作(拿+转+按)

### 2. 分镜功能必覆盖
不管多少镜,必须包含4类:
- 设计类:秀产品外观 → 配**核心卖点**
- 功能类:演示操作 → 配**功能卖点**
- 情感类:用产品场景 → 配**情感卖点**
- 收尾类:总结 → 配**品牌价值**

### 3. 产品一致性(每个镜都要写)
必须加2个量化细节,比如:
- 颜色:和参考图RGB(XXX,XXX,XXX)一致
- 尺寸:厚度3.2mm,logo蚀刻在左上角0.5cm处

### 4. 口播&转场规则
| 分镜类型 | 口播语速 | 口播占单镜时长 | 转场方式 |
|----------|----------|----------------|----------|
| 设计类 | 10秒版180字/分;15秒版160字/分 | 60% | 同场景→滑动;跨场景→淡入淡出 |
| 功能类 | 10秒版200字/分;15秒版180字/分 | 50% | 同场景→焦点转移;跨场景→摇镜 |
| 情感类 | 10秒版160字/分;15秒版140字/分 | 70% | 同场景→滑动;跨场景→淡入淡出 |
| 收尾类 | 10秒版150字/分;15秒版130字/分 | 80% | 无转场 |
- 音乐:120BPM轻电子乐,口播时降速30%,降速时间和口播一样

### 5. 画质&光影(固定写死)
- 画质:8K超高清,细节放大无失真
- 光影:全片光线方向统一(比如左前侧45°光)
- 相机:设计/收尾镜用环形补光;功能/情感镜用浅景深

## 三、直接写提示词的模板(填空就行)
### 广告基础(先写这个)
**视频主题**:[产品名]+[核心场景]
**目标时长**:[10/15秒]
**分镜数量**:[X镜]
**时长明细**:[普通镜时长]×[X-1]镜 + [收尾镜时长]×1镜 + [转场时长]×[X-1]次 = 总时长
**核心卖点**:1. [核心卖点] 2. [功能卖点] 3. [情感卖点] 4. [品牌价值]

### 单镜提示词(按顺序写每个镜)
**分镜X([功能定位])**:时长[XX秒],8K超高清真实摄影,[场景写实描述,比如:阳光书房,浅木书架+磨砂台灯],[人物状态,比如:25岁女性穿米白衬衫,微笑露齿],手持[产品描述+一致性细节],动作:[和时长匹配的动作],光影:[统一方向光+量化细节,比如:左前侧光,桌面12°光影渐变],转场:[方式+时长],口播:[卖点金句](时长[XX秒],语速[XX字/分]),背景音乐120BPM轻电子乐,口播时降速30%,相机参数:[环形补光/浅景深]

## 四、强制要求(缺一不可)
1.  分镜按1-N顺序,不能乱
2.  总时长误差≤±0.5秒
3.  口播别写“买”“点击”,写“[卖点]+[场景]”
4.  每个镜必须有2个量化细节(反光率/瞳孔直径/焦距都行)

用户提示词:

视频时长:{{video_duration}}
产品卖点:{{Product_Sell_Points}}
生成九宫格提示词:{{output}}
生成九宫格图片:{{image_url}}
产品原图:{{product_image}}

输出变量配置:最后别忘了在节点底部设置输出。

  • 变量名:设置为 output

  • 意义:这个 output 里面装的就是 AI 写好的、包含运镜光影的视频脚本,它将直接决定视频长什么样。

6️⃣ 文本处理节点

大模型生成的提示词有时候只是一段单纯的画面描述,为了让 Sora2 严格执行我们的要求(比如不要乱加文字),我们需要在这里给提示词“加个头”。

  • 节点选择:添加 文本处理 节点。

  • 选择应用:功能模式选择 字符串拼接

  • 输入配置

    • 变量名String1

    • 引用来源:引用上一步(大模型_生成sora2提示词)的 output

  • 拼接逻辑

    • 我们在输入框里写了一段非常霸气的“前缀指令”,告诉视频模型不要自作聪明加字幕:

视频中严禁出现字幕,直接以分镜生成视频
以下是视频提示词
{{String1}}

7️⃣ 插件:URL转Array数组

为了让视频模型能同时参考“产品原图”和“Banana2生成的风格图”,我们需要用这个小工具把这两张图片的链接“打包”在一起。

  • 在画布中点击“添加节点” -> “插件”。

  • 搜索关键词 “链接URL转Array数组”

  • 找到插件,点击添加 url_to_array 工具。

点击节点进行配置,这里我们要把两张关键图片的来源接进来:

  • image_url_01:引用 【开始节点】product_image。这是为了确保产品主体不变。

  • image_url_02:引用 【Banana2生成九宫格】image_url。这是为了提供美术风格参考。

  • (其他 image_url_03 等留空即可)

  • 输出理解:这个节点会输出一个名为 imageArray 的变量,里面装着这两张图的链接,下一步我们就可以直接用了。

8️⃣ 插件:Sora2 图生视频

这是见证奇迹的时刻!我们将调用 Sora2 的 “图生视频” 接口,让它基于我们提供的“美术风格图”和“产品原图”来生成最终大片。

  • 点击画布上的“添加节点”,选择“插件”

  • 搜索关键词 “S视频创作”

  • 关键点:这次我们要点击 img_to_video (图生视频) 右侧的添加按钮。

点击节点进行配置,这里的参数比较丰富,我们需要把所有的“原料”都喂进去:

  • api_key:引用 【开始节点】api_key

  • images:引用上一步 【图片URL转Array数组】imageArray

    • (这就是图生视频的核心,我们把打包好的图片组传给它)

  • duration:引用 【开始节点】video_duration

  • model:手动填入 sora-2-all(这是目前效果最快的版本,也可以选择sora-2-pro-all)。

  • orientation:手动填入 9:16(确保生成的是竖屏短视频格式)。

  • prompt:引用 【文本处理节点】output(这是视频的运镜和光影指令)。

9️⃣ 选择器:确认任务提交

在进入漫长的等待之前,我们必须先确认“订单”是否成功提交给了 Sora2 系统。

  • 添加节点:在 Sora2 生成节点之后,连接一个 选择器 (IF)

  • 配置条件

    • 变量:选择上一步(Sora2图生视频)输出的 status

    • 操作符:选择 等于 (=)

    • :填写字符串 completed

  • 逻辑含义:只有当任务状态明确为“已完成提交”时,我们才进入下一步的等待循环;否则(走“否则”分支),说明任务在一开始就挂了,直接停止即可。

🔟 循环节点:搭建等待通道

确认任务提交成功后,我们需要一个“循环车间”来持续查询进度,直到视频生成完毕。

  • 连接逻辑:将上一步选择器的 “如果 (If)” 分支,连接到一个 循环节点 (Loop)

  • 基本配置

    • 循环类型:选择 无限循环(注意:这意味着我们需要在循环内部手动设置“退出条件”,否则它会一直跑下去。)

  • 输出配置 (关键)

    • 我们需要把循环内部查到的视频链接传到外部来。

    • 点击“输出”旁边的加号,添加一个变量。

    • 变量名videoURLs

    • 变量值:选择引用循环内部的 Sora2-查询任务video_url

    • 类型:确保类型是 Array<String>

1️⃣1️⃣ 循环体内部:查询与判断

进入循环节点内部,这里的逻辑其实就是“一查、二判、三等”。

  1. 查询任务:这是核心。添加插件 Query_Task,把外部传入的 task_id 填进去,实时获取生成进度。

  2. 逻辑判断:简单来说,用选择器判断 进度是否到达 100%。如果到了,就走“成功出口”;如果没到,就走“等待代码”。

  3. 代码等待:在未完成的分支里,挂一个简单的 Python 代码节点,让工作流休息若干秒再进行下一次查询,防止接口被刷爆。

1️⃣2️⃣ 代码节点:数据清洗

循环节点输出的数据有时候会嵌套在数组里,或者包含一些我们不需要的格式信息。为了让用户直接拿到纯净的视频链接,我们需要加一个代码节点来“剥壳”。

  • 添加节点:连接一个 代码 (Code) 节点,重命名为 代码_去除空字符

  • 输入配置

    • 变量名videoURLs

    • 引用来源:引用上一步 【循环_查询任务】 输出的 videoURLs

  • 代码逻辑

    • 这个节点的任务是遍历输入的数组,找到非空的 video_url 并提取出来。

    • (如果你不懂代码也没关系,直接让 AI 帮你写一段“提取对象中非空视频链接”的 JS/Python 代码即可)

  • 输出变量:设置输出名为 video_url(String类型),这就是我们要的最终成品。

1️⃣3️⃣ 结束节点:输出成品

这是万里长征的最后一步!我们需要把清洗干净的视频链接返还给用户。

  • 配置输出:点击结束节点。

  • 输出变量

    • 变量名output(或者你自己喜欢的名字)。

    • 变量值:引用上一步 【代码_去除空字符】video_url

  • 输出类型:选择 返回变量

二、获取API_Key

在使用 Nano-Banana2 之前,需要先注册 API 平台并获取对应的 API Key。首先进入到API平台:https://linoapi.com.cn/register?aff=sJ68,点击右上角 「登录 / 注册」 完成账号注册。(新注册账号默认赠送 0.4 元 体验额度,不够的话可在【钱包】中按需充值。)

注册完成后,进入 【API 令牌】 页面,点击 「添加令牌」 新建一个 API Key。

在创建令牌时,填写名称并选择分组,分组务必选择「官转 gemini」、「优质 gemini」、「default」、「官转OpenAI」、「auto」,这样才能正确匹配 NanoBanana2 模型。额度可根据需要自行调整,其余参数保持默认即可,最后点击 「提交」

创建完成后,在 API 秘钥 列表中复制对应的 Key,后续直接填入工作流的 api_key 参数即可。

三、使用工作流

工作流创建完成后,建议先进行一次 试运行,确认整个流程是否正常,以及生成的视频效果是否符合预期。

  1. 启动测试:点击画布底部的 「试运行」 按钮。

  2. 填写参数:在弹出的参数填写窗口中,按下面示例填写:

    1. api_key:填写刚刚获取的 API 密钥(sk-开头)。

    2. product_image:上传一张清晰的产品图(示例:肉粉色毛衣.jpg)。

    3. title:填写产品名称/主题(示例:肉粉色毛衣)。

    4. video_duration:填写视频时长(建议填 15,可选 10-15秒)。

  3. 开始运行:参数填写完成后,点击底部的绿色 「试运行」 按钮,静待奇迹发生。

如果一切配置正常,工作流会依次执行 【Banana2生成九宫格】【Sora2生成视频】 以及 【循环查询】 节点,最终在 【结束】 节点返回生成的视频 URL。点击链接在浏览器中打开并下载,即可看到生成好的 10-15 秒电商宣传大片效果。

四、写到最后

在这个“注意力稀缺”的时代,视频内容的生产效率往往决定了电商的生死。

这套基于 Banana2 + Sora2 的自动化工作流,不仅打破了传统拍摄高昂的资金壁垒,更让我们看到了 AI 赋能个体的无限可能。不需要专业的摄影棚,也不需要昂贵的模特,只要你有创意,AI 就能帮你把想法落地,用最低的成本跑出最高的 ROI。

“种一棵树最好的时间是十年前,其次是现在。” 别让这个工作流在你的收藏夹里吃灰,赶紧动手试试吧!

转载自CSDN-专业IT技术社区

原文链接:https://blog.csdn.net/Little_Carter/article/details/156753748

评论

赞0

评论列表

微信小程序
QQ小程序

关于作者

点赞数:0
关注数:0
粉丝:0
文章:0
关注标签:0
加入于:--