title: "小红书短视频Skill | 图文切片提效" category: 人工智能 tags:


【大模型API中转站】第50期 小红书短视频Skill | 图文切片提效

本文是【大模型API中转站】系列的第50篇。本系列致力于用最低的成本、最清晰的方法,帮你打通多模型API的任督二脉。建议先收藏,随用随查。

上一篇讲的是公众号、知乎和 X 长文。

这一篇换到更视觉化的平台:小红书图文、知识卡片、公众号头图、视频号、B 站、直播切片和短视频。

这类内容和长文最大的区别是:读者不是先读完再判断,而是在第一眼就决定要不要停下来。

所以它的生产流程不应该从“写完整文章”开始,而应该从信息层级开始:

一个主题
  -> 一个钩子
  -> 一个封面
  -> 3-8 张卡片
  -> 30-90 秒脚本
  -> 字幕和切片
  -> 素材归档

如果只让 AI “帮我写一篇小红书笔记”,通常会得到一堆正确但没节奏的文字。

更好的方式,是让 Codex Skill 分工完成:内容骨架、视觉结构、封面增强、竞品拆解、视频切片、素材管理。

1. 图文和短视频优先装哪些 Skill

先看总表。

场景 推荐 Skill 作用
小红书图文 / 知识卡片 canvas-designtheme-factorybrand-guidelines 画布结构、主题色、账号视觉规范
公众号头图 / 封面 image-enhancercanvas-design 图片增强、封面构图、信息层级
爆款封面拆解 competitive-ads-extractor 拆竞品卖点、钩子和视觉套路
图文内容骨架 content-research-writer 先确定内容,再做视觉
素材库 file-organizernotion-knowledge-capture 管理封面、截图、参考图和灵感
短视频素材 video-downloader 下载和整理可分析素材
直播 / 访谈切片 meeting-notes-and-actionsmeeting-insights-analyzer 从长内容里提炼选题和片段
GIF / 动态素材 slack-gif-creator 生成轻量动图、字幕图和片段素材

这类创作者最容易走偏的地方是:先追求视觉效果,再补内容。

更稳的顺序应该是:

先定信息
  -> 再定结构
  -> 再做视觉
  -> 最后适配平台

否则很容易做出漂亮但空的卡片。

2. 小红书图文:不是短文,而是分屏阅读

小红书图文的难点不在于 500 字文案。

它的核心是把一个观点切成几屏,让读者一张一张滑下去。

可以先用 content-research-writer 把主题变成内容骨架:

请把这个主题拆成一组小红书图文。

主题:Codex Skill 如何把内容创作变成工作流

请输出:
1. 封面标题,给 5 个备选。
2. 6 张卡片结构。
3. 每张卡片只讲一个点。
4. 每张卡片包含:主标题、副标题、正文要点。
5. 最后一张给行动建议。
6. 标出哪些信息需要事实复核。

先不要生成图片。

确认内容后,再交给 canvas-design

请基于上面的 6 张卡片内容,设计小红书图文画布。

要求:
1. 每张卡片信息不要超过 3 层。
2. 字号层级清楚,适合手机阅读。
3. 给出布局建议:标题区、正文区、强调区。
4. 说明哪些词适合做高亮。
5. 不要添加无意义装饰。

如果你要长期做系列图文,再用 theme-factory 固定主题色、字体和视觉 token。

3. 封面:先拆竞品,再定自己的表达

很多人做封面只问:

帮我做一个吸引人的标题。

这太粗。

更好的做法是用 competitive-ads-extractor 拆同类爆款封面:

请分析这些参考封面或标题。

请输出:
1. 它们共同使用了哪些钩子。
2. 哪些词负责制造好奇。
3. 哪些词负责制造收益感。
4. 哪些视觉元素负责降低理解成本。
5. 哪些表达可能夸大或不适合使用。
6. 给我的账号生成 10 个更克制的封面标题。

这样做不是为了洗封面,而是理解用户为什么停下来。

封面常见钩子可以粗分为:

钩子类型 例子 风险
痛点型 “为什么你用 AI 写稿还是很慢” 容易制造焦虑
对比型 “提示词 vs Skill,差别在哪里” 容易过度简化
清单型 “7 类创作者 Skill 配置表” 容易堆信息
结果型 “把一篇长文拆成 5 种内容” 容易夸大收益
避坑型 “小红书图文最容易踩的 4 个坑” 需要真实经验支撑

封面是入口,不是承诺书。

如果正文做不到,封面就不要写得太满。

4. 图片增强:不要把低质素材硬拉满

image-enhancer 适合做图片增强、放大、清晰化和视觉质感优化。

但它不能解决所有问题。

适合处理:

封面图轻微模糊
截图分辨率不够
海报需要统一质感
素材图需要适配平台尺寸

不适合处理:

版权不清楚的图片
严重裁切导致信息缺失的图片
文字本身错误的图片
需要准确展示产品细节的图片

对技术教程号尤其要注意:如果图片里有代码、界面、价格、模型名称、配置项,不要盲目增强后直接发布。

视觉模型可能把文字修错。

发布前必须人工看一遍。

5. 短视频:先拆长内容,再写脚本

短视频创作者常见的素材来源有三类:

长文章
直播回放
访谈 / 播客 / 课程录屏

如果你有长视频或直播录音,可以先用 meeting-notes-and-actions 提炼结构:

下面是一场直播转写稿。

请输出:
1. 直播主题。
2. 观众最关心的问题。
3. 10 个适合剪成短视频的片段。
4. 每个片段的起止线索。
5. 每个片段的标题、钩子和结尾。
6. 哪些片段需要补充画面或字幕解释。

再用 meeting-insights-analyzer 找更深的洞察:

请分析这场访谈里最适合传播的观点。

请输出:
1. 最有争议的观点。
2. 最有实操价值的建议。
3. 最适合做 30 秒短视频的片段。
4. 最适合做 3 分钟讲解的片段。
5. 哪些内容容易被断章取义。
6. 发布时需要加的上下文说明。

这一步很关键。

不要只剪“金句”,还要判断它离开上下文以后会不会误导。

6. video-downloader:素材先规整,再分析

video-downloader 的价值不是“下载视频”四个字这么简单。

对短视频团队来说,它更像素材入口。

建议目录这样放:

video-workflow/
  raw/
    source-videos/
    transcripts/
  analysis/
    hooks.md
    chapters.md
    clip-candidates.md
  scripts/
    30s/
    90s/
  subtitles/
  covers/
  output/
  rights/
    source-links.md
    permission-notes.md

特别要保留 rights/ 目录。

短视频、直播、访谈和课程切片都涉及版权和授权。不要把“能下载”理解成“能发布”。

7. 从一篇长文拆成图文和视频

假设你有上一篇公众号长文,可以让 Codex 继续拆:

请把 publish/wechat/article.md 拆成小红书图文和短视频脚本。

输出:
1. 小红书 6 张卡片内容。
2. 每张卡片的视觉重点。
3. 3 条短视频脚本:
   - 30 秒版本
   - 60 秒版本
   - 90 秒版本
4. 每条脚本包含:开头钩子、正文、结尾行动。
5. 需要配的画面和字幕提示。
6. 不适合短视频表达的内容。

要求:
不要新增事实。
不要夸大原文结论。
不要把技术细节剪到失真。

这个任务不一定需要最强模型。

通过 4SAPI 可以这样分层:

步骤 模型策略
提炼长文主线 中等文本模型
拆小红书卡片 中文表达模型
设计卡片结构 代码 / 视觉理解模型
写短视频脚本 中等文本模型
检查事实一致性 强模型或人工复核
生成封面图 图像模型

核心原则是:强模型用在判断和校验上,低成本模型用在格式转换上。

8. 品牌规范:让观众记住账号,而不是单条内容

小红书和短视频很容易追热点,追着追着账号就散了。

brand-guidelines 在视觉分发里很重要。

建议至少写清楚这些:

# 图文和视频账号规范

## 视觉
- 主色、辅助色、警示色
- 标题字号和高亮方式
- 封面固定结构
- 是否使用真人头像或产品截图

## 文案
- 标题长度
- 开头钩子类型
- 禁用词和夸张表达
- 结尾行动方式

## 平台
- 小红书:封面和前两张卡片必须解释收益
- 视频号:脚本要更口语化
- B站:标题可以更信息密集

## 审核
- 所有数据、价格、产品功能必须人工复核
- 所有图片和视频素材必须确认授权

这份规范应该让每次输出更像同一个账号。

9. 最小可落地流程

如果你今天就想跑起来,可以先用这个版本:

第 1 步:从一篇长文或直播转写稿开始
第 2 步:content-research-writer 提炼核心观点
第 3 步:canvas-design 拆 6 张小红书卡片
第 4 步:competitive-ads-extractor 生成封面钩子备选
第 5 步:image-enhancer 优化封面和截图
第 6 步:meeting-notes-and-actions 拆短视频片段
第 7 步:file-organizer 归档素材和成品
第 8 步:人工复核后发布

先别追求全自动。

先让同一份内容稳定产出:

1 篇公众号
1 组小红书图文
3 条短视频脚本
1 份素材归档

这就已经比单次写作强很多。

10. 成本与风险提示

视觉和视频工作流最容易成本失控。

表现 处理方式
封面反复生图 一张图试 20 次 先用文本模型定结构,再调用图像模型
视频切片太多 每场直播拆几十条 先筛传播价值,再进入剪辑
字幕错误 专有名词、数字、模型名称识别错 人工审字幕
版权不清 下载素材直接二创 保留来源和授权记录
标题夸张 点击率上去了,信任下降 用账号规范约束标题

4SAPI 这类大模型API中转站可以帮你记录每个环节的调用成本,但不能替你判断素材是否有权使用。

图文和视频越容易放大传播,越要保留人工审核。

11. 总结

小红书和短视频的 Skill 工作流,不是把长文压缩成短内容,而是重新组织信息:

长文逻辑
  -> 平台钩子
  -> 卡片节奏
  -> 视频脚本
  -> 字幕画面
  -> 素材归档

推荐组合是:

content-research-writer 定内容骨架
canvas-design 做卡片和画布
theme-factory 固定视觉主题
image-enhancer 优化图片
competitive-ads-extractor 拆封面和钩子
meeting-notes-and-actions 拆直播和访谈
file-organizer 管素材
brand-guidelines 固定账号风格

一句话总结:

长文解决“讲清楚”,图文和短视频解决“让人停下来并愿意看完”。

下一篇继续拆知识付费、商业广告、AI 产品号和矩阵团队:这些更接近变现和协作的内容工作流,应该怎么配 Skill、控成本和守边界。