
视觉提示工程 (Visual Prompting) 101:像 AI 一样思考
在 Whisk 的世界里,语言苍白无力。你需要学会用“图片”来写 Prompt。这是一门全新的学科:Visual Prompting。本文教你如何建立自己的视觉语料库。
Prompt Engineering 死了,Visual Prompting 活了。 在 ChatGPT 时代,你学会了说 "Act as a marketing expert"。 在 Whisk 时代,你需要学会找图。你需要找一张“构图极简但光影复杂”的图来告诉模型“我要这种感觉”。
什么是 Visual Prompting?
Visual Prompting 的核心逻辑是:Image is Instruction (图像即指令)。 一张图片包含的信息量是文字的数万倍。
- Structure Prompt (结构提示):用简笔画、线稿或 3D 灰模来控制画面的骨架。
- Aesthetic Prompt (美学提示):用电影剧照、油画或摄影作品来控制画面的皮囊。
- Semantic Prompt (语义提示):用实物图来定义画面的主体。
建立你的视觉库
一个优秀的 WhiskPrompt 用户,通常会像一个老练的电影导演一样,维护一个庞大的素材库(Mood Board):
1. Light (光效库)
专门收集各种光影效果的图。
- 丁达尔效应 (Tyndall Effect)
- 赛博霓虹 (Neon Noir)
- 伦勃朗光 (Rembrandt Lighting) 当你需要这种光时,直接在这个文件夹里拖一张图进去。
2. Texture (材质库)
- 生锈的金属
- 粗糙的纸张
- 透明的玻璃
3. Layout (构图库)
- 极简留白
- 黄金螺旋
- 对称构图
不要让 AI “猜”
以前我们写 "masterpiece, best quality, 8k",其实是在求 AI:“求求你,画好一点吧”。 现在我们在 Whisk 里,我们直接给他一张大师的作品:“照着这个标准画”。
这才是 AI 应有的样子:它是你的手,而你是大脑。
更多文章

Whisk Style Tuner 详解:如何提取任意图片的风格 DNA
Whisk 最强大的功能之一就是 Style Tuner。通过上传一张参考图,你可以“吸取”它的风格 DNA 并应用到任何主体上。

无需梯子!在 WhiskPrompt 体验 Google Whisk 的完整能力
由于 Google Whisk 尚未全量开放,很多创作者无法体验其强大的图像混合功能。WhiskPrompt 通过独特的代理架构和预设 Prompt 库,让每一个用户都能无门槛、低延迟地使用 Whisk 能力。本文是 WhiskPrompt 平台的终极使用指南。

Whisk 角色一致性工作流:连载漫画家的福音
画漫画最怕角色脸崩。Google Whisk 通过 Character Reference 实现了完美的面部锁定,让你的角色在 100 张图中保持同一张脸。
邮件列表
加入我们的社区
订阅邮件列表,及时获取最新消息和更新