Design Node Studio
AI Asset Pipeline Engine
项目速览
- AI Workflow 使用需具备代码基础,非技术人员上手难度大
- AI Workflow 操作与节点设计与设计思维脱节,理解成本高
- 文生图 AI Prompt 缺乏治理,流程无法封装为可复用资产模板
- 文生图 AI 多轮对话上下文漂移,风格一致性丢失,提示词稀释
- 文生图 AI 跨模型、跨批次生成一致性无法保障,切换成本高
- 搭建统一可视化 AI 工作流平台,整合多模型能力
- 支持拖拽式节点设计,降低非技术人员使用门槛
- 建立流程模板库,实现文生图流程经验沉淀与复用
- 优化模型调用逻辑,避免上下文漂移及提示词稀释
- 简化操作链路,让 AI 生成结果具备标准化属性
- React 18+ReactFlow 构建可视化拖拽编排画布
- 开发 ModelAdapter 抽象层,统一对接多模型API
- 实现易用 文生图 AI 与 AI Workflow 深度融合
- DAG+JSON Schema 实现流程稳定与风格锁定
- 搭建模板库,支持流程导入导出与版本管理
- 团队AI应用效率提升75%,操作链路大幅简化
- 新人上手周期从2-3周缩短至2天
- 多模型能力互补,提升生成效果
- 沉淀15+可复用流程模板,经验复用率提升
- 跨模型生成一致性达95%,风格稳定无漂移
项目背景
2025 年,各类工作流(Workflow)与生成式 AI 工具层出不穷,但在实际设计生产场景中,仍存在显著痛点。 其一,多数 Workflow 工具对代码基础有硬性要求,非技术人员上手门槛高,其操作逻辑与节点设计脱离设计思维,难以贴合设计师的实际工作习惯,更无法形成标准化生产闭环。 其二,生成式 AI 工具的提示词(Prompt)缺乏规范治理,生产流程无法封装为可复用的资产模板,且在多轮对话中易出现上下文漂移、风格一致性丢失、提示词稀释等问题。同时,现有主流生成式 AI 工具(如豆包、Gemini、Midjourney 等)均依托独立软件生态,不仅跨模型、跨批次的生成效果一致性难以保障,工具切换成本也居高不下。 基于上述行业洞察,我们从设计侧主导推进,依托 Google AI Studio 搭建 Web 端可视化 AI 工作流引擎。该引擎深度贴合设计师的视觉工作逻辑,采用「节点 + 管线」的可视化交互形式,让设计师无需钻研底层技术细节,即可搭建可控、可复用、可规模化的 AI 资产生产流程。其核心本质是对现有生产管线进行优化升级,从根源解决技术逻辑与业务场景脱节的核心问题。

项目地址:DesignNodeStudio
存在问题
承接上述行业痛点,从「AI 资产生产系统」视角进一步拆解,AI 应用在设计生产规模化落地中面临四大核心问题:
-
语义体系错位:现有 Workflow 工具以「API / 参数 / 模型」为核心操作语义,与设计师关注的角色形态、风格体系、构图结构等视觉维度严重脱节。
-
Prompt 缺乏治理:Prompt 仅以字符串拼接形式使用,无法封装为可复用的风格模板与资产模块,每轮项目都从零开始,经验无法沉淀。
-
风格一致性缺失:跨模型、跨批次生成缺乏风格锁定机制,多轮对话中出现上下文漂移与提示词稀释,设计师需大量手动修正。
-
无规范化资产体系:AI 生成结果缺乏统一的命名规则、版本管理与归档逻辑,无法形成可追溯、可复用的标准化设计资产库。
设计目标
核心目标:将 AI 从「单次生成器」升级为「==标准化资产生产系统==」。
这一目标的落地围绕设计师的核心痛点展开:精准捕捉设计师的真实诉求——无需关注 API、参数等技术细节,只需聚焦视觉风格、资产规范等业务层面;通过可视化、低代码的节点设计,屏蔽底层模型的技术复杂度;同时推动 AI 生成结果从单次产出升级为标准化资产,实现流程复用与资产沉淀,这也是从「工具」到「系统」的核心升级逻辑。
产品方案
围绕设计目标,产品方案从「界面 → 编排 → 约束」三层展开:界面层以 ReactFlow 可视化画布为核心,提供 16 种贴合设计师工作逻辑的节点,支持拖拽式流程编排;编排层通过 DAG 拓扑调度将可视化流程定义转化为可执行的 AI 生产线;约束层以 JSON Schema 校验与风格锁定为手段,确保生成结果的一致性与可控性,最终输出标准化、可复用的设计资产。
技术栈
| 层级 | 技术 | 说明 |
|---|---|---|
| 框架 | React 18 + TypeScript | 主体 UI 框架 |
| 构建工具 | Vite 6 | 极速开发与构建 |
| 节点流图 | ReactFlow 11 | 可视化节点编辑器核心 |
| 3D 渲染 | Three.js + @react-three/fiber | 相机角度节点 3D 预览 |
| AI - Google | @google/genai (Gemini / Veo) | 图文视频生成 |
| AI - 字节跳动 | 豆包 / Volcengine Ark API | Seedream 图像生成 |
| AI - 火山视觉 | Volcengine CV API | 图像抠图处理 |
| 浏览器 Python | Pyodide v0.25.1 | 浏览器端脚本执行 |
| 持久化 | IndexedDB | 生成历史本地存储 |
系统架构
系统采用分层 Pipeline 架构,从交互到输出共五层:
| 层级 | 核心产品意义 |
|---|---|
| UI 层 | 贴合设计师使用习惯,实现类 Blender 式可视化流程搭建 |
| 编排层 | 将可视化流程转化为可调度、可执行的 AI 生产线 |
| 能力层 | 对 AI 模型进行抽象封装,使其成为可灵活替换的”零件” |
| 约束层 | 通过规则与校验机制,将 AI 转化为可被管理的标准化系统 |
| 执行层 | 落地流程执行,生成符合规范的可用资产 |
节点体系设计
节点定位为「设计能力单元」,而非「API 调用入口」。系统共设计 16 种节点,分为四大类:
| 节点类型 | 核心设计含义 |
|---|---|
| Input Nodes(输入节点) | 承载设计素材导入与核心语义输入(如风格、需求描述) |
| Generative Nodes(生成节点) | 负责角色、风格、构图等核心设计元素的生成 |
| Processing Nodes(处理节点) | 提供数据处理、图像分割等中间环节优化能力 |
| Output Nodes(输出节点) | 实现资产规范化导出、归档,对接资产库体系 |
端口类型系统(IOType)支持 TEXT / IMAGE / VIDEO / START_IMAGE / END_IMAGE / ANY 六种类型,连线时进行兼容性校验,杜绝非法连接。
Schema(架构):是对数据结构、信息格式、交互规则的标准化、结构化描述与约束,简单来说就是「定义事物”长什么样、该怎么用”的规范」,此处指通过结构化定义实现风格参数锁定与结果过滤。
工作流引擎
工作流引擎解决两个核心问题:「流程怎么跑」与「模型怎么接」。
执行机制
系统接收画布上的 JSON Graph 后,先进行 DAG 合法性校验(检测环路与孤立节点),再通过拓扑排序确定执行顺序:入度为 0 的节点并行启动,上游结果自动传递至下游节点,最终结果经 JSON Schema 校验——合规资产输出,异常资产隔离。
执行引擎核心特性:
-
并行调度:同层(入度相同)节点可并发执行,最大化利用计算资源
-
状态批量更新:通过
scheduleNodePatch + requestAnimationFrame批量刷新节点状态,避免频繁 re-render -
撤销/重做:基于快照栈实现,最多保存 50 步操作历史
-
自动布局:分组感知的 DAG 分层布局,Bundle 子节点保持相对偏移
多模型抽象
通过 ModelAdapter 接口统一不同 AI 模型的调用方式——各服务实现统一的 run 方法,屏蔽底层 API 参数与格式差异,同时将风格锁定的 Schema 规则转换为各模型的特定参数,确保跨模型风格一致性。新增模型仅需实现接口,无需修改上层逻辑。
风险治理
AI 生成流程面临风格漂移、结果崩坏、资产污染与合规风险四类主要问题,需要建立针对性的治理机制:
| 风险类型 | 治理机制 |
|---|---|
| 风格漂移 | 内置 Style Lock Node,强制统一风格参数,绑定 Schema 约束 |
| 结果崩坏 | JSON Schema 校验自动过滤不合格结果,异常拦截 |
| 资产污染 | 输出隔离机制,异常资产单独存放,不混入正式库 |
| 合规风险 | 人工审核关卡(Gate),高风险节点强制人工确认后方可继续 |
总结
Wisdom Node Studio 通过「可视化编排 + Prompt 治理 + 风格锁定 + 多模型抽象」四位一体的设计,将 AI 从「单次生成工具」升级为「标准化资产生产系统」,解决设计师在 AI 应用中的语义错位、风格不一、资产难沉淀三大核心痛点。架构层面,分层 Pipeline 设计与 DAG 拓扑调度保障了流程的稳定执行与灵活扩展;风险治理体系覆盖从生成到输出的全流程,确保 AI 生产过程可控。最终实现团队 AI 应用效率提升 75%、新人上手周期从 2-3 周缩短至 2 天、沉淀 15+ 可复用流程模板、跨模型生成一致性达 95% 的核心成果。
Q&A
Q1 你在项目中负责什么?
产品设计、架构设计、前端实现全部由我主导推进。从需求洞察到节点体系设计、从 DAG 调度引擎开发到多模型抽象适配,覆盖了从 0 到 1 的完整链路。
Q2 为什么不用现成工具(n8n / ComfyUI / Midjourney)?
n8n 和 ComfyUI 对代码基础有硬性要求,操作逻辑与设计师的视觉思维脱节,上手门槛高;Midjourney 等工具功能单一,仅支持文生图,无法完成流程编排与资产沉淀。市场上没有一个工具能同时解决「可视化编排 + 多模型统一 + 风格锁定」这三个问题,所以我们选择自建。
Q3 最大的技术挑战是什么?
多模型抽象适配。各家 AI 模型的 API 参数、请求格式、返回结构差异巨大,需要设计统一的 ModelAdapter 接口,在屏蔽底层差异的同时,将风格锁定的 Schema 规则精准转换为各模型的特定参数,确保跨模型生成效果的一致性。
Q4 项目最大的收获?
技术能力要转化为产品功能,不能直接堆技术,而是要先深度理解用户的真实诉求,再将模糊需求拆解为可落地的产品功能。这个项目让我真正做到了从「用户视角」而非「工程师视角」去思考产品,这也是从工具到系统升级的核心逻辑。