動作控制驗證：重點不是多骨架，而是「單方動作 + 固定背景 + 局部區域」

本頁只做中性技術代理驗證，不含 explicit 內容。目標是判斷動作產線是否能處理大姿勢、遮擋、局部變形與表情同步。

現行結論

2026-06-01 · L4 x1

單人骨架可用

單一主體、低角度或大幅姿勢可以用 ControlNet/OpenPose 鎖住大輪廓，適合作 keyframe 軌主控。

雙人同步骨架不是主路線

多骨架能出圖，但身份、遮擋、相對位置會漂；checkpoint / pose LoRA 多半不是為一張圖內的雙人接觸動作設計。

See-Through 只適合微動

拆層適合表情、手腳、衣服、頭髮、呼吸等 Live2D 式微動，不適合解決大角度或接觸關係。

骨架對照證據

三欄依序是 control skeleton、generated、posecheck；posecheck 是對生成圖反抽 DWPose。

測試	結果	判斷
sequence back/mid/forward	3/3 success	可以生成連續 keyframe，但雙人相對關係仍有漂移。
low angle foreshortening	success	單人低角度比較可控，適合主動方單人軌。
occlusion overlap	success	可出圖，但遮擋與身份分離不穩，不適合作一次生成最終圖。
總時間	78.59 s	RealVis 快取後約 15-16 秒/張。

關鍵解讀

這組測試不是為了做成品，而是確認「多骨架一次生成」的風險。結論是：應把另一方固定成背景/遮罩層，把主要動作降維成單人控制，再用局部區域和表情軌補細節。

單方動作驗證

固定方完全不重算，主動方跑 back / mid / forward 三格，局部與表情用代理參數追蹤。

背景穩定	PASS · 遮罩外像素差 0
主動方位移	117 px
局部 A/B 中心位移	59 × 17 px
表情代理跨度	0.70
產生時間	< 1 s 本機合成

Blender P0 拓樸矩陣

本機 Blender 5.1.2 headless 產出，驗證 3D proxy → control-map 這段可自動化。

Blender topology P0 control map contact sheet

姿勢原子	8
鏡頭桶	6
已驗證 preset	48
keyframe	144 · start / mid / end
control PNG	576 · OpenPose / Depth / Normal / Mask
解析度	384 × 576

用途

Blender 這段不直接產最終圖，而是把姿勢、鏡頭、角度、遮擋與光影先變成可重複的控制訊號。後面再接 SDXL / Wan 角色化、See-Through 拆層與 web V 皮微動。

局部區域與表情驗證

explicit 器官畫面由 PM 自行處理；技術驗證使用區域 A/B 與臉部 landmark 代理。

固定背景方主動方單人骨架區域 A/B 接觸遮罩表情 landmark

要驗證的事	安全代理	判定方式
局部形變	區域 A/B 橢圓遮罩	每個 keyframe 的遮罩中心、面積、邊界不能跳。
接觸關係	道具/標記點接觸	遮擋前後順序、接觸點距離、交疊比例穩定。
表情同步	眼睛、眉毛、口部 landmark	臉部區域可單獨重繪，補幀後嘴型/眼神不漂。
節奏	back/mid/forward keyframe	補幀後主動方週期一致，背景方不晃。

真人 Reference → AI 魔改技術流

用 reference 解姿勢、角度、光線、鏡頭，不讓 AI 憑空猜。

為什麼有效

真人照片把鏡頭、姿勢、光影、重心、遮擋先鎖死。AI 只負責角色身份、畫風、服裝與材質轉換，難度比純 prompt 低很多。

安全拆法

reference 只當 pose / depth / lighting / mask control，不把真人臉或身份帶進成品；角色仍用虛擬人設與固定 LoRA/IPAdapter 管一致性。

產品意義

這條線能變成「拍 reference → 自動生成 V 皮 / 角色場景 / 動作包」服務，比單純 NSFW 產圖更可賣。

Live2D / Blender 路線

Live2D 還缺什麼	目前狀態
乾淨 PSD 分層命名	See-Through 有初稿，需修洞與邊界。
ArtMesh / mesh warp	web player 已有 transform，下一步要網格變形。
Deformer hierarchy	需要頭/身/髮/臉/手的參數層級。
clipping mask / draw order	See-Through bbox 可當起點，但眼口臉遮罩要補。
physics	可先 web spring，Cubism 則要 physics3.json。
Cubism export	未做；短期先賣 web V 皮或 PSD rig-ready 包。

Blender 技術流	用途
3D proxy / 骨架 / 鏡頭 / 燈光	鎖定姿勢、角度、光影、遮擋。
輸出 OpenPose / Depth / Normal / Mask	餵給 SDXL/Wan，降低 AI 猜測。
AI 魔改成角色圖	保留控制訊號，換成虛擬角色風格。
See-Through 拆層	回到 Live2D-like 微動與表情軌。
補幀 / 影片切換	處理大動作片段，前端切 video 或 keyframe loop。
環境狀態	本機已安裝 Blender 5.1.2 + Blender MCP addon；P0 control-map 矩陣已通過驗證。

Blender 自動化可行性

Blender P0 已跑驗證；這裡保留自動化邊界判斷。

可全自動的部分

3D proxy、骨架、鏡頭、燈光、pose pack、OpenPose / Depth / Normal / Mask / Lineart 控制圖輸出。

需要自動評分

每個 pose 產多張候選，再用角色一致性、posecheck、mask drift、臉部 landmark、光影一致性篩掉壞圖。

不該承諾零人工

手指、眼口、髮絲、遮擋前後順序、衣服邊界、表情美感仍需要 QA gate。

流程段	AI 化程度	產品判斷
Blender 生成控制圖	高	最值得自動化，可穩定解姿勢、角度、鏡頭、光影。
SDXL / Wan 角色化	中高	可批次產候選，但需要一致性評分。
See-Through 拆層	中高	能自動出初稿，邊界與補洞要抽查。
Web V 皮 runtime	高	適合 template 化，快速交付。
Cubism 成品	中低	需要 rigger QA；不要當第一版全自動承諾。

V 皮產品化判斷

可賣，但不要一開始承諾全自動 Cubism 成品。

AI Web V 皮

最適合先賣。交付 web bundle / OBS browser source，支援眨眼、嘴型、呼吸、髮物理、滑鼠跟隨。See-Through + web runtime 已接近這條線。

PSD rig-ready

可半自動量產。AI 先拆層、命名、補洞、修邊、輸出預覽，再交給 rigger 做 Cubism。這比直接賣完整 V 皮穩。

完整 Cubism V 皮

單價高，但仍需要人工 QA：ArtMesh、deformer、clipping mask、draw order、physics 手感都會因角色而變。

階段	AI 產線化程度	主要風險
拆層 / 命名 / 補洞	高	髮絲、手指、眼口遮罩邊界需抽查。
web runtime 微動	高	需要穩定 preset 與不同角色比例的映射。
PSD rig-ready	中高	能省 rigger 前處理時間，但不能保證零修圖。
Cubism mesh / deformer	中	可 template 化，但高品質變形仍要人工修。
Cubism physics / 成品交付	中低	手感與穿幫檢查很吃人工 QA。

接下來要做的最小產品

Web V 皮 MVP

不依賴 Cubism：拆層、眨眼、嘴型、呼吸、髮物理、滑鼠跟隨、OBS browser source。

PSD rig-ready 規格

定義圖層命名、貼圖尺寸、補洞規則、preview manifest，讓 rigger 可以直接接。

Blender 控制圖包

先產品化 3D proxy 產 OpenPose / Depth / Normal / Mask，讓姿勢、角度、鏡頭與光影成本可估算。