MMotion Validation

動作控制驗證:重點不是多骨架,而是「單方動作 + 固定背景 + 局部區域」

本頁只做中性技術代理驗證,不含 explicit 內容。目標是判斷動作產線是否能處理大姿勢、遮擋、局部變形與表情同步。

現行結論

2026-06-01 · L4 x1

單人骨架可用

單一主體、低角度或大幅姿勢可以用 ControlNet/OpenPose 鎖住大輪廓,適合作 keyframe 軌主控。

雙人同步骨架不是主路線

多骨架能出圖,但身份、遮擋、相對位置會漂;checkpoint / pose LoRA 多半不是為一張圖內的雙人接觸動作設計。

See-Through 只適合微動

拆層適合表情、手腳、衣服、頭髮、呼吸等 Live2D 式微動,不適合解決大角度或接觸關係。

骨架對照證據

三欄依序是 control skeleton、generated、posecheck;posecheck 是對生成圖反抽 DWPose。

motion skeleton contact sheet
測試結果判斷
sequence back/mid/forward3/3 success可以生成連續 keyframe,但雙人相對關係仍有漂移。
low angle foreshorteningsuccess單人低角度比較可控,適合主動方單人軌。
occlusion overlapsuccess可出圖,但遮擋與身份分離不穩,不適合作一次生成最終圖。
總時間78.59 sRealVis 快取後約 15-16 秒/張。

關鍵解讀

這組測試不是為了做成品,而是確認「多骨架一次生成」的風險。結論是:應把另一方固定成背景/遮罩層,把主要動作降維成單人控制,再用局部區域和表情軌補細節。

推薦主線

把多人互動降維成單人動畫問題。

1. 鎖鏡頭先定背景方、鏡頭、光影、接觸區域,不讓每張 keyframe 重算整張圖。
2. 背景方凍結固定另一方為背景圖層或 inpaint protected region。
3. 主動方單人骨架用 ControlNet / pose LoRA 只控制主動方的 keyframe。
4. 局部區域軌用遮罩 A/B、局部 inpaint、表情 landmark 修接觸點。
5. 補幀 / loopRIFE 或其他補幀只吃已穩定 keyframe,不負責修解剖錯誤。

單方動作驗證

固定方完全不重算,主動方跑 back / mid / forward 三格,局部與表情用代理參數追蹤。

one side motion keyframes
one side motion loop
背景穩定PASS · 遮罩外像素差 0
主動方位移117 px
局部 A/B 中心位移59 × 17 px
表情代理跨度0.70
產生時間< 1 s 本機合成

Blender P0 拓樸矩陣

本機 Blender 5.1.2 headless 產出,驗證 3D proxy → control-map 這段可自動化。

Blender topology P0 control map contact sheet
姿勢原子8
鏡頭桶6
已驗證 preset48
keyframe144 · start / mid / end
control PNG576 · OpenPose / Depth / Normal / Mask
解析度384 × 576

用途

Blender 這段不直接產最終圖,而是把姿勢、鏡頭、角度、遮擋與光影先變成可重複的控制訊號。後面再接 SDXL / Wan 角色化、See-Through 拆層與 web V 皮微動。

局部區域與表情驗證

explicit 器官畫面由 PM 自行處理;技術驗證使用區域 A/B 與臉部 landmark 代理。

固定背景方 主動方單人骨架 區域 A/B 接觸遮罩 表情 landmark
要驗證的事安全代理判定方式
局部形變區域 A/B 橢圓遮罩每個 keyframe 的遮罩中心、面積、邊界不能跳。
接觸關係道具/標記點接觸遮擋前後順序、接觸點距離、交疊比例穩定。
表情同步眼睛、眉毛、口部 landmark臉部區域可單獨重繪,補幀後嘴型/眼神不漂。
節奏back/mid/forward keyframe補幀後主動方週期一致,背景方不晃。

真人 Reference → AI 魔改技術流

用 reference 解姿勢、角度、光線、鏡頭,不讓 AI 憑空猜。

為什麼有效

真人照片把鏡頭、姿勢、光影、重心、遮擋先鎖死。AI 只負責角色身份、畫風、服裝與材質轉換,難度比純 prompt 低很多。

安全拆法

reference 只當 pose / depth / lighting / mask control,不把真人臉或身份帶進成品;角色仍用虛擬人設與固定 LoRA/IPAdapter 管一致性。

產品意義

這條線能變成「拍 reference → 自動生成 V 皮 / 角色場景 / 動作包」服務,比單純 NSFW 產圖更可賣。

Live2D / Blender 路線

Live2D 還缺什麼目前狀態
乾淨 PSD 分層命名See-Through 有初稿,需修洞與邊界。
ArtMesh / mesh warpweb player 已有 transform,下一步要網格變形。
Deformer hierarchy需要頭/身/髮/臉/手的參數層級。
clipping mask / draw orderSee-Through bbox 可當起點,但眼口臉遮罩要補。
physics可先 web spring,Cubism 則要 physics3.json。
Cubism export未做;短期先賣 web V 皮或 PSD rig-ready 包。
Blender 技術流用途
3D proxy / 骨架 / 鏡頭 / 燈光鎖定姿勢、角度、光影、遮擋。
輸出 OpenPose / Depth / Normal / Mask餵給 SDXL/Wan,降低 AI 猜測。
AI 魔改成角色圖保留控制訊號,換成虛擬角色風格。
See-Through 拆層回到 Live2D-like 微動與表情軌。
補幀 / 影片切換處理大動作片段,前端切 video 或 keyframe loop。
環境狀態本機已安裝 Blender 5.1.2 + Blender MCP addon;P0 control-map 矩陣已通過驗證。

Blender 自動化可行性

Blender P0 已跑驗證;這裡保留自動化邊界判斷。

可全自動的部分

3D proxy、骨架、鏡頭、燈光、pose pack、OpenPose / Depth / Normal / Mask / Lineart 控制圖輸出。

需要自動評分

每個 pose 產多張候選,再用角色一致性、posecheck、mask drift、臉部 landmark、光影一致性篩掉壞圖。

不該承諾零人工

手指、眼口、髮絲、遮擋前後順序、衣服邊界、表情美感仍需要 QA gate。

流程段AI 化程度產品判斷
Blender 生成控制圖最值得自動化,可穩定解姿勢、角度、鏡頭、光影。
SDXL / Wan 角色化中高可批次產候選,但需要一致性評分。
See-Through 拆層中高能自動出初稿,邊界與補洞要抽查。
Web V 皮 runtime適合 template 化,快速交付。
Cubism 成品中低需要 rigger QA;不要當第一版全自動承諾。

V 皮產品化判斷

可賣,但不要一開始承諾全自動 Cubism 成品。

AI Web V 皮

最適合先賣。交付 web bundle / OBS browser source,支援眨眼、嘴型、呼吸、髮物理、滑鼠跟隨。See-Through + web runtime 已接近這條線。

PSD rig-ready

可半自動量產。AI 先拆層、命名、補洞、修邊、輸出預覽,再交給 rigger 做 Cubism。這比直接賣完整 V 皮穩。

完整 Cubism V 皮

單價高,但仍需要人工 QA:ArtMesh、deformer、clipping mask、draw order、physics 手感都會因角色而變。

階段AI 產線化程度主要風險
拆層 / 命名 / 補洞髮絲、手指、眼口遮罩邊界需抽查。
web runtime 微動需要穩定 preset 與不同角色比例的映射。
PSD rig-ready中高能省 rigger 前處理時間,但不能保證零修圖。
Cubism mesh / deformer可 template 化,但高品質變形仍要人工修。
Cubism physics / 成品交付中低手感與穿幫檢查很吃人工 QA。

接下來要做的最小產品

Web V 皮 MVP

不依賴 Cubism:拆層、眨眼、嘴型、呼吸、髮物理、滑鼠跟隨、OBS browser source。

PSD rig-ready 規格

定義圖層命名、貼圖尺寸、補洞規則、preview manifest,讓 rigger 可以直接接。

Blender 控制圖包

先產品化 3D proxy 產 OpenPose / Depth / Normal / Mask,讓姿勢、角度、鏡頭與光影成本可估算。