單人骨架可用
單一主體、低角度或大幅姿勢可以用 ControlNet/OpenPose 鎖住大輪廓,適合作 keyframe 軌主控。
本頁只做中性技術代理驗證,不含 explicit 內容。目標是判斷動作產線是否能處理大姿勢、遮擋、局部變形與表情同步。
單一主體、低角度或大幅姿勢可以用 ControlNet/OpenPose 鎖住大輪廓,適合作 keyframe 軌主控。
多骨架能出圖,但身份、遮擋、相對位置會漂;checkpoint / pose LoRA 多半不是為一張圖內的雙人接觸動作設計。
拆層適合表情、手腳、衣服、頭髮、呼吸等 Live2D 式微動,不適合解決大角度或接觸關係。
三欄依序是 control skeleton、generated、posecheck;posecheck 是對生成圖反抽 DWPose。
| 測試 | 結果 | 判斷 |
|---|---|---|
| sequence back/mid/forward | 3/3 success | 可以生成連續 keyframe,但雙人相對關係仍有漂移。 |
| low angle foreshortening | success | 單人低角度比較可控,適合主動方單人軌。 |
| occlusion overlap | success | 可出圖,但遮擋與身份分離不穩,不適合作一次生成最終圖。 |
| 總時間 | 78.59 s | RealVis 快取後約 15-16 秒/張。 |
這組測試不是為了做成品,而是確認「多骨架一次生成」的風險。結論是:應把另一方固定成背景/遮罩層,把主要動作降維成單人控制,再用局部區域和表情軌補細節。
把多人互動降維成單人動畫問題。
固定方完全不重算,主動方跑 back / mid / forward 三格,局部與表情用代理參數追蹤。
| 背景穩定 | PASS · 遮罩外像素差 0 |
|---|---|
| 主動方位移 | 117 px |
| 局部 A/B 中心位移 | 59 × 17 px |
| 表情代理跨度 | 0.70 |
| 產生時間 | < 1 s 本機合成 |
本機 Blender 5.1.2 headless 產出,驗證 3D proxy → control-map 這段可自動化。
| 姿勢原子 | 8 |
|---|---|
| 鏡頭桶 | 6 |
| 已驗證 preset | 48 |
| keyframe | 144 · start / mid / end |
| control PNG | 576 · OpenPose / Depth / Normal / Mask |
| 解析度 | 384 × 576 |
Blender 這段不直接產最終圖,而是把姿勢、鏡頭、角度、遮擋與光影先變成可重複的控制訊號。後面再接 SDXL / Wan 角色化、See-Through 拆層與 web V 皮微動。
explicit 器官畫面由 PM 自行處理;技術驗證使用區域 A/B 與臉部 landmark 代理。
| 要驗證的事 | 安全代理 | 判定方式 |
|---|---|---|
| 局部形變 | 區域 A/B 橢圓遮罩 | 每個 keyframe 的遮罩中心、面積、邊界不能跳。 |
| 接觸關係 | 道具/標記點接觸 | 遮擋前後順序、接觸點距離、交疊比例穩定。 |
| 表情同步 | 眼睛、眉毛、口部 landmark | 臉部區域可單獨重繪,補幀後嘴型/眼神不漂。 |
| 節奏 | back/mid/forward keyframe | 補幀後主動方週期一致,背景方不晃。 |
用 reference 解姿勢、角度、光線、鏡頭,不讓 AI 憑空猜。
真人照片把鏡頭、姿勢、光影、重心、遮擋先鎖死。AI 只負責角色身份、畫風、服裝與材質轉換,難度比純 prompt 低很多。
reference 只當 pose / depth / lighting / mask control,不把真人臉或身份帶進成品;角色仍用虛擬人設與固定 LoRA/IPAdapter 管一致性。
這條線能變成「拍 reference → 自動生成 V 皮 / 角色場景 / 動作包」服務,比單純 NSFW 產圖更可賣。
| Live2D 還缺什麼 | 目前狀態 |
|---|---|
| 乾淨 PSD 分層命名 | See-Through 有初稿,需修洞與邊界。 |
| ArtMesh / mesh warp | web player 已有 transform,下一步要網格變形。 |
| Deformer hierarchy | 需要頭/身/髮/臉/手的參數層級。 |
| clipping mask / draw order | See-Through bbox 可當起點,但眼口臉遮罩要補。 |
| physics | 可先 web spring,Cubism 則要 physics3.json。 |
| Cubism export | 未做;短期先賣 web V 皮或 PSD rig-ready 包。 |
| Blender 技術流 | 用途 |
|---|---|
| 3D proxy / 骨架 / 鏡頭 / 燈光 | 鎖定姿勢、角度、光影、遮擋。 |
| 輸出 OpenPose / Depth / Normal / Mask | 餵給 SDXL/Wan,降低 AI 猜測。 |
| AI 魔改成角色圖 | 保留控制訊號,換成虛擬角色風格。 |
| See-Through 拆層 | 回到 Live2D-like 微動與表情軌。 |
| 補幀 / 影片切換 | 處理大動作片段,前端切 video 或 keyframe loop。 |
| 環境狀態 | 本機已安裝 Blender 5.1.2 + Blender MCP addon;P0 control-map 矩陣已通過驗證。 |
Blender P0 已跑驗證;這裡保留自動化邊界判斷。
3D proxy、骨架、鏡頭、燈光、pose pack、OpenPose / Depth / Normal / Mask / Lineart 控制圖輸出。
每個 pose 產多張候選,再用角色一致性、posecheck、mask drift、臉部 landmark、光影一致性篩掉壞圖。
手指、眼口、髮絲、遮擋前後順序、衣服邊界、表情美感仍需要 QA gate。
| 流程段 | AI 化程度 | 產品判斷 |
|---|---|---|
| Blender 生成控制圖 | 高 | 最值得自動化,可穩定解姿勢、角度、鏡頭、光影。 |
| SDXL / Wan 角色化 | 中高 | 可批次產候選,但需要一致性評分。 |
| See-Through 拆層 | 中高 | 能自動出初稿,邊界與補洞要抽查。 |
| Web V 皮 runtime | 高 | 適合 template 化,快速交付。 |
| Cubism 成品 | 中低 | 需要 rigger QA;不要當第一版全自動承諾。 |
可賣,但不要一開始承諾全自動 Cubism 成品。
最適合先賣。交付 web bundle / OBS browser source,支援眨眼、嘴型、呼吸、髮物理、滑鼠跟隨。See-Through + web runtime 已接近這條線。
可半自動量產。AI 先拆層、命名、補洞、修邊、輸出預覽,再交給 rigger 做 Cubism。這比直接賣完整 V 皮穩。
單價高,但仍需要人工 QA:ArtMesh、deformer、clipping mask、draw order、physics 手感都會因角色而變。
| 階段 | AI 產線化程度 | 主要風險 |
|---|---|---|
| 拆層 / 命名 / 補洞 | 高 | 髮絲、手指、眼口遮罩邊界需抽查。 |
| web runtime 微動 | 高 | 需要穩定 preset 與不同角色比例的映射。 |
| PSD rig-ready | 中高 | 能省 rigger 前處理時間,但不能保證零修圖。 |
| Cubism mesh / deformer | 中 | 可 template 化,但高品質變形仍要人工修。 |
| Cubism physics / 成品交付 | 中低 | 手感與穿幫檢查很吃人工 QA。 |
不依賴 Cubism:拆層、眨眼、嘴型、呼吸、髮物理、滑鼠跟隨、OBS browser source。
定義圖層命名、貼圖尺寸、補洞規則、preview manifest,讓 rigger 可以直接接。
先產品化 3D proxy 產 OpenPose / Depth / Normal / Mask,讓姿勢、角度、鏡頭與光影成本可估算。