China3dv 2026

可控、可视、可推演的通用4D世界模型。

工作：NeoVerse

4D空间视频生成和编辑。工作：PointSplat

LingBot系列工作，重建(感知)->模拟(世界模型)->具身操作

What is the goal of vision: "to know what(语义) is where(几何)", "what can we do with it"(物理理解)

铰链物体的part分割；物体pose的隐空间表示和编辑；2d到3d的生成蒸馏

LLM预测语境 vs World model预测真实、物理等

三条路线：视频生成，空间智能，隐式表征

工作：Motion 3-to-4 (single object)；

手术场景的3d4d感知。

工作：GGPT。学习（pretrained fundation model）+计算（structure from motion）

partial 2d observation -> 3d recon and generation

工作：RnG。VGGT结构网络做重建+生成（给稀疏视角，重建和补全整个物体）

长上下文的视频世界模型。diffusion model as game engine.

长期记忆；多玩家；可控性(level of detail式的tokenize)；drifting