China3dv 2026
0417 上午
张兆翔
可控、可视、可推演的通用4D世界模型。
工作:NeoVerse
周晓巍
4D空间视频生成和编辑。工作:PointSplat
徐英豪
LingBot系列工作,重建(感知)->模拟(世界模型)->具身操作
吴尚哲
What is the goal of vision: "to know what(语义) is where(几何)", "what can we do with it"(物理理解)
铰链物体的part分割;物体pose的隐空间表示和编辑;2d到3d的生成蒸馏
陈安沛
LLM预测语境 vs World model预测真实、物理等
三条路线:视频生成,空间智能,隐式表征
工作:Motion 3-to-4 (single object);
汤思宇
手术场景的3d4d感知。
工作:GGPT。学习(pretrained fundation model)+计算(structure from motion)
戴玉超
partial 2d observation -> 3d recon and generation
工作:RnG。VGGT结构网络做重建+生成(给稀疏视角,重建和补全整个物体)
Gordon Wetzstein
长上下文的视频世界模型。diffusion model as game engine.
长期记忆;多玩家;可控性(level of detail式的tokenize);drifting