Skip to content

China3dv 2026

0417 上午

张兆翔

可控、可视、可推演的通用4D世界模型。

工作:NeoVerse

周晓巍

4D空间视频生成和编辑。工作:PointSplat

徐英豪

LingBot系列工作,重建(感知)->模拟(世界模型)->具身操作

吴尚哲

What is the goal of vision: "to know what(语义) is where(几何)", "what can we do with it"(物理理解)

铰链物体的part分割;物体pose的隐空间表示和编辑;2d到3d的生成蒸馏

陈安沛

LLM预测语境 vs World model预测真实、物理等

三条路线:视频生成,空间智能,隐式表征

工作:Motion 3-to-4 (single object);

汤思宇

手术场景的3d4d感知。

工作:GGPT。学习(pretrained fundation model)+计算(structure from motion)

戴玉超

partial 2d observation -> 3d recon and generation

工作:RnG。VGGT结构网络做重建+生成(给稀疏视角,重建和补全整个物体)

Gordon Wetzstein

长上下文的视频世界模型。diffusion model as game engine.

长期记忆;多玩家;可控性(level of detail式的tokenize);drifting