Discussions

20250909 with 老颜

Related work以下几个方向

3d point tracking

处理长序列视频的问题，比如vggt-slam之于vggt；long3r等。

贡献：

现有的方法基于batch进行优化，如果用在长序列with sliding window的fashion的话，3d point track精度会下降（验证一下）。核心问题就是通过streaming的方式解决长序列的track精度问题。

问题：

导致显存炸的问题是什么，是否帧数增大/query point增多会导致空间开销变大。
3d point tracking相对于2d point tracking 特有的问题是什么？如果3dpt=2dpt+depth estimation，那3dpt就没有它独有的科研问题，解决好2dpt的方法就可以很manner的用过来解决好3dpt。比如，这两个问题的建模有什么不同；3dpt在特征融合的时候，是否有因为方法建模引起的问题。

20250911 with 飞哥

memory bank的设计，history information保存哪些，如何更新，如何retreve。track-on，sam2

encoder part：\(\pi^3\)或者fastvggt

sliding window方式做长序列window内的BA，sliding window的size是否可以flexible和adaptive等可以挖掘的小点。

training / testing dataset，主要的benchmark，与各个方法的接口。

20250919 with 飞哥

TODO：

cotracker3 spatialtrackerv2的evaluation，evaluation dataset都准备好，跑出现有工作论文里的指标。
测一测long sequence，有没有performance drop
加自己的

Brain storming：

对track做grouping，对motion pattern做分类
多少个track的选择，怎么选择，有没有elegent的设计
有没有较极端场景（动态物体多，运动速度过快）（所有的query point基本都在动态物体上，spatialtrackerv2会完全垮掉 => 如何用local/global context解决long-term error accumulate的问题），可以和第二点辅助query的选择结合起来做了

20251006

Brain storming:

自适应的query策略能不能从高斯/nerf里搞一搞？
DOT, dense optical tracking: connecting the dots里，有比较初步的query点选择策略（从光流中提取运动边界）。

20251007 with 老颜

\(pi^3\)作前端的重建，能保证视角变化引起的scale问题。
query point出画面的过程中，能不能选一些支撑点，保证之前的点不要乱飘（能不能利用上之前的tracker里能够在track之间share信息的inductive bias，使得看得见的点的track能引导被遮挡/出画面的点的track）
feature extractor换成dinov3这种invariant的

20251010 with 飞哥

梳理故事： 3d online point tracking

对于头戴式/机械臂头的相机在一个房间内进行活动的场景： 1. 需要一个在线/增量式的3d处理系统（3d online point tracking） 2. 针对场景中特征点不断出入画面，需要有adaptively memory的维护 3. 为了提高在这种场景中的表现鲁棒性，需要有特殊的/结合memory的辅助query选择策略

方法(todo)： 1. memory的设计 1. track-on做基本的参考。 2. query的选择，adaptively的filter out。（brain storming：online的filter out，motion prediction+reprojection loss...） 3. query selection with memory