2025 年是我本科毕业后,在杭州做 RA 的第一个完整年份。从关键指标来看,这一年并不算顺利:论文全部被拒。与此同时,技术仍然在以超出预期的速度向前发展,自己欠下的技术债也越来越多。领域发展的规律变得更难判断。正如张老师所说:“在大家还在争辩 3D 的结局时,有一些领域已经在无人在意的角落毫无争议地默默倒下了。”
从 2023 年末开始接触生成模型,到现在也已经两年了。最开始在公司实习时,我做了不少生成模型应用;回到学校做 RA 之后,逐渐接触到更基础的问题。更准确地说,这是一个从 application research 到 fundamental research 的转变。这个过程里必然会有不适应,但从结果来看,这种转变是有价值的。Fundamental research 更需要主动定义问题,也更能提醒自己:不要只做看起来自洽、但缺乏清晰验证标准的问题。
2025 年技术发展的速度让我意识到,过去熟悉的一些方向在学校语境下并不一定合适,至少不完全符合我现在的研究偏好。例如,此前了解较多的可控生成,已经被新的通用模型和产品形态重新定义;这也对应了前面提到的那个“默默倒下”的方向。从 6 月开始,我开始调整研究方向。现在判断一个方向是否值得投入,我最基本的标准是评估是否足够客观:是否存在公认的评价指标和评价数据,也就是 benchmark;或者至少能否建立稳定、可复现的评估系统,尽可能避免依赖不可量化的主观评价。
这也是一种 research taste 的训练:判断什么问题即使模型能力继续提升,仍然值得研究。某种意义上,这也对应 The Bitter Lesson。很多判断不能只靠阅读和讨论得到;即使读到了相关观点,也可能仍然觉得抽象。只有经历足够多的具体项目,才会真正建立和认可这些判断。
在研究中,好 idea 很重要,但稳定地产生“足够好”的 idea 本身就是困难的。计算资源有限,时间有限,能力也有限。过去我很容易产生一种错觉,认为只要继续想、继续看论文,好的 idea 就会自然出现。但实际上一篇论文的产生往往带有偶然性,需要在未知空间里持续探索。探索很难被某种确定的方法论完整解释,简单来说,就是不断尝试,并在尝试中建立认知。
而探索这个动作高度依赖工程能力。工程能力恰好是相对容易量化、也可以通过训练持续积累的能力:能否把研究问题定义得更准确,能否建立足够好的实验工具来迭代各种想法,能否保证实验本身是真的可复现,而不是某种偶然结果。很多“缺 idea”的时候,本质上还是因为没有真正动手验证,同时实验环境和系统不够干净,导致无法判断自己到底在解决什么问题;换句话说,是在行动上偷懒了。
2026 年,需要把精力投向更关键的问题,把工程能力提升上去,把研究做清楚。同时,我给自己加了一个具体的衡量标准:一篇工作完成后,要能沉淀出一份可直接复用的指南,讲清楚相关研究的发展脉络,并说明如何从 baseline 一步步推演到最终方法。这样做的意义并不只是“开源”,而是为后续研究提供一套稳定、可控、可持续迭代的评价工具:别人可以复现,你也可以在同一套基准上快速验证下一次改动到底是在进步,还是在自欺。
2026 年初有一种说法是:我们即将进入 21 世纪的夏天。回看 2025,这一年还是很棒的,尤其是刷新了地球 Online 的地图。

Figure 1. 2025 trip in the US and Japan.