2025 年度回顾

2025 年是我本科毕业后，在杭州做 RA 的第一个完整年份。从关键指标来看，这一年并不算顺利：论文全部被拒。与此同时，技术仍然在以超出预期的速度向前发展，自己欠下的技术债也越来越多。领域发展的规律变得更难判断。正如张老师所说：“在大家还在争辩 3D 的结局时，有一些领域已经在无人在意的角落毫无争议地默默倒下了。”

从 2023 年末开始接触生成模型，到现在也已经两年了。最开始在公司实习时，我做了不少生成模型应用；回到学校做 RA 之后，逐渐接触到更基础的问题。更准确地说，这是一个从 application research 到 fundamental research 的转变。这个过程里必然会有不适应，但从结果来看，这种转变是有价值的。Fundamental research 更需要主动定义问题，也更能提醒自己：不要只做看起来自洽、但缺乏清晰验证标准的问题。

2025 年技术发展的速度让我意识到，过去熟悉的一些方向在学校语境下并不一定合适，至少不完全符合我现在的研究偏好。例如，此前了解较多的可控生成，已经被新的通用模型和产品形态重新定义；这也对应了前面提到的那个“默默倒下”的方向。从 6 月开始，我开始调整研究方向。现在判断一个方向是否值得投入，我最基本的标准是评估是否足够客观：是否存在公认的评价指标和评价数据，也就是 benchmark；或者至少能否建立稳定、可复现的评估系统，尽可能避免依赖不可量化的主观评价。

这也是一种 research taste 的训练：判断什么问题即使模型能力继续提升，仍然值得研究。某种意义上，这也对应 The Bitter Lesson。很多判断不能只靠阅读和讨论得到；即使读到了相关观点，也可能仍然觉得抽象。只有经历足够多的具体项目，才会真正建立和认可这些判断。

在研究中，好 idea 很重要，但稳定地产生“足够好”的 idea 本身就是困难的。计算资源有限，时间有限，能力也有限。过去我很容易产生一种错觉，认为只要继续想、继续看论文，好的 idea 就会自然出现。但实际上一篇论文的产生往往带有偶然性，需要在未知空间里持续探索。探索很难被某种确定的方法论完整解释，简单来说，就是不断尝试，并在尝试中建立认知。

而探索这个动作高度依赖工程能力。工程能力恰好是相对容易量化、也可以通过训练持续积累的能力：能否把研究问题定义得更准确，能否建立足够好的实验工具来迭代各种想法，能否保证实验本身是真的可复现，而不是某种偶然结果。很多“缺 idea”的时候，本质上还是因为没有真正动手验证，同时实验环境和系统不够干净，导致无法判断自己到底在解决什么问题；换句话说，是在行动上偷懒了。

2026 年，需要把精力投向更关键的问题，把工程能力提升上去，把研究做清楚。同时，我给自己加了一个具体的衡量标准：一篇工作完成后，要能沉淀出一份可直接复用的指南，讲清楚相关研究的发展脉络，并说明如何从 baseline 一步步推演到最终方法。这样做的意义并不只是“开源”，而是为后续研究提供一套稳定、可控、可持续迭代的评价工具：别人可以复现，你也可以在同一套基准上快速验证下一次改动到底是在进步，还是在自欺。

2026 年初有一种说法是：我们即将进入 21 世纪的夏天。回看 2025，这一年还是很棒的，尤其是刷新了地球 Online 的地图。

Figure 1. 2025 trip in the US and Japan.