目标不是做一个“会聊天的化学助手”,而是做一个能完成闭环科研任务的 Agent:
-
输入:反应底物/条件候选、历史实验记录、文献片段、你的预测模型结果(yield/property/retrosynthesis)
-
输出:可执行的实验建议(高层级,不提供危险/违禁合成步骤)、理由链、风险点、下一轮要补的数据、以及“为什么上次失败”的反思报告
-
闭环能力:
Plan → Act(tool) → Observe → Reflect → Update(memory/strategy)
最后 6 个月你要交付的不是“读了很多论文”,而是:
- 一个可运行 Demo(最好有 UI)
- 一套可复现实验与评估(evaluation harness)
- 一份技术报告(像短 paper 一样)
- 一条清晰的故事线(简历/面试能讲)
能力栈拆解(你需要“并行推进”的四条主线)
把 6 个月分成四条 track,每周都动一点,避免“只读不做”或“只做不总结”。
Track A|LLM/Agent 基础(推理 + 工具调用 + 规划)
- Tool-use / Planner-Executor / ReAct-ish patterns
- 结构化输出(schema)、多轮决策、失败重试策略
Track B|World Model / Self-learning(从预测模型升级为“可交互世界”)
- 把 yield prediction 看作局部 world model(状态→结果的动力学近似)
- 加入“行动空间”(实验条件选择、路线选择)与“反馈更新”(主动学习/反思记忆)
Track C|Chemistry 领域对齐(把你已有研究资产变成工具)
- yield/property/retrosynthesis/GNN 都当成tool或evaluator