用物理人的語言,把每一層在幹嘛、Nico 想往哪走、以及 kinetics 那一維該怎麼談,一次講清楚。

Nico 這台漏斗,本質是候選削減機,不是「物理真理機」。SpCas9(1368 殘基)的多點突變庫組合爆炸(10⁴–10⁵⁺),濕實驗一輪只做得起 ~10–50 個,所以用便宜、會看核酸、可以有雜訊的篩子在頂層把庫富集,把貴的物理留給少數存活者。
| 層 | 處理量 | 在算什麼 | 你的類比 |
|---|---|---|---|
| Phase 1 序列 | 10⁴–10⁵ | 序列合不合理(幾何/親和/演化/摺疊/溶解) | 便宜 descriptor 初篩 |
| Phase 2 結構 | 100–500 摺疊 | 疊出 all-atom 複合體 + 清座標 | 建結構 + minimize |
| Phase 3 打分 | 10–100 | 結合能 ΔGbind(三條路) | 隱溶劑單點 / AIMD 系綜 |
| Phase 4 FEP | 1–5 | 精確相對 ΔΔGbind | RPA / CCSD(T) 級把關 |
為什麼需要漏斗:20 個位點就有 ~10⁵ 雙突變、~10⁷ 三突變,濕實驗做不起百萬個。漏斗唯一的任務:從天文數字的庫裡便宜地挑出「值得真的合成」的 ~10–50 個。

三個設計直覺(讀懂 Nico 每個選擇的鑰匙):
全部「只吃序列、不折疊、一次前向推論」。六個正交閘門:
為什麼需要 3D:Phase 1 全是「序列進、分數出」,看不到「這顆突變側鏈實際擺哪、跟哪個 DNA 磷酸撞到」。類比:光有化學式 Fe₃Ni 排不出能量,得先有 POSCAR。
概念(你會很有共鳴):沿一個非物理的 λ 座標把 WT 側鏈煉金術般 morph 成 mutant,在複合體與 apo 各做一次,靠熱力學循環讓算不出的邊抵消,得到精確 ΔΔGbind = ΔGmut(複合體) − ΔGmut(apo)。pmx 建 hybrid 拓撲,MBAR 把所有 λ 窗最優合成一個數+誤差(=WHAM 的 binless 繼承者)。
物理類比:就是你認得的熱力學循環(Hess/Born-Haber)+ TI / adiabatic switching。
⚠ 範圍是蛋白胺基酸突變(不做 DNA/RNA 鹼基 alchemy)。而且它是 end-state 平衡量:再精確,對速率、障礙、構形檢查點一無所知。
| 版本 | 動作 | 透露的意圖 |
|---|---|---|
| v3/v4 | 通用工具(ESM-IF1)+ 有 off-target specificity MD tier | 泛用 + 有嘗試碰專一性 |
| v5 | 換核酸感知工具、模組化打分、AF3 primary;拿掉 specificity tier;DL 推論當 primary | 「現代化、快、模組化」——但唯一碰專一性的層消失了 |
| v6 | 加 thermoMPNN;Gate 2b 做成 FoldX/Mini-MD 選擇;把 靜態 MM-PBSA 升為 primary | 預設越來越物理——把物理邊界往漏斗上方推 |
Cas9 不是「結合=切」的開關,是多步機器。辨識 on/off-target 主要發生在第 3 步(構形檢查點),不是結合那步:


為什麼對方難拒絕:pre-register 是攤開假設的好習慣;側枝是加法、可選、只跑少數候選(成本可控、不動主流程)。而且把對話錨定在你最強的主場——free energy、barrier、MD、MSM。你是來「貢獻缺的那塊物理」的合作者,不是來挑錯的。
附帶:這個「binding vs kinetics 的 scoring-axis」在 AI-Protein-Interface dashboard 裡已被登記成一個待裁決的 open decision(D-006/H-011,待 T-011)——你開這話題,是接一個已經在桌上的問題。