Nat.Struct.Mol.Biol.|Cas12f直系同源物的比較表徵揭示了提升基因組編輯效率的核心機制特徵

大家好,今天推送的文章是2026年4月發表在Nature Structural & Molecular Biology上的“Comparative characterization of Cas12f orthologs reveals mechanistic features underlying enhanced genome editing efficiency”

微型CRISPR–Cas12f核酸酶因其體積小巧且可適配腺相關病毒(AAV)遞送,成為治療性基因組編輯的理想候選工具。然而,這類核酸酶在哺乳動物細胞中的編輯效率低於大型CRISPR系統。Cas12f廣泛的系統發育多樣性提示其存在尚未被探索的機制差異,具備優化潛力。本研究通過宏基因組學鑒定並表徵了一種天然存在的Cas12f直系同源物——別樣桿菌屬Cas12f(Al3Cas12f),該核酸酶可在人類細胞中實現高效的基因組編輯。作者通過結構、生化與動力學分析,將Al3Cas12f與兩種新近報道的直系同源物(顫桿菌屬Cas12f、發酵瘤胃梭菌Cas12f)進行對比。這些同源物在間隔序列鄰近基序(PAM)識別、嚮導RNA(gRNA)結合、二聚化以及DNA切割的調控機制與結構特徵上存在顯著差異。值得注意的是,Al3Cas12f憑藉穩定的二聚體界面與天然優化的嚮導RNA,可高效形成R環。基於上述結構發現,作者構建了工程化改造的Al3Cas12f變體(RKK),該變體提升了編輯效率,並在多個測試基因組位點均表現出更優的活性。這款工程化緊湊型編輯工具克服了位點依賴性差異與明顯的活性閾值限制,拓展了低劑量、可通過AAV遞送的治療性基因組編輯的可行性。本研究闡明了決定Cas12f活性的分子機制,並為構建具有治療潛力的緊湊型基因組編輯工具提供了理論框架。

Al3Cas12f是一種高活性CRISPR–Cas核酸酶

為探索V型核酸酶的多樣性,作者從多樣化環境中挖掘了一個大型高質量組裝的微生物宏基因組數據庫,在CRISPR陣列附近發現了數千個編碼小型核酸酶的基因。儘管這些核酸酶具有差異性,但在典型V型核酸酶的系統發育樹中,其中一些核酸酶與其他Cas12f核酸酶具有相關性(圖1a)。新鑒定的代表性序列Cas12f-MG119-1、Cas12f-MG119-2、Cas12f-MG119-3與Al3Cas12f和參考序列的平均氨基酸序列一致性為28%–52%,長度在433至488個氨基酸之間(圖1a)。通過檢查編碼核酸酶基因的基因組區域,作者鑒定出了相應的CRISPRRNA(crRNA)和反式激活crRNA(tracrRNA)。實驗證實,Cas12f-MG119代表性序列需要較大的嚮導RNA(gRNA,129–156核苷酸)。作者通過8NPAM文庫的體外切割實驗確定,這些系統識別富含T的PAM序列,並在距離5’PAM序列20、22、23核苷酸處切割靶鏈(TS),在11、13核苷酸處切割非靶鏈(NTS)(圖1b)。純化蛋白的體積排阻色譜(SEC)結果顯示,即使在不存在任何gRNA的情況下,Al3Cas12f也以強制性二聚體形式存在。

接下來作者研究了Al3Cas12f在人類細胞中的活性。針對ALB基因內含子1、APOA1基因外顯子3以及PPP1R12C內含子1中AAVS1位點的gRNA篩選結果顯示,在AAVS1和APOA1位點中,有27個靶位點的編輯效率>10%,19個位點>50%,10個位點>90%(以新一代擴增子測序讀數中包含插入或缺失(indel)的百分比評估;圖1c)。除了在多個基因位點篩選Al3Cas12f外,作者還測試了不同的間隔序列長度以優化Al3Cas12f的切割活性。結果顯示,19核苷酸的間隔序列長度在多個位點表現最佳,AAVS1-F1gRNA在19–21核苷酸間隔序列下的編輯效率相近。綜上,這些結果表明Al3Cas12f在天然狀態下具有高活性。為進一步驗證在哺乳動物細胞中觀察到的高活性水平,作者比較了Al3Cas12f與其他CRISPR–Cas直系同源物的活性。在8個基因位點中的6個位點,Al3Cas12f的活性優於OsCas12f,並且在兩個位點(NLRC4和NUDT16)的活性顯著高於LbCas12a(圖1d、e)。這些結果表明,該核酸酶是相對於其他Cas12f系統進行結構和生化表徵的有價值候選物。

Nat.Struct.Mol.Biol.|Cas12f直系同源物的比較表徵揭示了提升基因組編輯效率的核心機制特徵 -

圖 1

Al3Cas12f、OsCas12f和RhCas12f三元複合物的冷凍電鏡結構揭示了二聚體界面的差異

為理解Al3Cas12f相對於其他直系同源物活性增強的結構基礎,作者首先解析了該酶結合其靶向55鹼基對靶雙鏈DNA的gRNA的冷凍電鏡結構。Al3Cas12f結構呈現切割後狀態的不對稱同源二聚體。該二聚體通過其識別(REC)結構域內的多個相互作用,以及與gRNA支架和R環的直接鹼基堆積作用錨定。與此前解析的Cas12f結構一致,該模型呈現雙葉型三元核糖核蛋白(RNP)複合物,識別葉包含REC和楔形(WED)結構域,核酸酶葉包含RuvC和鋅指(ZF)結構域(圖2a,表1)。該酶的結構與諾維氏梭菌Cas12f(CnCas12f)最為相似,其REC結構域包含大的延伸α-螺旋。但這些酶的結構之間存在顯著差異。Al3Cas12f的REC結構域直接接觸其gRNA的莖2,而CnCas12f的莖2更短。作者的結構包含完全形成的R環,兩個RuvC結構域均已對接,而CnCas12f中觀察到的預切割複合物僅形成部分R環。由於這些差異,作者試圖更深入地理解Cas12f重排隨R環形成的機制。

由於已解析的Cas12f結構有限,作者旨在對幾種已知具有高基因組編輯活性的直系同源物進行更全面的比較。近期一項研究強調了OsCas12f和RhCas12f作為潛在基因組編輯工具的應用。因此,作者認為解析OsCas12f和RhCas12f結合各自gRNA和靶DNA的結構,可能為Cas12f核酸酶的作用機制提供更多見解(圖2b、c,表1)。儘管所有結構均顯示雙葉型不對稱同源二聚體和完全形成的20鹼基對R環,但RhCas12f和OsCas12f的REC結構域明顯小於Al3Cas12f(圖2b、c)。此外,只有Al3Cas12f和OsCas12f具有可解析的、與R環連接的RuvC結構域,而RhCas12f的兩個RuvC結構域均無法解析(圖2c)。這些觀察結果表明,Cas12f核酸酶的二聚化界面差異很大,且RuvC結構域可呈現多種構象狀態,在不同Cas12f直系同源物中表現出不同程度的結構可塑性。

Nat.Struct.Mol.Biol.|Cas12f直系同源物的比較表徵揭示了提升基因組編輯效率的核心機制特徵 -

圖 2

Cas12fgRNA呈現結構和功能多樣性

Cas12f三元複合物顯示出這些核酸酶的同源gRNA之間顯著的結構多樣性。OsCas12f和RhCas12f的gRNA支架具有保守的L型結構(圖3a、b),與AsCas12f相似。但它們的gRNA比AsCas12f短得多,僅包含四個莖環,而此前報道的AsCas12f包含五個。

RhCas12f和OsCas12f的gRNA長莖2與莖3、莖4幾乎垂直。儘管OsCas12f的該區域解析度不佳,但RhCas12fgRNA的莖2呈現90°彎折,與Cas12f單體2形成額外的穩定接觸,使其在作者的結構中具有高解析度(圖3b)。該區域對接至REC和WED結構域形成的溝槽中,並與單體2的PAM相互作用殘基接觸。值得注意的是,gRNA的該區域與PAM序列相同,且被單體1中參與PAM結合的相同殘基識別。具體而言,R117和R119分別與G49和G50相互作用,D77與C57形成氫鍵(圖3c)。這些發現表明,每個RhCas12f單體中的相同殘基分別介導PAM和gRNA的雙重識別,並防止錯誤單體發生非生產性PAM結合。

為檢驗莖2的遠端是否為Cas12f活性所必需,作者在OsCas12f(缺失40–58核苷酸)和RhCas12f(缺失50–60核苷酸)的gRNA中刪除該區域,並通過質粒干擾實驗評估其活性。刪除莖2的柔性區域不影響OsCas12f活性。相比之下,RhCas12f活性顯著降低(圖3d),表明Cas12f單體2與gRNA莖2的相互作用對RhCas12f活性至關重要。因此,對Cas12fgRNA的莖2進行改造,可作為防止這些酶形成非生產性構象的策略。

相對於OsCas12f和RhCas12f,Al3Cas12fgRNA採用更緊湊的結構。Al3Cas12fgRNA不含莖4區域,其莖2呈現彎折構象,使莖2能夠對接至蛋白質的REC葉(圖3b)。由於作者的結構顯示OsCas12f和RhCas12f中的莖4不與蛋白質形成直接接觸,作者推測刪除該區域可提高這些酶的效率。事實上,刪除OsCas12f的莖4區域(缺失106–125核苷酸)使質粒干擾活性提升十倍(圖3d)。作者得出結論,Al3Cas12f包含天然優化的gRNA支架,這也支持此前的發現,即刪除Cas12f核酸酶的莖4同樣可增強核酸酶活性。總體而言,作者的結果為Cas12f核酸酶的gRNA構型和優化提供了新的機制與結構見解。

Nat.Struct.Mol.Biol.|Cas12f直系同源物的比較表徵揭示了提升基因組編輯效率的核心機制特徵 -

圖 3

Cas12f二聚化界面的差異解釋了Al3Cas12f的增強活性

Cas12f通過兩個單體的REC結構域之間的相互作用形成二聚體。OsCas12f和RhCas12f主要通過兩層相互作用形成二聚體;頂層涉及REC結構域的第一個α-螺旋(α1),底層由α1下方的兩個環形成(圖4a–f)。相比之下,Al3Cas12f的二聚化界面比OsCas12f和RhCas12f更複雜(圖4g–k)。Al3Cas12f的REC結構域更大,包含額外的50–60個殘基,形成兩個α-螺旋(α2和α3)。REC單體1和REC單體2中的這些延伸螺旋分別與非靶鏈DNA和gRNA的莖2髮夾相互作用。這些REC結構域與非靶DNA和gRNA的相互作用在其他Cas12f核酸酶中未被觀察到,可能增強複合物的穩定性。

Al3Cas12f的REC單體2中含有一個α1螺旋(α1.2),向REC單體1彎曲,而REC單體1的α1螺旋(α1.1)基本保持線性(圖4g)。α1.2向α1.1的彎曲使α1.1對接至α1.2螺旋,該過程由多個π-π堆積作用輔助。這種獨特的二聚化機制類似於榫卯模型,卯是接收部分的凹形槽(α1.2),榫是嵌入卯的突出結構(α1.1)(圖4g)。此外,Al3Cas12f在REC結構域螺旋旁還含有另外兩個榫卯連接(圖4h、k)。

Al3Cas12f界面的穩定性由芳香族殘基之間的π-π堆積作用和非極性氨基酸之間的范德華力共同介導(圖4j)。此外,氫鍵和鹽橋相互作用在二聚體穩定中發揮重要作用(圖4h、i、k)。

為驗證這些觀察結果,作者對參與穩定二聚化界面或直接接觸gRNA或R環的殘基進行丙氨酸替換。這些替換顯著降低了Al3Cas12f在大腸桿菌中的活性(圖4l)。為進一步評估這些替換的影響,作者使用質量光度法檢測它們如何影響脫輔基Cas12f二聚體的穩定性。作者的結果顯示,破壞二聚體界面會顯著損害二聚體穩定性。隨後作者使用共價連接的二聚體,評估單個氨基酸改變如何影響Al3Cas12f的GFP耗竭活性。值得注意的是,破壞二聚體界面關鍵接觸的F112A、R63A、Y60A和R49A替換,導致GFP耗竭活性相較於野生型顯著降低。同時,單體1中破壞與非靶鏈重要相互作用的F102A替換,相較於野生型,GFP耗竭活性顯著降低。相比之下,單體2中破壞與gRNA相互作用的相同替換,僅導致活性輕微降低。

Nat.Struct.Mol.Biol.|Cas12f直系同源物的比較表徵揭示了提升基因組編輯效率的核心機制特徵 -

圖 4

為評估Al3Cas12f的REC結構域延伸是譜系特異性還是廣泛保守的,作者使用代表性進化枝生成了Cas12f特異性多序列比對(MSA)和系統發育樹。比對結果顯示,Al3Cas12f進化枝具有獨特的保守區域,而其他進化枝在REC結構域長度上表現出顯著的變異性和差異,提示存在譜系特異性特徵。由於序列比較可能遺漏結構保守性,作者將代表性結構與Al3Cas12f冷凍電鏡模型比對,結果顯示Al3Cas12f進化枝內部REC結構域結構高度相似,但與其他進化枝存在差異。總體而言,決定性差異在於存在延伸的α2和α3螺旋,可結合非靶鏈和gRNA,支持這些REC結構域特徵是Al3Cas12f譜系獨有的適應性改變。綜上,這些發現證明Al3Cas12f具有獨特的結構特徵,有助於增強核酸酶活性。

Cas12f中間結構揭示了不同Cas12f變體的差異化激活機制

為進一步研究Cas12f激活的分子機制,作者分析了結構數據集中的異質性。儘管RhCas12f數據集在所選顆粒間呈現高結構同質性,但OsCas12f和Al3Cas12f均解析出多種構象狀態。

作者解析了OsCas12f在R環形成和構象變化的三種不同結構(圖5a–c)。狀態I呈現8鹼基對R環,RuvC單體2無法解析,表明該結構域可呈現多種構象狀態,與此前在CnCas12f中的觀察一致(圖5a)。狀態II顯示,R環完全形成前,RuvC單體2結構域對接至gRNA間隔區,使作者能夠在8鹼基對異源雙鏈旁模擬出另外6個核苷酸的gRNA間隔區,而RuvC單體2僅部分解析(圖5b)。狀態III的結構顯示完全形成的20鹼基對R環,RuvC單體2結構域部分解析(圖5c)。Al3Cas12f呈現兩種不同的中間體,均具有完全形成的20鹼基對R環:RuvC單體2對接前的產物前狀態(狀態I)和RuvC單體2結構域完全對接至間隔區PAM遠端的產物後狀態(狀態II)。

儘管作者證明OsCas12f中的RuvC單體1結構域具有核酸酶活性並切割兩條鏈,但作者的結構顯示RuvC單體2發生顯著的結構重排,最終對接並穩定R環的PAM遠端區域。這使得OsCas12f在狀態II中形成完整R環。相反,Al3Cas12f可在RuvC單體2對接前形成完整R環。OsCas12f和Al3Cas12f之間RuvC對接順序的差異,表明這些核酸酶之間存在可能影響切割效率的機制差異。

為理解這些中間結構的重要性,作者分析了OsCas12f和Al3Cas12f中的RuvC蓋子。OsCas12f的狀態I和狀態II(形成8鹼基對R環)中RuvC蓋子呈“閉合”構象(圖5d)。該環區連接RuvC結構域的第四個β-鏈(β4)和第三個α-螺旋(α3),阻斷核酸進入催化活性位點,因此是雙鏈DNA順式切割的關鍵調控因子。已有研究表明,靶標結合後,該蓋子發生重排,使DNA靶鏈能夠進入活性位點。OsCas12f中完全形成的R環結構顯示RuvC單體1蓋子呈“開放”構象,表明該環僅在R環完全形成後開放。與Un1Cas12f中形成螺旋的情況不同,OsCas12f狀態III結構中蓋子的中間區域具有柔性且未建模(D335–L342)。作者通過將E334–R343替換為丙氨酸,證明該蓋子對切割至關重要,該替換阻止蓋子發生切割所需的重排,導致OsCas12f在GFP耗竭實驗中的活性顯著降低(圖5e)。除RuvC環外,作者還發現OsCas12f中的W345將DNA定位在RuvC結構域的活性位點,與UnCas12f中的觀察結果相似。W345A替換顯著阻礙其在大腸桿菌中的活性,表明該殘基對OsCas12f活性至關重要(圖5d、e)。此外,作者還觀察到一個更小的環區(殘基229–235,記為蓋子2)發生類似的構象變化。殘基229–231的丙氨酸替換完全消除OsCas12f活性,表明其在核酸酶活性中具有必需作用(圖5d、e)。

Nat.Struct.Mol.Biol.|Cas12f直系同源物的比較表徵揭示了提升基因組編輯效率的核心機制特徵 -

圖 5

與OsCas12f相反,Al3Cas12f的兩種結構均顯示蓋子呈開放構象,表明Al3Cas12f可在RuvC單體2對接前採用切割活性構象。總體而言,作者的結構揭示,對於OsCas12f,RuvC單體2對接是完整R環形成所必需的,而Al3Cas12f則不需要。如前所述,作者的結果表明Cas12f核酸酶具有不同的切割機制,受RuvC重排調控。

Cas12f變體的動力學分析

為進一步研究這些Cas12f變體之間的功能差異,作者使用體外切割實驗和停流熒光測量R環形成,進行詳細的動力學分析。首先,作者將嚮導核糖核蛋白複合物與熒光標記的DNA混合啟動反應,測量靶鏈和非靶鏈的切割。儘管所有酶的切割速率均慢於釀膿鏈球菌Cas9(SpCas9),但不同Cas12f變體的切割速率差異很大。Al3Cas12f的切割速率最快,靶鏈和非靶鏈切割均完全進行,數據近似單指數函數。OsCas12f和RhCas12f均呈現高度雙相行為,切割幅度相對較低,隨後緩慢線性趨近完全。RhCas12f的這種現象最為顯著,導致無法通過基於方程的擬合簡單解讀結果。

接下來,作者使用此前為SpCas9開發的停流熒光實驗測量R環形成。每個變體的數據均呈現雙相行為,表明其模型比簡單的DNA結合後R環形成更複雜。

為在統一模型框架下解析兩組實驗的複雜性,作者使用KinTekExplorer模擬軟件對每個變體的數據進行全局擬合。作者將每個實驗的起始濃度和輸出觀測值輸入軟件,以測試多種Cas12f催化模型。相對於此前發表的SpCas9模型,作者的模型針對這些變體增加了獨特特徵,以解釋數據的複雜性。除可從酶–DNA(ED)狀態進入的生產性完全形成R環狀態(EDR)外,作者還添加了R環形成前的非生產性狀態(EDx),以解釋R環形成速率的雙相性。作者在Cas9d中也觀察到類似狀態,該狀態是解釋R環形成雙相數據所必需的。三種變體的數據顯示,正向速率常數(0.05–4.5s⁻¹)和逆向速率常數(0.001–2.14s⁻¹)範圍廣泛。特別是RhCas12f退出該狀態的速度非常慢,導致靶鏈切割動力學的第二階段緩慢。作者納入了非靶鏈切割後的非生產性狀態(XDP1),該狀態可從切割後的非靶鏈狀態(EDP1)進入。這是解釋OsCas12f和RhCas12f高度雙相切割數據所必需的。儘管該步驟是擬合數據所必需的,但只能獲得該步驟的平衡常數,因為該狀態的形成和衰減速率必須快於後續切割步驟才能正確擬合數據(>0.2s⁻¹)。作者的OsCas12f中間結構顯示,該酶需要RuvC對接才能完成R環形成。因此,該EDx狀態可歸因於RuvC對接前部分形成的R環。

通過該分析,作者還可以通過對R環形成狀態(EDH)的通量分析,量化每種酶優先切割靶鏈還是非靶鏈。對於Al3Cas12f和OsCas12f,分別有65%和70%的完全形成R環狀態優先切割非靶鏈。對於RhCas12f,約45%優先切割非靶鏈,基本不表現出優先切割哪條鏈的特性。這類酶的獨特特徵,即單一活性核酸酶結構域,可能解釋了這些新的動力學觀察結果。從結構上看,RhCas12f中的RuvC單體1結構域高度柔性,表明其可更自由地重排以切割兩條鏈,而對其中一條鏈無明顯特異性。在此前的研究中,作者進行了鎂離子啟動的切割實驗,將酶、gRNA和DNA在無鎂離子條件下預孵育,然後加入鎂離子啟動反應。對於這些酶,測得的切割速率慢於R環形成速率,表明切割步驟僅部分受R環形成速率限制;因此,作者無需鎂離子啟動切割實驗即可提取所有速率常數。

全局數據擬合還解析了每種變體的R環形成速率。R環形成正向速率範圍為RhCas12f的0.04s⁻¹到OsCas12f的0.64s⁻¹,逆向速率範圍為Al3Cas12f和RhCas12f的0.08s⁻¹到OsCas12f的0.49s⁻¹。更重要的是,R環形成的平衡常數範圍為RhCas12f的0.5到Al3Cas12f的2。野生型SpCas9的R環形成平衡常數測得為2,表明這些Cas12f變體的R環形成可逆性更高或與SpCas9相似。

這些變體的更高效率和保真度可通過體外動力學解釋。可逆的R環步驟結合較慢的切割速率,反映了高保真SpCas9變體的普遍規律。也就是說,在切割緩慢且R環形成可逆的情況下,脫靶DNA有機會在切割前解離。Al3Cas12f切割靶標的效率最高,因為它不會像其他兩種變體那樣陷入EDx或XDP1狀態,這可能是因為基於作者的結構研究,其在RuvC單體2對接前就已形成完整R環。

結構指導的Al3Cas12f改造提高編輯效率

儘管AAVS1位點的編輯效率達到飽和水平,但野生型Al3Cas12f在其他位點的編輯效率<61%(例如SOD1)。為提高Al3Cas12f的活性,作者基於冷凍電鏡結構結合系統發育序列分析設計酶變體,以確定功能保守殘基。該方法聚焦於增加與DNA底物和/或gRNA形成氫鍵距離內殘基的正電荷。大多數這些殘基位於WED結構域。由於Al3Cas12f以不對稱同源二聚體形式存在,作者特別注意確保預期突變不會破壞:(1)兩個原聚體二聚化的關鍵殘基;(2)結合所需的關鍵蛋白質–核酸相互作用。

作者首先測試單替換突變並評估這些變體的編輯效率。作者選擇了6個編輯效率超過60%的單替換變體,用於構建組合突變。作者在K562細胞中測試了35個雙替換和三替換變體,靶向一個AAVS1位點和SOD1位點,以及一個包含6個替換的六突變體(圖6a)。總體而言,35個組合突變體中有21個在SOD1位點的A9gRNA編輯效率至少達到75%,使用的劑量為此前間隔序列長度實驗的四分之一,即125ngmRNA和50pmolgRNA(圖6b)。只有六突變體的編輯效率水平(~10%)低於野生型(~40%)。從該實驗中,K79R;M190K;E222K變體(編號53)被選為主要的Al3Cas12f變體,以下稱為Al3Cas12fRKK(圖6a、b)。此外,約一半的蛋白質變體在AAVS1位點的編輯效率至少達到90%。作者使用此前用於AsCas12f的8個參考嚮導,將Al3Cas12fRKK與野生型酶進行基準測試。其中6個嚮導的插入缺失率>80%,在EMC6位點的活性最高提升26倍(圖6c)。總體而言,這些結果表明Al3Cas12fRKK是一種高效且緊湊的核酸酶,可進一步優化用於基因組編輯。

Nat.Struct.Mol.Biol.|Cas12f直系同源物的比較表徵揭示了提升基因組編輯效率的核心機制特徵 -

圖 6

分享你的喜愛