【科研成果】北京大學(xué)李志遠(yuǎn)/中科院微生物所尹文兵PLOS COMPUT BIOL|NRPS功能結(jié)構(gòu)域
非核糖體多肽合成酶(Non-ribosomal peptide synthetase,NRPS)這一次級代謝途徑制造了眾多的藥物,包括抗生素青霉素,免疫抑制劑環(huán)孢霉素和治療耐多藥結(jié)核病的抗生素紫霉素等,被認(rèn)為是人類藥物發(fā)現(xiàn)中的寶庫。自NRPS途徑于上世紀(jì)中葉被發(fā)現(xiàn)以來,科學(xué)家們一直致力于實現(xiàn)對其產(chǎn)物的精準(zhǔn)預(yù)測和定向設(shè)計。然而,當(dāng)前對NRPS的重編程仍面臨著產(chǎn)率不高、底物預(yù)測不準(zhǔn)等問題和挑戰(zhàn)。此外,近年來通過實驗發(fā)現(xiàn)了多種NRPS功能域亞型,尤其是縮合功能域(Condensation domain, C domain),但這些功能域的邊界確定及標(biāo)準(zhǔn)化尚缺乏基于序列的生信預(yù)測方法,難以在大數(shù)據(jù)集中進行搜尋。
近年來,微生物測序數(shù)據(jù)迅速增長,為NRPS研究提供了機遇和挑戰(zhàn)。一方面,大量的序列數(shù)據(jù)為深入理解NRPS通路的演化和功能提供了原材料;另一方面,研究者們對NRPS的結(jié)構(gòu)域邊界尚未形成統(tǒng)一的注釋標(biāo)準(zhǔn),這使得不同來源的數(shù)據(jù)難以被整合分析。因此,建立統(tǒng)一的注釋標(biāo)準(zhǔn)以及開發(fā)高效的分析方法是當(dāng)前亟待解決的問題。
2023年5月15日北京大學(xué)前沿交叉學(xué)科研究院定量生物學(xué)中心/生命科學(xué)聯(lián)合中心李志遠(yuǎn)課題組與中國科學(xué)院微生物所真菌學(xué)國家重點實驗室尹文兵課題組在PLOS Computational Biology期刊合作發(fā)表了題為“Knowledge-guided data mining on the standardized architecture of NRPS: subtypes, novel motifs, and sequence entanglements” (DOI: 10.1371/journal.pcbi.1011100) 的研究論文,提出非核糖體多肽合酶(NRPS)中結(jié)構(gòu)域的基序和基序間結(jié)構(gòu)可作為其劃分的標(biāo)準(zhǔn),這種“標(biāo)準(zhǔn)化”能夠系統(tǒng)地評估大量NRPS序列的功能偶聯(lián),從而發(fā)現(xiàn)新的基序,解決了先前的功能域的邊界不清及標(biāo)準(zhǔn)混亂的問題。為NRPS的重編程及相關(guān)藥物工程化設(shè)計提供重要的理論基礎(chǔ)。
作者對16,820個細(xì)菌基因組和2,505個真菌基因組中的NRPS序列進行了系統(tǒng)性分析,利用已知文獻中的保守序列(motif)建立了NRPS的標(biāo)準(zhǔn)化框架。在此注釋標(biāo)準(zhǔn)的幫助下,作者對已知的縮合功能域(Condensation domain, C domain)實現(xiàn)了基于序列特征的預(yù)測,且首次對真菌C domain subtype進行了預(yù)測,并將已知的CT domain按照功能和序列特征細(xì)分成三個亞型(CT, CT-DCL, CT-A)。同時,作者還基于序列保守性鑒定了三個新motif,同時對于其中關(guān)鍵的G-motif的重要性進行了功能驗證。通過定點突變及定向次級代謝產(chǎn)物檢測等手段,在人類病原真菌煙曲霉fmq基因簇中NRPS的G-motif進行功能驗證,結(jié)果顯示G-motif對NRPS的功能有關(guān)鍵作用。此外,作者通過序列統(tǒng)計和分析解釋了NRPS難以被重編程和底物預(yù)測準(zhǔn)確率低的原因。最后,構(gòu)建了用戶友好的在線工具”NRPS motif Finder” (http://www.bdainformatics.org/page?type=NRPSMotifFinder),可以對NRPS進行結(jié)構(gòu)域的邊界進行標(biāo)準(zhǔn)化鑒定和C domain亞型預(yù)測。

圖1. 在細(xì)菌和真菌中的C domain亞型分析和具有代表性的組織結(jié)構(gòu)
團隊建立了迄今為止最全面的C domain演化樹,得以追溯C domain的演化歷史。在16,820個細(xì)菌基因組和2,505個真菌基因組中,團隊分析了C domain的亞型分布,發(fā)現(xiàn)細(xì)菌和真菌中的偏好的C domain亞型完全不同。進一步比較了同種C domain亞型在細(xì)菌和真菌中的序列特征,發(fā)現(xiàn)即便是在同一亞型內(nèi),細(xì)菌和真菌的序列特征也不完全相同。最后,研究者基于全面的分型對基因組中的NRPS組織結(jié)構(gòu)進行了統(tǒng)計,發(fā)現(xiàn)了一些典型的NRPS組織結(jié)構(gòu),其中多數(shù)的產(chǎn)物都是鐵載體。

圖2. 統(tǒng)計耦合分析揭示了NRPS中的共進化序列
研究者通過統(tǒng)計耦合分析發(fā)現(xiàn)NRPS中的共進化序列彼此重疊。這解釋了為何很難對NRPS進行重編程:沒有一個簡單的切點可以將不同共進化區(qū)域分隔開?,F(xiàn)在使用的切點都只覆蓋了部分共進化區(qū)域。

圖3. 決定底物的特異性序列與催化口袋中的5個結(jié)構(gòu)可變區(qū)的長度有關(guān)
基于標(biāo)準(zhǔn)化NRPS框架,研究者用統(tǒng)計耦合分析了NRPS中決定底物的特異性序列,發(fā)現(xiàn)一些底物特異性位點位于結(jié)構(gòu)可變區(qū)(loop)。對這些可變區(qū)的長度進行聚類發(fā)現(xiàn)對于相同的底物,屬于不同長度組別的底物特異性位點序列不同。這表明底物不只由底物特異性位點所決定,解釋了部分底物的預(yù)測準(zhǔn)確率低的原因。
北京大學(xué)前沿交叉學(xué)科研究院定量生物學(xué)中心2020級博士生賀若霖為該論文第一作者。中國科學(xué)院微生物所博士研究生張金玉為第二作者。北京大學(xué)前沿交叉學(xué)科研究院定量生物學(xué)中心/生命科學(xué)聯(lián)合中心李志遠(yuǎn)研究員和中國科學(xué)院微生物所尹文兵研究員為論文的共同通訊作者。北京大學(xué)前沿交叉學(xué)科研究院定量生物學(xué)中心/生命科學(xué)聯(lián)合中心顧少華博士后、宋晨研究員和錢瓏助理研究員對本工作有重要貢獻。北京大學(xué)前沿交叉學(xué)科研究院生命科學(xué)聯(lián)合中心2019級博士生邵遠(yuǎn)哲參與了該工作。
這項工作得到了科技部重點研發(fā)計劃、國家自然科學(xué)基金、國家博士后創(chuàng)新人才支持計劃、北京大學(xué)臨床醫(yī)學(xué)+X青年專項、中央高校基本科研業(yè)務(wù)費專項、中國科學(xué)院生物資源計劃和中國科學(xué)院前沿科學(xué)重點研究計劃的資助。

| 版權(quán)聲明: 1.依據(jù)《服務(wù)條款》,本網(wǎng)頁發(fā)布的原創(chuàng)作品,版權(quán)歸發(fā)布者(即注冊用戶)所有;本網(wǎng)頁發(fā)布的轉(zhuǎn)載作品,由發(fā)布者按照互聯(lián)網(wǎng)精神進行分享,遵守相關(guān)法律法規(guī),無商業(yè)獲利行為,無版權(quán)糾紛。 2.本網(wǎng)頁是第三方信息存儲空間,阿酷公司是網(wǎng)絡(luò)服務(wù)提供者,服務(wù)對象為注冊用戶。該項服務(wù)免費,阿酷公司不向注冊用戶收取任何費用。 名稱:阿酷(北京)科技發(fā)展有限公司 聯(lián)系人:李女士,QQ468780427 網(wǎng)絡(luò)地址:www.arkoo.com 3.本網(wǎng)頁參與各方的所有行為,完全遵守《信息網(wǎng)絡(luò)傳播權(quán)保護條例》。如有侵權(quán)行為,請權(quán)利人通知阿酷公司,阿酷公司將根據(jù)本條例第二十二條規(guī)定刪除侵權(quán)作品。 |
m.quanpro.cn