全球首個草藥基因編碼天然多樣性成分庫(GNDC)發布

人民網成都4月17日電 (記者劉海天)4月17日上午,全球首個億量級草藥基因編碼天然多樣性成分庫(Gene-encoded Natural Diverse Components Repository, GNDC)在四川省成都市舉行的第三屆“千種本草基因組計劃”會議上發布。
全球首個億量級草藥基因編碼天然多樣性成分庫發布儀式。人民網記者 劉海天攝
據悉,GNDC基于全球八大權威藥典收錄的1037個藥用物種的核基因組、細胞器基因組等多維數據,通過自主開發的基因組遍歷算法結合轉錄組、小RNA測序、肽質譜等多組學技術實現了對天然多樣性成分的挖掘與驗證,并創新性整合自然語言處理、對抗生成網絡、圖卷積網絡等人工智能算法實現成分的識別、分類與功能注釋。GNDC收錄了超過2.34億個基因直接或間接編碼的天然多樣性成分,包括232萬個次生代謝產物、22977萬條多肽、238萬個小RNA和26萬個碳水化合物。GNDC實現了基因組信息、成分信息與功能信息的整合,彌補了現有天然產物數據庫在數據類型與功能解析方面的不足。作為目前全球規模最大的藥用天然成分庫,GNDC將為藥物發現提供廣闊的“化學空間”,加速“大數據驅動”模式下的藥物發現進程。
中醫藥人工智能聯合實驗室揭牌儀式。人民網記者 劉海天攝
據介紹,GNDC由成都中醫藥大學本草基因組學團隊聯合現代中醫藥海河實驗室、中國醫學科學院藥用植物研究所、東北林業大學、湖北時珍實驗室等單位共同完成。
項目總負責人中國工程院院士、成都中醫藥大學首席教授陳士林指出:“GNDC實現了基因組數據與人工智能算法的深度融合,標志著天然成分研究進入智能化和精準化的新階段。通過創新性整合多組學技術與人工智能方法,GNDC在天然多樣性成分的識別、分類與功能注釋方面展現出了突破性優勢,將成為驅動天然藥物研發范式變革、加速中藥現代化進程的核心技術支撐。”
分享讓更多人看到