近日,國家煙草基因研究中心作為第一單位完成的研究論文“PCMDB: a curated and comprehensive resource of plant cell markers”(第一作者:基因中心金靜靜、盧鵬;通訊作者:基因中心曹培健)在國際生物學權威期刊《Nucleic Acids Research》(中科院分區1區Top期刊,影響因子16.97)在線發表。這是基因中心生物信息學學術論文影響因子繼2020年首次突破10分后的又一全新跨越,再次創下行業作為第一單位發表論文影響因子的最高水平。
單細胞轉錄組測序技術的蓬勃發展,推動生物學研究進入單細胞水平。單細胞測序數據分析的關鍵一步是利用細胞標記基因對細胞類型進行注釋,但目前植物細胞標記基因分散在大量研究文獻中,在一定程度上限制了了其在植物單細胞轉錄組分析中的應用。
為創造性地開發一套科學系統、精準實用的植物細胞標記數據庫,基因中心基于三個數據來源(實驗驗證、基于單細胞測序數據、基于高通量轉錄組數據),針對約13萬篇文獻開展了大數據分析和人工注釋,挖掘了煙草、擬南芥、水稻、玉米、大豆、番茄等6個模式植物的81117個植物細胞標記基因,覆蓋了22個組織的263種細胞類型?;蛑行淖灾鏖_發的PCMDB數據庫可實現植物細胞標記基因位置、序列、表達等信息的多維度查詢和可視化顯示。5個搜索引擎以及eFP Browser、Bar、t-SNE、U-MAP等展示分析工具,為數據庫提供了強大的數據分析能力。針對用戶自有單細胞測序數據,PCMDB部署了SCSA和SignleR分析工具,可實現在線細胞類型鑒定。此外,針對目前數據庫尚未覆蓋的其他67種植物,PCMDB提供了基于序列相似性鑒定的候選細胞標記基因。作為一站式數據庫,PCMDB將為植物單細胞測序研究提供精準、全面的大數據分析平臺支撐。
PCMDB數據庫分析和展示工具
近年來,基因中心扎實落實鄭州煙草研究院要求,積極謀劃布局,產出了一批具有較高學術水平的科研成果。今年以來,作為第一單位,基因中心已發表影響因子在10分以上的論文2篇。
篤行致遠 2024中國煙草行業發展觀察