近日,球速体育偏向东研究组等在Briefings in Bioinformatics宣布题为Platform-independent approach for cancer detection from gene expression profiles of peripheral blood cells的研究论文,通过正常女性和乳腺癌病人外周血全细胞转录组比较,发明特定基因间的相对表达量巨细可以区分正凡人和乳腺癌病人,并发明相应基因在预测乳腺癌病人预后中的作用。这是首次通过大规模人群的外周血转录组数据来区分正凡人和乳腺癌患者,相关算法模型已获批国家发明专利。
肿瘤是系统性疾病,在肿瘤爆发生长历程中,除病灶位置外,外周血中多种细胞的表达量也爆发变革,这使得我们有时机通过外周血在分子条理实现对肿瘤的追踪。研究人员整合公共数据库中上千例正常和乳腺癌个体外周血转录组数据,通过立异性的秩归一化方法屏蔽差别转录组检测平台、差别批次之间的噪音,并通过人工智能要领实现高维数据特征筛选和模型构建。在模型验证历程中,研究人员发明模型具有良好的泛化能力,在RNA-seq、差别芯片平台以及差别人种之间都取得了很好的预测效果。
该研究揭示了外周血转录组在肿瘤早筛中的作用。过往研究发明血小板转录组在预测肿瘤中的作用,但限于标准化要领不统一、数据集小等原因,取得的模型很难扩展到独立的数据集中,血小板转录组也受到除肿瘤之外其他因素的影响。该研究一方面整合外周血全细胞转录组,最洪流平地降低了简单细胞类型受特定情况影响所导致的非特异性变革,另一方面基于秩序的标准化要领使差别来源的数据可以统一比较,大幅提升了可整合的数据量和肿瘤分类效果。
近年来乳腺癌发病低龄化趋势明显,为提高乳腺癌早期发明率并延永生存时间,外周血循环肿瘤细胞相关检测是研究热点,以循环肿瘤细胞(CTC) 为研究工具的一系列研究, 不但能够对肿瘤患者的病情生长进行实时、动态监测, 更是了解肿瘤细胞内部致病分子机制的窗口, 从而为精准预防、精准治疗提供可能。目前相关研究已与解放军总医院等多个医学研究中心展开进一步相助,并已入组凌驾2000例正常女性、差别时期乳腺癌患者和高危人群,希望通过进一步的前瞻性研究提高分类效果,实现乳腺癌的早期诊断,减轻家庭和社会担负。
该研究获得了国家重点研发计划精准医学专项、863计划等基金资助。
数据标准化、特征筛选及模型构建
论文链接