报告题目:用宏基因组数据预测表型的统计和计算研究
报 告 人:王蓓蓓
报告摘要:基于微生物组测序数据的机器学习模型已广泛应用于癌症和传染病等一系列精准医疗应用的预测,并显示出促进临床和预防决策的巨大潜力。为了充分发挥这种潜力,关键是要开发能够在独立数据集上泛化并转移到临床应用的预测算法。然而,微生物组数据的异质性使得模型的可重复性和泛化能力受到挑战。 标准化方法是解决微生物组数据中存在的异质性和偏差问题的重要工具,但其在表型预测中的作用尚未得到充分的研究。我们系统性地回顾了22种不同的标准化方法,并开发了一个综合性工作流程,通过模拟和真实数据探索了数据集之间的异质性对于跨数据集表型预测的影响,并比较了不同标准化方法在宏基因组数据跨数据集表型预测中的表现。根据我们的结果,建议在宏基因组数据跨数据集表型预测中使用BMC和Limma标准化数据。
报告人简介:王蓓蓓,山东大学博士,国家公派到南加州大学联合培养。从事生物统计研究,在《Scientific Reports》、《Frontiers in Genetics》、《Alimentary pharmacology & therapeutics》、《Physiological Reports》、《Gut Microbiome》等杂志发表学术论文。
报告时间: 2024年9月26日星期四14:30-15:30
报告地点: 一号教学楼B306
报告邀请人:院长
主办单位:188bet 初回入金ボーナス
撰稿:陈凤芹
初审:刘春晗
终审:院 长