秋日午后,学术氛围正浓。西南石大计算机与软件学院“梦溪湖论坛”秋季第三讲,10月15日14:30在明理楼B306举行。本次讲座特邀温柳英副教授担任主讲,以“多样性促进与分布保持的集成方法与应用(DPDE)”为题,为在场师生深入剖析了面向不平衡微生物组学数据的机器学习前沿进展。
讲座伊始,温教授直指核心问题,从微生物组学数据在疾病诊断中的应用价值切入,深刻剖析了其固有的“高维特性”与“类别极端不平衡”两大挑战。她指出,这些结构性难题易导致诊断模型严重偏向多数类健康样本,而使关键的患病样本难以被准确识别,从而清晰地引出了发展新一代高效、鲁棒集成学习方法的必要性与紧迫性。
那么,如何系统性地破解上述难题呢?围绕DPDE这一创新集成框架,温柳教授展开了条分缕析的讲解。她重点介绍了三大核心机制:首先是“边界-分布欠采样(DBU)”技术,它能通过综合考量边界邻近性、分布中心性并融入惩罚机制,智能构建出保持原始数据结构的关键训练子集;其次是“自适应基模型构建(IBMC)”技术,其可根据数据集的不平衡程度动态选择最优基分类器,确保模型质量与多样性;最后是“动态剪枝-加权(DPW)”技术,通过多样性与相似性平衡策略,为每个测试样本定制集成方案,从而实现精准的个性化诊断。
理论模型的优越性,终须经由严谨的实验来验证。 在实证分析环节,温柳教授通过丰富的可视化图表、统计假设检验及时间复杂度分析,全面展示了DPDE的卓越性能。结果表明,该框架在分布保持、模型多样性及召回率、AUC等关键指标上均显著优于主流算法,其优越性具有高度统计显著性,同时在计算效率与分类性能间取得了良好平衡,证明了其在实际应用中的巨大潜力。
讲座在热烈的互动氛围中步入尾声。在场师生意犹未尽,就各模块的消融实验贡献、IBMC中模型选择阈值的确定依据等关键细节踊跃提问。温柳教授结合自身扎实的研究实践与实证数据,给予了细致而深入的解答。本次讲座不仅深化了师生对集成学习前沿的理解,更展现了学科交叉融合的独特魅力,取得了圆满成功。
