9月10日下午两点,西南石油大学计算机与软件学院“梦溪湖论坛”系列讲座秋季第一讲在明理楼B306教室举行。本次讲座由理学院吴彦学博士进行主讲。讲座以“泛化主动分层抽样方法理论及应用”为主题,吴博士系统地阐述了当前研究的背景、核心创新与实践价值。
传统主动学习方法普遍依赖 IID 假设,即假设训练数据从总体中独立同分布采样得到,但在现实场景中,数据往往呈现出非IID特性——医疗领域罕见疾病检测中阳性样本极少导致类别不平衡、股票价格预测中相邻时序数据高度相关、跨医院联合诊断时多源数据分布差异显著等问题,均会导致模型泛化性能难以保证,成为制约人工智能技术落地的关键瓶颈。
针对上述问题的探索面临诸多挑战,经过持续实验与研究,吴博士最终提出了一种新方法——泛化主动分层抽样(GASS),成功解决了这些问题。该方法从统计分层抽样视角改进主动抽样过程,使抽样分布随迭代查询逐步逼近总体,从而降低模型的学习偏差。在方法论上,GASS 提出了逐类样本数迭代查询策略,并证明了其最优性;在理论上,分析了其在统计矩、抽样分布渐进性及泛化误差界等方面的优势。研究进一步展示了三个相关成果:层次分类视角下的 GASS、联合自监督学习视角下的 GASS,以及基于重整化群结构复杂度的 GASS,并提出了后续工作展望。据介绍,该方法不仅具有理论突破意义,更为解决实际工业问题提供了有效路径,在抽油机故障诊断、卡钻、井漏等场景中均表现出更优的效果。
讲座期间,吴博士给学生们仔细地讲解了新方法的实现细节以及整体算法流程,同时还对将来的发展做出了展望。同学们全程都在仔细认真聆听。讲座的互动环节,同学们积极提问。对于整理流程中不懂的内容,吴博士积极地进行讲解。此次讲座不仅让师生们主动学习有了深入了解,也为相关领域的研究提供了新思路。