DASFAA 2026 将于 2026 年 4 月 27 日至 30 日在韩国济州岛举行DASFAA 2026。DASFAA(International Conference on Database Systems for Advanced Applications,数据库系统高级应用国际会议)是亚太地区数据库领域极具影响力的国际顶级学术会议之一,为中国计算机学会(CCF)推荐的 B 类会议。会议每年举办一次,自 1989 年首届召开至今已举办 30 届,长期受到全球数据库、大数据、数据挖掘领域学术界与工业界的高度关注。我院硕士研究生潘海洋、王甜同学作为学生第一作者的论文《SPGRF: A Structure-Preserving Graph Reduction Framework》、《Certified Pseudo-label Enhanced Active Learning Framework for Pattern Interest Evaluation》被接收。
硕士研究生潘海洋在国际会议DASFAA发表学术论文《SPGRF: A Structure-Preserving Graph Reduction Framework》。该论文针对现有图约简方法大多局限于低阶图属性或特定任务,忽略了图的高阶结构,导致约简图无法满足各类下游任务期望的根本局限,提出了一种任务无关的结构保持图约简框架(SPGRF)。核心创新包括:提出了一种从局部到全局的边重要性评估方法,结合基于图卷积网络(GCN)的预测模型来评估边权重,从而指导构建初始图骨架;设计了一种基于邻域的骨架增强机制,通过识别并恢复关键的直接和间接连接来弥补结构损失。在多个真实图数据集上的广泛实验表明,SPGRF在结构保留、执行效率以及多项下游任务性能上均显著优于多种先进基线方法(SSumM、WIS、SsAG等)。尤其在频繁模式挖掘(FPM)任务中表现卓越,即使在约简率低至10%的情况下,Top-k(k=800)频繁模式的准确率依然高达96%。该工作为图数据的通用高效分析提供了一种兼顾多尺度结构保真度与高扩展性的新路径。

图1 SPGRF总体流程
硕士研究生王甜在国际会议DASFAA发表学术论文《Certified Pseudo-label Enhanced Active Learning Framework for Pattern Interest Evaluation》。该论文针对现有频繁模式挖掘(FPM)技术通常依赖于单一维度的客观评估指标(如支持度或模式大小),且未能充分考虑用户主观偏好的根本局限 ,提出了一种用于模式兴趣评估的可靠伪标签增强主动学习框架(CPALF)。核心创新包括:开发了一种融合代表性(基于最近邻关系)与不确定性(基于信息熵)的新型主动学习查询策略,通过有限的人机交互高效获取用户偏好;提出了一种集成半监督学习与增量训练的方法,利用伪标签过滤策略(PLFS)从无标签数据中筛选高置信度的伪标签训练样本;引入了类别感知重放策略(CaRS)的增量学习范式,以缓解持续学习过程中的灾难性遗忘问题 。在Twitter、Twitch、Skitter等六个真实世界图数据集上的广泛实验表明,CPALF在仅使用约3%的标注数据的情况下,即可达到与全监督学习相当的性能,最高预测准确率可达96% 。该工作为资源受限环境下基于用户主观兴趣的图数据模式挖掘提供了一种兼具高预测精度与低标注成本的新范式 。

图 2 CPALF总体流程