原文:[2201.09637] DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for AI-aided Drug Discovery -- A Focus on Affinity Prediction Problem
一个开放世界学习范式主要包括三个部分,即未知剔除、新类发现(NCD)和增类学习(CIL)。 开放世界学习的总体挑战 开放世界学习包括按顺序和周期执行未知剔除、新类发现和类递增学习。核心挑战在于如何使上述过程在不依赖人类工程师的情况下,通过模型与开放环境之间的交互自动进行。遗憾的是,在封闭世界假设下,
图神经网络的原理 图结构不同层次的任务: 图神经网络的基本原理是将图中的节点编码映射为一个低维连续稠密的向量,该向量能反映原节点在图中的连接和属性关系(该过程也称为图嵌入表示学习)。有了节点嵌入,进一步就能得到子图、全图的嵌入向量,最终用于下游任务。要实现这种表示,通常通过消息传递的方法来不断整合邻
原文:A Graph-Theoretic Framework for Understanding Open-World Semi-Supervised Learning (neurips.cc
表示学习(Representation Learning),也叫表征学习。表示学习的目的是对复杂的原始数据化繁为简,把原始数据的无效的或者冗余的信息剔除,把有效信息进行提炼,形成特征(feature),使下游任务受益。特征提取可以人为地手工处理(这一般就叫特征工程),也可以借助特定的算法自动提取。
对于一个可靠的系统来说,面对未知输入/类别的时候如果进行错误的操作/分类是有风险的。 大多数真实数据本质上都是动态的,且真实数据是不可预测的,一个可靠的系统必须能够忽略或拒绝未知输入/类别或设计连续检测新的输入并对未知输入执行某些操作的处理机制。 理想情况下,系统需要标记并添加新检测到的对象作为要学