主动学习

主动学习是非常有用的模型迭代的策略和思想,具体概念大家可以自行搜索。这里主要介绍下主动学习关注的两个非常重要的点:

  • 数据的多样性,即数据集要尽量覆盖不同类型的数据。
  • 模型结果的不确定性,不确定即指模型对于给出的结果是不确定的,这里最直观的体现就是模型输出的概率,当模型输出一个结果,但相应的概率却较低的时候,就表明我们的模型对这一类case的学习泛化能力还不够。也是我们在模型迭代中要重点关注的对象。

基于如上两个原则,主动学习能够很好的帮助我们了解数据,了解模型,从而指导我们调整数据分布,调整模型,完成模型的迭代。