先验知识的编码
论文:Label-Free Supervision of Neural Networks with Physics and Domain Knowledge
利用无监督样本学习,将先验信息编码到损失函数中!
跟踪自由落体
- 模型不是去拟合每一帧目标的高度,而是要求模型预测的结果满足物理定律。
- 输入是图像序列x,输出一个数值序列y,即每一帧目标的高度
- 对每一个图像x,应用函数f,得到预测结果f(x)
- 用一个a=9.8的抛物线这些结果序列,得到$(\hat{y})$
- 损失函数用拟合的结果和预测结果的残差表示
$$
g(x, f(x)) = \sum_{i=1}^N |\hat{y}_i - f(x) _ i|
$$
利用随机梯度下降优化损失函数(可以使用正常的正则项),得到最佳$(f^ * )$。
- 实验结果表明:这种方法的测试集上相关性90%,监督学习方法94.5%,随机猜只有12.1%,这个实验证明,有效地将物理规律编码进损失函数,利用无标注样本就能够有效地学习模型!
跟踪行人
- 水平移动的行人位置,没有了二次项,认为是匀速运动。
- 增加了方差鼓励,鼓励输出序列的方差不为0,防止平凡解
- 增加边界约束,防止过大的reward!
- 发现无监督的guide learning比监督学习效果还好,因为监督的样本太少,过拟合了。