* 首先,由于曝光有限,尤其是在训练开始时,该模型容易在目标域上出现欠拟合。
* 其次,由于“已见”批次的擦除,该模型缺乏使深最佳跨域分类器的源-目标数据对的多样化组合。
我们提出的方法旨在最大限度地减少在线设置的这些缺陷。首先,我们提出通过跨域引导来增加数据多样性,同时在多个独立的学习器中保留数据多样性。然后,我们充分利用这些学习器之间宝贵的差异性,通过交换它们对当前目标查询的专业知识,实现相互监督。
跨域引导
跨域数据对的多样性对于大多数先前的离线方法的成功至关重要。由于目标样本在在线设置中无法重复使用,我们提出通过 手机号数据库列表 引导源域与当前目标域查询形成多样化的组合来增加跨域数据多样性。从高层次上讲,引导过程模拟了在给定源样本多样性的情况下对特定目标查询的多种实现。引导过程带来了对单个目标查询的多视角观察。
通过共同监督利用差异
在独立学习器保留了跨领域对之间宝贵的差异性之后,现在的问题是如何充分利用这些差异性来改进目标查询的在线预测。一方面,我们希望将学习器的专业知识整合到对当前目标查询的更佳预测中。另一方面,我们希望保留它们之间的差异性。我们通过交换学习器在目标领域的知识,以共同监督的形式对它们进行联合训练。具体而言,学习器采用引导式源监督进行独立训练,但它们会交换针对目标查询生成的伪标签。