Online Parameter Selection for Web-based Ranking Problems

论文简介

基本问题

Linkin优化的目标

  1. 病毒动作(Viral Actions),喜欢、评论、分享,因为这些动作会触发其他用户的更多动作,所以叫做病毒动作。包含这些动作的session占比,作为一个优化目标
  2. Engaged Feed Sessions(EFS),除了喜欢、评论、分享,还加入了点击和滑动超过10个feed,计算这些session占比
  3. job apply(JA)。申请了工作的session占比

  4. Feed-Mixer:分层rank

    1. 对每种类型的feed检索TOP-ranked 的items
      • 工作推荐
      • 新闻推荐
      • 相关文章
      • 好友分享
    2. 多多种类型进行混排
  5. 最终的得分
    $$
    score = P_{VA}(m,u) + x_{EFS}P_{EFS}(m,u) + x_{JA}P_{JA}(m ,u)
    $$
  6. 将VA作为优化目标,其他两个作为约束条件
    $$
    max VA(x)
    s.t. EFS(x) \ge c_{EFS}, JA(x) \ge c_{JA}
    $$
  7. $(c_{EFS}, c_{JA})$ 系数是产品给定的值
  8. 本文的方法可以极大节省人工调参的成本

  9. 将约束优化问题转化为无约束优化问题
    $$
    max U_1(x) + \exp(B) \sum_{i=2}^n \sigma_{\epsilon}(U_i(x) - c_i)
    $$

B 是U的上界,Ui就是第i个目标,ci是第i个约束常数,x是超参数向量。

连续臂汤普森采样

FAQ

当多个业务目标存在冲突,调参是如何处理的

无约束优化问题跟原问题的解是相同的吗?