paper
Personalized Pricing Recommender System
基本思想
- 将用户分为三类:标准类型 Standard, 折扣类型 Discount, 不关注类型 Indifferent
价格 |
标准 |
折扣 |
不关注 |
标准价格 |
买 |
买 |
不买 |
折扣价格 |
买 |
不买 |
不买 |
- 每一类人的购买行为对应一个回报,对标准和折扣是支付金额 $(\alpha)$和$(\beta)$,而对于 Indifferent 类型,购买的话会将产品转卖,导致需要的用户买不到,存在一定损失,这里将购买的收益置0,不购买相比购买存在正的收益 $(\gamma << \alpha)$
响应 |
标准 |
折扣 |
不关注 |
买 |
$(\alpha)$ |
$(\beta)$ |
0 |
不买 |
0 |
0 |
$(\gamma)$ |
- 观测歧意:
- 对于采用标准价格用户,其中观测为支付的用户为标准用户,但是无法区分折扣用户和不关注用户;
- 如果采用折扣价格,则不支付的用户是不关注用户,但是无法区分标准用户和折扣用户。
- 解决方法:多步分类器。
- prescreening 预赛选过程,过滤掉明显是 Indifferent 类型的用户,减轻类别不均衡。即通过预测用户是否会下单,如果下单率特别低,那么就是 Indifferent 用户
- standard stage:区分标准用户和其他两类用户。
- 正样本(即标准用户):展示标准价格并且以标准价格下单的用户
- 负样本:展示标准价格但是并没有下单的用户;展示折扣价格但是并没有下单的用户
- discounted classifier:在非标准用户中区分折扣用户和不关注用户
- 正样本:展示折扣价格下单的非标准用户
- 负样本:展示折扣价格未下单的非标准用户