由搜索权重排序引入的一些思考

[dangerbox title=”标题内容”]比如搜索结果决定根据月销量和好评加权值来确定展示顺序,应该如何设置这个权重?以往的经验是重要的维度权重大一些,但是评分最高是5分,而销量无上限,这种类型的加权应该如何设计才能让权重发挥作用呢?如果想加上“新商品发现”维度和“对新入驻商家友好”的维度,又该如何设计呢?[/dangerbox]

[title]权重的定义[/title]

从定义来看,什么是权重。权重是指一指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。

指标的权重反映某一指标在指标体系中所起作用的大小,针对指标权重的计算方法有很多种。

指标间的权重差异主要是由于以下三方面的原因造成的: ①评价者对各指标的重视程度不同,反映评价者的主观差异; ②各指标在评价中所起的作用不同,反映了指标间的客观差异; ③各指标的可靠程度不同,反映了各指标所提供的信息的可靠度不同。

[title]权重因素的考虑[/title]

由于上述三个因素存在,在考虑权重时也可以从三个方面来考虑设计指标权重:

  1. 由决策者的经验判断合理地给出每个方案(或指标)的权数,一般采用主观赋值,比如AHP层次分析法。

  2. 由评价中各指标传递的信息量大小决定指标权重,比如熵值法。

  3. 依靠指标评价值的客观程度与可靠程度反映权重,比如灰色关联分析等。

上述第一种属于主观赋权,而后两种属于客观赋权

  • 主观赋值多采用定性方法确定权重:常见的方法有专家咨询法(Delphi法)、AHP法、评级打分法等,其中AHP方法使用较为常见。

  • 客观赋值是通过数学量化指标间的关系或离散程度来确定权重,常见的方法有:熵值法、主成分分析、灰色关联、模糊综合评价法、因子分析法、TOPSIS法等。

[title]熵值法的简单引入[/title]

此处举例用熵值法来进行分析。

熵值是不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。因而利用熵值携带的信息进行权重计算,结合各项指标的变异程度,利用信息熵这个工具,计算出各项指标的权重,为多指标综合评价提供依据。

根据熵的特性,可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响(权重)越大,其熵值越小。

从现有的三个评价信息来看,好评、销量和新品。其中的好评和销量可能是带有关联性的,而这两个属性中的好评是有熵值特性的(具有离散性)。

因水平有限,仅深入到此,具体的熵值算法涉及到特定的算法和一些复杂的公式不在此深入。

[title]针对新品的推送的一些建议[/title]

我们先来回看下头条推送文章的机制,或许有可用之处。

1.分批次推荐

包括两种模式:一是某一时效期内多次推荐;二是不同时效期(24小时、72小时和一周)的推荐。

2.首次推荐

首次推荐给的目标用户的阅读标签与文章标签匹配度最高,他们被系统认为是最有可能对该篇文章感兴趣的用户。

首先推给最感兴趣的用户,然后根据这批用户的反馈信息决定下一批的推荐量,反馈信息包括点击率、收藏数、评论数、转发数、读完率,页面停留时间等,其中,点击率占的权重最高。

3.首次阅读数据决定第二次推荐量

首轮推荐后,如果点击率低,系统就认为文章不适合推荐给更多的用户,会减少二次推荐的推荐量;如果点击率高,系统则认为文章受用户喜欢,将进一步增加推荐量。以此类推,文章新一次的推荐量都以上一次推荐的点击率为依据。此外,文章过了时效期后,推荐量将明显衰减,时效期节点通常为24小时、72小时和一周。

首次推荐的用户阅读数据,包括点击率、收藏数、评论数、转发数、完播率和页面停留时间等,决定着第二次的推荐量。如果首次推荐的综合指标比较高,那么说明文章是适合这类用户的。那么系统在第二次推荐时就会加大力度,推荐给更多的人,反之则减少推荐力度。

所以说,很多人发现自己发的内容一上来就没人看,或者是短短几个小时就爆了,就是基于这个推荐机制,

用户在通过社交账号登陆时,算法会解读用户兴趣,形成用户画像,根据用户画像来推荐感兴趣的文章。在用户使用过程中,算法会根据用户的点击、搜索、订阅等行为优化用户画像。

如果用户不登陆,头条会推荐一些大众化的内容,再根据用户点击来确定用户画像。文章经过审核和消重后,会分批次推荐给用户。

新品的推荐规则也可借鉴于此,但需要相应的调整,具体就应该要看现有的业务实际情况了。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
相关推荐
  • 暂无相关文章
  • 评论 抢沙发