令f(x)=sqrt(x)*10,(0≤x≤100),x为作者总得分,把x经过f映射后,好处有以下几点:
(1)f(x)是单调上升的,映射后仍保留原序,保证了公平公正
(2)f(36)=60,及格万岁!
(3)f(x)为凸函数,原分数越低,得到的补偿分数越高如上图,原始分数在20分时奖励25,原始在60分时奖励17分,而80分时只奖励9分。
大家应该恍然大明白了,这么做主要以积极鼓励作者为目的,同时也不改变全局排序,最后在乘10的基础上稍作改动乘以100没有别的意思,就是显得分数更多而已。
欲问我为什么知道此“大法”,要追溯到高中时期的化学期末考试,当时的我惨目忍睹得考了49分,本以为要补考的我,最终被开根号乘10大法拯救,以至于没有完全放弃对化学这门课程,拿到最终分数的我大喊了一句“开根大法好”!
二、模型算法
纳入评级库标准
(1)所有媒体库中的作者
(2)数据异常无法获取正确信息的作者不参与评分
打分方法
(1)各项一级指标、二级指标在0到100分范围内打分,无及格分数线。
(2)对于可获取数据的定量指标,采用标准化的方式打分;若数据量级相差较大,可以先取对数,再进行标准化(减小量级差异造成的影响)。
以文章浏览得分为例:
其中,
(3)附加项加分,正向指标,如个别数值表现突出,超过预设值的5倍,则给与额外加分,比如点赞数预设上限值为800,当有作者得到4000以上的点赞时,我们会考虑额外加分。
(4)附加项减分,反向指标,当发现有作者作弊时,情节轻者扣分警告,恶劣者删除作者号。作弊可通过第三方软件和算法识别出来,反作弊反欺诈会在今后单独写一篇文章介绍,下面只是简单的介绍一下作弊的类型。
- 用户IP异常,包括请求次数与地域异常
- 手机设备被篡改或者安装高危软件
- 存在一个账号多个设备,或者一个设备多个账号
- 特定时间,访问量出现激增情况
不要小看作弊这件事,这会严重影响体系的平衡性,质量差的文章通过刷量占据TOP榜,那么推荐算法就会增加该文章曝光度,读者便会看到低质量的文章,久而久之,会造成作者与读者的流失。
权重确立方法:层次分析法(AHP)
层次分析法是一种常见的权重分配法,这里就不多赘述了,想了解AHP算法的朋友可以看一下本人的另一篇文章《如何用更少的钱,带来更优质的量?渠道质量评估模型|一文通透》,在网上也可以找到免费的层次分析法软件,非常实用。
简单的概括AHP层次分析法,就是用科学的方法确定权重,拒绝“拍脑袋大法”。这样便有了如下图,一级指标权重。
一级指标图
二&三级指标筛选(聚类)
1. 盲选:将根据经验得到的、现有的备选聚类变量全部纳入模型,暂时不考虑某些变量是否合适。
2. 贡献量分析:通过方差分析,观察分类是否存在显著差异,踢出对模型聚类没有贡献的变量。
3. 相似矩阵分析:输出相似性矩阵,对相关系数进行分析,若两变量相关系数接近1,说明两个变量可以互相替代,踢出一个变量以达到降维目的。
4. 通过上述3步对变量进行筛选,既能踢出贡献度较低变量,又将相关性强的变量进行整合,最终输出相互间属性独立的变量。各项二、三级指标的权重也参照一级指标一样,层次分析法进行权重分配,最终得到指标骨架图,如下图所示。
模型指标骨架
模型指标骨架图
骨架填充与BI展示
将数据填充到骨架中,再按照自己想看的维度去做相应的BI展示,本文按周和月对作者进行评级,也可以按照日为维度进行监控。接下来的第三章讲解模型的应用。
三、模型的应用
这一环节主要介绍模型的应用。
俗话说得好,不能将模型落地执行的需求都是在耍流氓。
模型好么?好!怎么用?不会!那就是一种资源浪费,数据分析师的价值就是用数据推动业务。废话不多说,来看一下模型如何应用。
应用场景一 排名奖励促生产
每月对影响力进行排名,根据排名TOP100的自媒体和用户,按照排名梯度给予额外奖励,刺激用户多发文章,发好文章。
应用场景二 热度征稿奖励
除了一些自由文章外,还需要做活动引导作者发表热门文章,比如以“国五国六排放标准的汽车如何选择”为主题的文章,贴合现阶段市场行情,更容易吸引用户的眼球;
还有类似新车抢先评测奖励,在大多数人还处在购车犹豫阶段,一篇新车抢先报可以解答用户的疑难杂症。
文章写出来,我们便可通过模型对用户进行综合评价,避免标题党的情况出现,同时作者也会获得模型加分项的加分和活动的双重奖励,促使作者输出读者想要的热门文章。
应用场景三 裂变拉新
文章还能拉新?
当然能!
其实这里面就用到了互动得分,将模型里互动得分高的文章筛选出来,作为裂变的种子,通过种子用户进行传播,达到裂变拉新的效果。
应用场景四
Know your customer,知道你所运营的作者是啥属性,一般一个内容运营手底下有许多作者,根据模型判断。
如果作者属于“沉默是金”类型,出品频率虽低,但只要出品必属精品,那就引导作者提高频率或者转变热门话题。
若属于高频低质量的“口水文”,那么有必要来一波质量提升。如果是作弊用户,那就“拜拜了您内,不送!”该应用主要是针对作者属性,精细化运营。
此模型的优势之处在于综合评估作者,而且还能将作弊之人“绳之以法”,在了解你的作者和读者基础上运营,必将事半功倍。实际上,该模型的玩法还很多,我们等待更多内容运营大神脑暴,以发挥模型最大价值。
四、模型的拓展
该模型不只局限于作者评分,还可以做渠道评估、活动评估、用户质量评估、用户积分评级系统等等。把相应的指标替换,赋予相应权重,便可套用此模型。