qq音乐管理后台,qq音乐怎么关闭后台音乐

首页 > 实用技巧 > 作者:YD1662023-05-10 22:49:52

首先是内容价值的离线方案。这里主要是分为基础评估指标和业务策略维度,其中重点介绍下最重要的用户互动质量评估的方案。

互动质量这里主要由四部分的原子数据组成,其中前3个是比率型指标,最后1个是绝对值指标。对于比率类的指标,一个常见的问题是,在数据量较小的时候置信度不高,这里我们的解决方案是使用“贝叶斯平滑”,当I (Impression,曝光或播放)和 C(Click,点击或完播、搜播、收藏分享)都比较小的时候,评分 R 的平滑值就接近于大盘的均值。而对于绝对热度的指标,头部和长尾的数值差异较大,这里我们使用类似牛顿冷却定律的方式对热度做指数型衰减。

最后所有的指标做归一化后进行线性加权,得到综合的互动质量分。

其次,是内容价值评估的实时方案。这里主要有以下几个点:

1)多个来源的数据流不是通过join,而是先分别聚合,然后用union的方式融合到一起;

2)在中间结果的基础上再join内容属性或用户属性的数据,这里是通过异步io 缓存的机制;

3)在以上计算的基础上,区分不同大小的滚动时间窗口,进行二次聚合,这里短期窗口和中长期窗口分别能够处理及时性和稳定性的问题,同时多种时间窗口也能刻画出实时飙升的趋势;

4)最后结果双写到线上的es和离线的tdw数据仓库,可同时进行线上应用和离线分析。

下方两图是时间窗口的示意,包含我们实时评估中用到的滚动窗口和滑动窗口的示意,其中三个长度的滑动窗口有一个(短期)实际也是滚动窗口了,另外两个(中期和长期)是前后有重叠部分的滑动窗口。

接下来是我们对内容未来热度和质量的一个预估方案。这里主要采用的是一个时序的神经网络模型,也就是TCN,它是以CNN为基础,并做了这3点改进:

- 因果卷积:不考虑未来的信息,隐藏层越多考虑的历史信息越久远

- 空洞卷积:在标准的卷积里注入空洞,以此来增加感受野

- 残差模块:避免梯度消失或爆炸,并解决网络退化的问题

以上是我们在内容价值和质量评估方面的解决方案。接下来是我们在长尾内容的挖掘和理解方案。

qq音乐管理后台,qq音乐怎么关闭后台音乐(5)

2.3 潜力内容挖掘

首先是基于内容本身的内容理解,我们综合考虑了歌曲需要具备的特质,构建了基于深度神经网络的潜力挖掘模型 - PDM(Predictive Model)。具体而言,主要分为两大块:

底下部分是 多维度的歌曲理解:一首好歌,在演唱、歌词、旋律、节奏等角度,都不应该存在问题,并且至少在某一方面有足够的亮点。因此,PDM技术会对歌曲进行“拆解”并分别建模,力求全方位的衡量歌曲的质量和潜力。在建模时,我们充分调研了当前业界领先的技术,并对现有技术更进一步地创新自研,力求更好的描述每个维度。最后,我们使用深度学习框架将各个维度的信息综合起来,从而给歌曲一个更加客观的评价。

顶上部分是 多角度挖掘好歌:不同用户喜好的歌曲风格往往不同,喜好的表现也相对多样化,例如有些用户听到好歌会收藏,有些用户则会进行评论等。在圈定学习目标时,我们精选了多个用户群,并采取多种指标来描述用户的喜爱程度和歌曲的爆款潜力。通过对用户群和指标的组合,我们训练了一系列模型,力求从不同的角度挖掘到好歌。

qq音乐管理后台,qq音乐怎么关闭后台音乐(6)

其次是基于用户行为的潜力挖掘,我们从业务场景出发,通过对QQ音乐海量用户进行挖掘,圈定眼光独到、对社媒歌曲先知先觉的优质种子用户。

一方面用这些用户的搜索、播放、收藏、分享等行为,借助PageRank等算法对歌曲的潜力值进行投票打分,实现了无监督的潜力挖掘,避免了繁杂的数据打标和正负样本比例悬殊的问题。

另一方面,用这些用户的听歌等行为的序列,对内容进行嵌入表达,得到User-based Embedding,为后续与PDM融合打下基础。此外,为了弥补交互数据较少或缺失的内容无结果,解决内容“冷启动”问题,我们使用了更多的图模型,如node2vec、EGES等,引入歌曲与其作词、作曲、演唱等信息的关联图谱,并通过随机游走和嵌入表达,得到SideInfo-based Embedding,然后通过一个隐层进行融合,得到综合的黑马Embedding。

qq音乐管理后台,qq音乐怎么关闭后台音乐(7)

最后,在以上两部分的基础上,结合基于内容本身和基于用户行为两种内容理解的优势,作为内容在节奏、旋律、音色等空间的嵌入表达(PDM-Embedding),同时使用序列表示、图表示等方法将种子用户对歌曲的操作信息生成基于用户的嵌入表达(User-Embedding),并引入歌曲的作词、作曲、演唱者与歌曲关联的异构网络图谱,生成基于歌曲辅助信息的图嵌入表达(SideInfo-Embedding)。

最后通过深度神经网络,对上述Embedding进行进一步学习,实现了同时兼顾及时性和精准度的多模态潜力优质内容挖掘模型(MetaPDM),该融合模型不仅从音频和歌词等内容维度表征和建模歌曲,还会考虑到播放、收藏等用户行为,以及内容的创作者等知识图谱数据,实际挖掘和投放表现相比单一类型的模型有进一步的提升。

以上就是我们整理内容理解的主要解决方案了。接下来介绍一下我们是如何应用这些内容理解的结果的,分为两个大章节来介绍,首先是内容运营中台。

03. 内容运营中台

3.1 整体方案

内容运营中台主要是为了解决两类大的问题:一个是召回阶段的内容池圈定的问题,另一个是排序阶段内容排序的有目的的调控问题。系统整体的框架如上图所示:

最左边是我们离线和实时内容评估和挖掘的结果,分别通过spark和flink流转到我们的存储层。

存储层主要分为两级,包括es和ckv,其中es搭配kibana,既可以方便的进行相对复杂的脚本字段配置,又可以配置一些可视化的监控看板。在es的基础上还会加上一层ckv 的缓存层,以应对高qps的线上服务。

接下来是我们的服务层,主要是对外提供可灵活筛选的内容池服务和内容评估指标的参数服务,这两个服务都接入了我们的abt平台的用户分流,并且支持策略的可配置。

最后是我们的应用层,分别是个性化的召回服务和个性化的排序服务,其中个性化排序服务会将模型分和内容价值评估分进行线性加权后作为最终排序。

接下来我们重点介绍下这里内容池服务和参数服务的一些具体细节的实现。

3.2 内容池

qq音乐管理后台,qq音乐怎么关闭后台音乐(8)

上一页1234下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.