2. 热点事件是可以引起大量热议的,所以实时新增的相关内容数量是巨大的,但项目上线初期用户因为还没有养成使用话题的习惯,没有将内容打上相关的话题标,会导致相当一部分高质量内容实际是没有收录在话题内的。
3. 对于一些分享类和问答类的话题,如高考后如何报志愿,如何解决精神内耗等,站内已经存在大量高质量相关内容,需要想办法将这部分内容发现并申请授权关联至话题内。
热点话题的自动发掘与流程打通
我们把热点话题分为两部分,一类是B站用户特有的,并且感兴趣且在讨论的内容。
另一类是全网正在发生的热点事件。
站内热词热点挖掘
我们发掘并监控这些词条并通过企业微信通知到值班的运营同学。
通过捞取和清洗用户小时级搜索埋点数据,得到每个 query 的点击 uv 数量,并计算出环比提升最多的热搜 query,将结果通过 Kafka 推送至后端进行企微通知,同时将结果输出至观远报表进行展示。
每日计算当日的搜索热词,对搜索 query 进行切词提取关键词,对结果进行聚合,根据热度进行排序,生成每日搜索词云,次日11时通过 Kafka 推送至后端进行企微通知,同时将结果输出至报表。
热搜(站内外)热点挖掘
并与话题创建的后台打通,实现了热点话题的自动创建和自动上榜最大程度的降低了运营的操作成本。并且根据在榜热门话题的实时指标实现了热榜位置的自动调整。