大家都知道短视频是互娱类。不管是抖音 快手 视频号等等短视频平台,都是以记录生活为主,那么总有别有用心之人去搬运其他平台作品,利用别人的作品去为自己谋利。
那么短视频去重 检测视频原创就很有必要!
我们先来讲讲短视频去重的难点在哪。
1、海量的视频
每天都有大量用户去上传视频如何说要每个视频在那几秒钟都检测完,显然是不合适的。
2、重复的标准
用户用同一段视频发送多个短视频APP怎么办
3、检测的规则
视频的属性与设备的属性
4、有效的识别率
通过多维度去分析视频类如:用户的权重 视频类型
再分3个部分
首先视频本身大家都知道一个视频包含了哪些信息
当然还有我们的视频拍摄时间 拍摄手机型号 MD5 色彩编码,以及摄影时的光圈、快门、ISO、日期时间等数据,甚至还包括拍摄时录制的声音和全球定位系统(GPS)等信息
第二个 设备
可能有人发现说我这个设备实拍发送自己那个手机的账号 他说我涉嫌搬运的情况(这情况很少发生 但是也有)
摄像头与麦克风 一个摄像一个收音,当我们拍摄视频的时候,有一个“内鬼”正在悄悄地记录这一切,风控系统里面大部分APP都会读取你的设备日志
绝大多数APP都可以随时打开你的摄像头拍照,不需要你同意哦
当然还有内存,你的设备拍摄过后,保存到你的相册,你们有没有发现你的相册图片是有分类的,
截图 手机拍摄 他们的路径不一样 在相册分区也不同。及文件名也不一样。md5能一样吗?
第三个 上传路径
大家都知道在很多短视频APP都有不同的上传路径。
就之前说风控的时候也讲过,当你的在用抖音拍摄短视频从一开始就已经上传到零时服务器 排队上传,这样有效地缩短用户的上传等待时间,也很好的识别原创! 但是你有没有发现所有的上传点都会让你给你打开摄像头 不管你手速有多么的快 那么一帧上传到临时服务器。
那么大部分的搬运都不是利用抖音里面的视频拍摄,而是通过相册去上传视频
那么是不是可以制定一个规则 只检测相册上传作品
解释一下视频md5的意思
视频MD5信息技术,是message-digest algorithm 5的缩写,被广泛用于加密和解密技术上,它可以说是文件的“数字指纹”。
任何一个文件,无论是可执行程序、图像文件、临时文件或者其他任何类型的文件,也不管它体积多大,都有且只有一个独一无二的MD5信息值,并且如果这个文件被修改过,它的MD5值也将随之改变。因此,可以通过对比同一文件的MD5值,来校验这个文件是否被“篡改”过。
但是你视频随便上传到剪辑工具MD5都会修改
那么短视频怎么检测原创视频呢?
每个平台的检测点不一样,每个平台的检测规则一般都有2套及以上,
因签署保密协议就不做过多讲解!