这背后的原理其实都类似,一共分两步。
第一步,就是识别并理解内容。
把剪辑好的全片直接倒入,系统首先就会开始对内容进行识别。
比如,进行复杂环境下的人脸识别,认出演员是谁,还能知道谁是主角,谁是群演。
除了人,还会对景色、物体识别,贴上各种标签,比如“公园里”,“家里近景”等等。
另外,还会对台词和配乐分析,识别各个片段的情感,是惊悚还是温情,一目了然。
第二步,就是根据既定工业化套路生成预告。
比如,同样是30秒的预告,可以有各种风格,和各种模版音乐,按照相关标准生产即可,再根据用户喜好投放。