采集多个资源站数据时,如何避免出现过多的同名重复数据?采集入库同名的重复数据如何合并播放组?
找到程序“系统”-“采集参数配置”-“入库重复规则”,此项设置顾名思义,就是整理入库时的重复数据的判断条件;你勾选的条件越多,则判断是不是同名重复数据的条件也就越多。
举例说明:
若只勾选“名称”时,其他都不勾选,则在多个资源站采集数据时,只会判断“名称”是否重复,如果重复,则增加播放组,而不是新增一条数据。
若勾选“名称”+“分类”时,意思是,当数据的名称和分类都一致时,才判断这个数据为重复数据
例子:
A资源站采集到一个名称名为“三生三世十里桃花”,分类为“国产剧”的数据,
B资源站采集到一个名称名为“三生三世十里桃花”,且分类为“国产剧”的数据,则增加一组播放源
若标题相同,分类不同时,那就会新增一条数据。
以此类推,你勾选的条件越多,则必须同时满足你勾选的条件,才判断为是重复数据。
最后推荐,建议只勾选“名称”+“分类”即可