360后羿算法

2016.12月360搜索上线后羿算法,并与2017年9月升级后羿算法,上线后羿算法2.0。

互联网的快速发展离不开原创和稀缺的优质资源,而通过我们近期的数据分析和用户反馈发现,部分网站采取疯狂而低劣的采集手段,短时间内拼凑出大量低质量采集网页。这种行为使得互联网上内容拼接、偷换标题、过多垃圾广告等低质量的网页逐渐泛滥,不仅严重影响了正常用户的浏览体验,同时也导致优质原创内容无法优先展现,对用心构建原创和精品内容的网站也造成了一定的伤害。

360搜索一直以来,以鼓励互联网原创生态为宗旨,秉承“保护原创+控制采集”的原则。针对这一典型采集泛滥的现象,基于业界领先的安全大数据和大规模机器学习平台,研 发和上线了“后羿算法”:对低劣的采集站点加以控制,对原创和稀缺性网页进行保护和提权,同时确保新闻网站之间正常的转载行为不受影响。

“后羿算法”上线后,对于内容丰富的优质网页(如原创、稀缺资源、精心编辑的内容页等),会增加其在用户面前展现的机会;对于滥用采集手段的行为(如整站大规模采集,页面内容拼凑、含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等),会显著降低其展现机会和网页收录量。

我们建议网站存在上述问题的站长,能够从长远发展考虑,积极完善网站建设,提供更多时效性高、内容丰富的原创内容,引擎将随着网站完善,不断提升收录量。

后羿算法2.0

针对的问题包括但不限于如下类别:

1、页面标题与正文语义不一致,页面内容用机器批量构造;

2、站点内容存在淫秽低俗等诱导倾向;

3、页面排版混乱,存在多幅广告,巨型广告、弹窗过多等站点;

4、未经授权的采集和盗图;

5、导购类和网购类站点的关键词堆砌和采集行为;

6、页面内容与站点主营业务无关;

7、由建站程序批量制造的垃圾站;

360搜索将致力于为网民提供安全可信的搜索结果。我们在此诚邀广大站长与我们积极携手,不断提升自身站点的原创内容覆盖度,通过产出高质量原创内容来体现站点自身价值,构建互联网内容良性生态环境。

© 版权声明
THE END
喜欢就支持以下吧
点赞0 分享