关注我们

谈谈最近网站收录大幅降低这点事

21012017-09-13再启网络

    我们的很多合作伙伴都会发现近期网站的收录上不来,甚至分析日志发现蜘蛛近期都不来爬取,这些问题都伴随着百度飓风算法的推出而让大家苦恼不已。特别是新站,想要个收录也没有之前那么快了...

  一、搜索引擎为什么要重视原创

   1.1 采集泛滥化

  来自百度的一项调查显示,超过80%的新闻和资讯等都在被人工转载或机器采集,甚至某些公司开发的优化工具**云,号称机器生成上千篇伪原创作为其优化手段。可以说,优质原创内容是被包围在采集的汪洋大海中之一粟,搜索引擎在海中淘粟,是既艰难又具有挑战性的事情。

   1.2 提高搜索用户体验

  数字化降低了传播成本,工具化降低了采集成本,机器采集行为混淆内容来源降低内容质量。采集过程中,出于无意或有意,导致采集网页内容残缺不全,格式错乱或附加垃圾等问题层出不穷,这已经严重影响了搜索结果的质量和用户体验。搜索引擎重视原创的根本原因是为了提高用户体验,这里讲的原创为优质原创内容。

  1.3 鼓励原创作者和文章

  转载和采集,分流了优质原创站点的流量,不再具属原创作者的名称,会直接影响到优质原创站长和作者的收益。长期看会影响原创者的积极性,不利于创新,不利于新的优质内容产生。鼓励优质原创,鼓励创新,给予原创站点和作者合理的流量,从而促进互联网内容的繁荣,理应是搜索引擎的一个重要任务。

  二、采集很狡诈,识别原创很艰难

  2.1 采集冒充原创,篡改关键信息

  当前,大量的网站批量采集原创内容后,用人工或机器的方法,篡改作者、发布时间和来源等关键信息,冒充原创。此类冒充原创是需要搜索引擎识别出来予以适当调整的。

  2.2 内容生成器,制造伪原创

  利用自动文章生成器等工具,“独创”一篇文章,然后安一个吸引眼球的title,现在的成本也低得很,而且一定具有独创性。然而,原创是要具有社会共识价值的,而不是胡乱制造一篇根本不通的垃圾就能算做有价值的优质原创内容。内容虽然独特,但是不具社会共识价值,此类伪原创是搜索引擎需要重点识别出来并予以打击的。

  2.3 网页差异化,结构化信息提取困难

  不同的站点结构化差异比较大,html标签的含义和分布也不同,因此提取关键信息如标题、作者和时间的难易程度差别也比较大。做到既提得全,又提得准,还要最及时,在当前的中文互联网规模下实属不易,这部分将需要搜索引擎与站长配合好才会更顺畅的运行,站长们如果用更清晰的结构告知搜索引擎网页的布局,将使搜索引擎高效地提取原创相关的信息

   针对百度飓风算法,我们如何应对呢?  

   对于新站,我们需要大量的更新高质量的原创文章,让百度蜘蛛一直来抓取,另外站长平台验证站点,提交链接,加快其放出首页及页面收录。 而对于一个养了一段时间的老站,我们要分析网络日志的同时,一周更新二三篇原创文章是有必要的,可以围绕相关产品关键词来做文章,注意这个内容页面的meta标签的书写,站内关键词的布局,以及做站内链接,关键词链接到重要页面,最后不要忘记到站长平台做链接提交。

   最后,原创是生态问题,需要大家来共同维护,站长们多做原创,多推荐原创,百度也将持续努力改进排序算法,鼓励原创内容,为原创作者、原创站点提供合理的排序和流量。而我们也将为优质内容站点提供更多的SEO优化服务,合肥网站seo优化找申泽seo管理系统。


快给朋友分享吧

0551-66039919

13514988280

地址:合肥市蜀山区合欢路6号亿诺商务中心24层

如果你对我们的服务感兴趣,可以给我们留言,我们会第一时间联系您。