61阅读

百度网页快照-6月21号大部分网站百度快照回档总结分析

发布时间:2017-07-30 所属栏目:部门月度工作总结

一 : 6月21号大部分网站百度快照回档总结分析

  此文纯属马后炮,只是给大家一个思路而已,看过的朋友一笑即可。6月21号16点左右开始,很多网站的百度快照开始回档(什么是快照回档)。今天小熊就来大概分析一下前因后果,不贴图了。

  如果还不清楚的朋友可以上网搜一下,大概了解下情况,或者查看几个关键词看看首页网站的百度快照。下面小熊继续,通过对部分行业部分关键词的总结和分析,可以看到这样几个共用的现象:

  1、所有行业都出现快照回档情况(网站快照回档了怎么办);

  2、回档日期多为6月8号、9号左右;

  3、这部分网站每天都保持有收录,并且有更新;

  4、不同的关键词出现不同的百度快照情况。

  很多人盲目崇拜SEO高手,或者又严重鄙视所谓的SEO高手,但其实真的懂SEO的人,这些都已经看得淡了。所有的技术是实践中来,所有的经验也是实践中来,而重要的只是你是否在观察(如果你想提升网站的快照,可以看下这篇百度快照慢怎么办)。上面扯远了,说白了,大家都是蒙的而已,只是高手蒙的巧妙。细心观察的朋友相信已经可以从小熊以上所提出的四个方面发现一些细微的问题了。如果还没明白的,那就请看下文。

  1、既然是所有行业都出现了快照回档的问题,那么最最重要的问题解决了,不用担心是你的网站被百度惩罚了,所谓法不责众;

  2、从回档的日期看8号、9号为上周百度大更新前后,是否是百度本身数据库的问题,以致部分网站数据回档到上次;

  3、网站都有更新,每天都有收录,快照还是回档是否和你网站的文章质量有关,看下你新添加的文章相似度如何;

  4、不同关键词出现不同的百度快照,这个情况早就有出现,百度不同的数据库更新时间不统一造成的。

  上述说了很多,问题解决了吗?答案是否定,肯定的是解决不了问题。在下不是什么高手,只是在碰到问题的时候善于通过实际的数据去分析问题的所在,也希望我的分析能够给你提供一个思考的方向。

  最后补充一句,此文系笔者先前所写,后百度快照回档现象已恢复,证明了seo还是得蒙也说明做seo得淡定。

  原创文章请注明转载自湖南seo,本文地址:

二 : 网站站长注意:百度快照突然后退

首先近一段时间,笔者没有对网站的主页甚至内页做出任何修改,这就可以排除掉第一个方面的原因. 前几天发现顶峰网的
百度快照突然后退,这种不正常的现象立即引起了笔者的注意,因为百度快照后退预示着网站出现了一定的问题。曾经听万能导航网的站长讲述过,一般能够引起百度快照后退的原因主要由四个方面: 第一个方面:对网站的名称或者主页作了全部或者部分修改 第二个方面:百度、谷歌等搜索引擎判定你的网站作弊,主要包括关键词的堆砌、网站优化过度等 第三个方面:有违规的行为,注意包括黄色、淫秽、低俗等国家法律法规及其政策不允许的 第四个方面:网站友情链接中又被百度等搜索引擎K掉的网站,这样要承担一定得连带责任。 认真分析导致百度快照后退的原因,利用排除法逐一对照排除
首先近一段时间,笔者没有对网站的主页甚至内页做出任何修改,这就可以排除掉第一个方面的原因
其次因为笔者牢记万能导航网资深管理员的教诲,那就是“网站最好的优化就是不优化”,当然也不存在被百度、谷歌等搜索引擎判定为网站作弊的可能。这样就能排除第二个方面的原因。
其三、维护和推广一个网站非常艰辛,爱惜自己的网站就如同爱惜自己的孩子,当然不会发表一些违反国家政策法规的任何举动,何况现在国家正在开展互联网整治低俗之风的大行动,更是慎之又慎。所以第三方面也可以排除了。 通过上面的排除,就只剩下最后一个方面的问题,那就是“网站友情链接中又被百度等搜索引擎K掉的网站,要承担一定得连带责任”,于是笔者就在百度搜索框中输入:site:www.*.com格式来查找友情链接的百度收录情况,可是SITE的结果发现,这些网站的百度、谷歌等搜索引擎都收录不仅仅正常,而且收录的页面都是上万的,当然网站的PR 也很高了。 这种现象让笔者百思不解,是什么原因导致顶峰网的百度快照后退呢?因为可以肯定的是第四个方面的原因,所以就认真的比对,正在困惑的时候,无意中发现前几天做的一个有情连接网站,虽然百度收录了6万个页面,网站的PR=5,但是网站的主页却没有被百度收录。按照常理,网站的主页因为内容更新频繁、浏览量最高,就是网站只收录一个页面,收录的也是主页,而且笔者更清楚百度收录的规则,那就是会给与网站的主页最高的权重,这种反常的现象预示着不正常。于是笔者就删除了那条友情链接,同时也通知了对方,并说明原因。三天后,顶峰网的百度快照又恢复了正常,至此才恍然大悟,原来百度K了那个网站的主页,因为百度在不知不觉中已经对K网站实施了精确打击。 对这种现象进一步研究发现,百度K网站,有的只K一个主页面,有的K一个主要栏目。这就告诫我们,在做网站友情链接之时,一定要SITE一下对方的网站,同时也要注意对方网站的主页;如果是一个综合性的网站,连接的可能是一个大栏目的主页,那时的你一定要再做交换连接时,SITE一下对方栏目。因为这个看似不重要的动作,是对自己的网站负责。

三 : 百度网页快照抓取之抓取时间分析

  本文内容围绕的是百度网页抓取的时间,可能有很多人都没有注意到这个细节,那么今天,我就为大家揭晓一下,《(最新)百度网页快照抓取之抓取时间》。

  大家看标题,可能会感到百度快照不是没有了吗?怎么又冒出来了?或者这都是老生常谈得了,今天还拿出来说道,小编我在写这篇文章的时候,也猜到大家会这么想,但是,我相信,如果你用心去看了就会发现,会有很多的地方是我们没有注意到的。或者所遗忘,也可能是自己不知道的,其他也不多说,看下文。

  大家看这个标题,多少会有点疑惑,所以为了更好地帮助大家去理解,直接上图,下图如示。

  

 

  图片很直观的向我们展示了百度抓取网页的时间,这一点不知道,大家有注意到吗?

  至于大家注意到没注意到,我在这也不多说,希望,这一点能对大家有所点醒。

  有的人可能会注意到这点,但这又和你的标题《(最新)百度网页快照抓取之抓取时间

  》有什么关系呢?

  小编我在这也不多说,还是直接看图。如下图

  

 

  图中圆圈部分,很明显,都是当前网页被收录的时间,但是问题来了,这也是我今天要问大家讲解的内容,图中的时间有什么特征呢?大家可以思考一下,同样大家可以去搜索任意关键词去看一下,可能会有所发现。

  好吧,小编在此就将自己的发现以及疑惑给大家分享一下。

  首先第一点,文章收录时间非常准确,精确到秒,所以由此可见,当前的搜索引擎是非常的强大的。

  第二点,文章收率时间显示多在凌晨3点~8点之间(注一般多说网页都是从凌晨开始被收录的时间段集中在0点到12点之间,下午的很少)。

  第三点,文章如果质量高一般都可以当场秒收,应该是当时时间,但圈中所示时间,3~8点都没有在上班,哪来的收录?这是一点疑惑。

  小编我再看完这之后就想到了,搜索引擎可能是先对某一网页进行收录然后建立索引(如有不明白可以查阅相关资料),而图中所示的网页收录时间不是真正的网站收录时间,而是百度建立索引的时间,百度建立索引的时间都处在无人或者工作量小的时间段,例如上文所说的凌晨3点~8点(但也不完全都在这一时间段),这段时间很少有人在用搜索引擎,并且小编在相关站长平台里面也听说过这样的事,所以大家还是需要认真的研究一番。

  在这里我在为大家补充一句,大家是否有过这样的经历,如果你经常查看排名,有时候会发现,早上查看的排名会和下午查看的有很大的产别,尤其是早上越早和晚上越晚相比相差很多呢?

  种种迹象表明,搜索引擎将越来越智能化,如果我们不能更加细致以及更加深入,那么可能有一天我们会被淘汰,所以,本文最最重要的一点是提醒大家,能更深入,更细致的去了解我们的工作。所有问题只是为大家提了一个醒,重要的是大家去深入探究,本文到此结束,谢谢大家。

  本文作者:程明明(www.unohacha.com),未经许可不得转载(⊙o⊙)哦。。。

四 : 浅谈:百度网页快照与网站页面本身时间的关系

  其实在写这个文章很久之前,我就发现了这个问题。大家都知道,有时我们在搜索时,希望得到的结果是最新的,比如”网页快照跟时间的关系”,在搜索结 果中会出现一系列相关的搜索结果,这其中就有几年前的页面,但是恰巧用户需要最新的,这时候就涉及到文档时间问题,很久之前百度利用搜索引擎蜘蛛抓取时间 来作为快照时间并配合最新文档临时表现超强还处理这个问题;可现在并不是这样子,百度已然将文章中出现时间的字样纳入到了搜索中,我们一起看下面的例子:

001
0012

看完上面俩案例,你有可能觉得这就是个巧合;看我们再看一个很典型的;

  

00121

这又说明了什么呢?不仅如此,如果你有网站后台,你会发现百度快照中显示内容有最新更新的文章 ,那么说明百度快照实际提取时间并不是2012-04-18;如果你还是不太确信,那么我们修改时间,

00122

修改时间之后再一次更新结果如上图,为什么快照会发生时间上的变化 ,为什么快照时间并没有出现我们预期的结果2016-04-17 ;这个大家想想就知道了。以上并不是个例,大家可以去找,去修改尝试!

 

  好了,我们总结下 ,百度网页快照与网站页面本身时间的关系并不是单纯的蜘蛛抓取时间,也不是简单的网站页面出现时间,而是两者共同的决定锁产生 ,如果页面有生成时间,百度后台会提取这个时间作为快照时间,即使内容更新后,这个时间也有很大可能不会发生变化 ,如果页面生成时间超前于当前时间,那么这个时间是不会被纳入作为快照时间的,本人测试过一些页面,首页、封面页、文章页面页面快照时间貌似容易受到页面 中显现时间的影响,而唯独列表页面影响视乎很小;至于最终结果到底咋样,还需要更多的同行去分析更多的数据才能得到;

  如果你网站 快照时间还停留在一年或者几年前,你可以测试下这个方法,很管用的。本文由宜昌网站建设原创 QQ 94775541 原文出自 转载请注明出处,谢谢了,

五 : 百度快照描述内容与实际网页描述内容不符的原因

  上午有人问润明SEO,说网站每天更新文章都收录,可是为什么收录的文章的标题和描述内容都与实际的不符呢?其他都正常,就百度不一样,笔者就去打开它的网站一看,不看不知道,一看吓一跳。如此低级的SEO作弊居然还问我为何百度抓取的标签内容与实际的不符。我先把图放出来给大家看下

  

上图中的首页描述显然和下图的中的描述标签的内容不一样

 

  上图中的首页描述显然和下图的中的描述标签的内容不一样。

  

上图中的首页描述显然和下图的中的描述标签的内容不一样

 

  这是为什么呢?12月8号有篇文章举例说明了百度快照没抓到title、description标签的原因的是因为内容不对,但是没抓到的原因是说出来了,但是抓到了但是显出来的与实际的不符的原因还没说明,如上面2个图所示的现象。

  这里再举一个百度快照抓取description等标签内容与实际一样的例子(其实有很多)

  

百度快照抓取description等标签内容与实际一样的例子

 

  下面是描述标签内容

  

描述标签内容

 

  上面4个图就明显说明了百度快照抓取description等标签内容与实际不符的真正原因不是标签内容的不对。那是什么原因呢?

  下面这张图证明这个上面的第一个图片里面的案例网站的代码都是框架组成,什么table等等

  

下面这张图证明这个上面的第一个图片里面的案例网站的代码都是框架组成,什么table等等

 

  我们知道百度对table框架网站的爬取是不太兼容的,而且从搜索引擎的原理来讲,其抓取系统首先是将整个网页下载下来,然后将里面的文字内容提取出来,经过分析去除html格式,清除噪音,然后分词,最后存入索引库。

  table框架的乱套直接导致搜索引擎蜘蛛的爬取效率和结果,那么取出代码剩下的文字有可能就与实际的文字有误差。那么这个时候百度对于爬取得来的文字内容与页面description标签内容进行对比,如果符合,就会采用description标签内容,如果符合这个页面的内容,那么百度就会自动截取一段文字作为这个页面最适合的描述。(百度这个原理是为了提高搜索用户的体验)

  如下图

  

模拟百度爬去页面的内容

 

  再看他的description标签内容“”明显是不符合上图中的蜘蛛抓取内容。

  而且百度蜘蛛爬取网页内容的习惯是从上往下,从左往右的,再看笔者网站的源代码都是才用DIV+CSS代码布局,而且结构布局如本站首页所示,也非常合理

  模拟蜘蛛爬取的内容如图所示(用我的description内容与下图内容对比,明显看出我的description内容是最适合描述首页的内容,因此才显示出来)

  

模拟猪猪爬取本站首页的文字内容

 

  我的description内容是:

  而从下图中我们可以看出如果你的网站没有description及内容,百度自动去判断description标签显示内容以显示出来,不然排名出来的页面,如果描述没有,势必会影响搜索用户在百度搜索的体验。

  

百度搜素seo

 

  而如何是一些知名的商业平台,如淘宝网

  

百度搜索淘宝

 

  但是淘宝网的真实标题是:

  

淘宝网的标签内容

 

  如上图中的一些知名商城,如果出现多余的字,可能会影响用户的搜索体验,因为这里出现后面的字,可能会给用户造成是冒充的假站,因为大家已经习惯 仅仅只有“淘宝网“三个字才是官方网站的习惯。(个人理解,应该是这样)

  最后一张图的淘宝案例属于特例,不在本文的范围之内。

  综上所述,作为一般性的网站,才用DIV+CSS代码,摒弃table框架等代码,以及从上往下,从左往右的代码布局习惯才能让百度抓取正常,才能显示实际的与页面内容想符合的description内容。

  作者:润明SEO优化:

本文标题:百度网页快照-6月21号大部分网站百度快照回档总结分析
本文地址: http://www.61k.com/1055306.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1