61阅读

百度收录-详谈百度收录过程

发布时间:2018-03-09 所属栏目:搜索优化

一 : 详谈百度收录过程

  关于百度收录问题,网上有很多的相关介绍,说得百度是天花乱坠,有说百度好的,也有抱怨百度的,甚至有的还大骂出口。呵呵,我个人认为百度是中国个人站长的心脏,站长的喜悦悲哀都由这个心脏来决定。难道不是吗?

  今天跟大家讨论一下百度的收录问题,主要的讨论话题是“百度收录过程”。这个话题可以算是比较敏感的话题了,都是一些SEO专业人士的主题曲。我今天讨论这两个话题并非代表我就是SEO专业人士或者什么高手之类的,只是借凭着自己两年多来的建站经验作个自我观点介绍罢了。

  百度收录过程

  对于一个新站来说,从网站上线和提交到百度后到什么时候收录,是每个站长日日夜夜关注的问题。特别是新站长,当网站正式提交到百度后,每一天至少两次查询百度对自己的新站收录情况,甚至连做梦都想着百度。但是这样的期盼往往让很多新站长失落,因为普遍的所谓真正收录实在是太漫长了。三天不收录我可以等到第六天,第六天还不收录我可以等多一个第六天。然而二六等于十二再加三就是十五,足足的半个月时间还没收录!呵呵,这个时候难道你不感到失落吗?

  当你等到第十五天的时候我可以很明确的告诉你,其实你的网站早就被百度收录了,也许是在你提交的第二天或者第三天就被百度收录了。呵呵,这话听起来是不是感觉有点假?别说听起来有点假,看起来都有点假。既然说早就收录了,那为什么我在百度搜索里连影子都看不到呢?

  这个就是百度的独特之处,也是百度为什么能在谷歌与雅虎的强烈竞争中稳坐老大之席的因素之一。谷歌的收录原则是来者不拒,只要能找到的,短时间内就能在谷歌的搜索引擎中出现。

  而百度则是先大量的对你网站进行索引,这个索引工具俗称“百度蜘蛛”,在IIS日志中名称为“BaiduSpider”。比如:2008-07-15 00:13:54 W3SVC818374 222.214.218.36 GET /index.html- 80 - 221.10.254.26 Baiduspider+(+) 200 0 0 265。当你把网址如:www.bbxyx.com提交到百度后,“百度蜘蛛”就会在网络低潮时刻来访你的站点,大概是一天索引50条信息左右。IIS日志中可以查看到“BaiduSpider”的访问痕迹,其中主要的有cs-uri-stem(URI资源)、cs(User-Agent)、sc-status(协议状态)。cs-uri-stem(URI资源)记录被访问的文件名称及路径。cs(User-Agent)对应一栏中则可以看到来访者相关信息,如果是“百度蜘蛛”则显示有“BaiduSpider”字样。sc-status(协议状态)记录着的数据主要有三个:200(成功访问)、304(已索引或未更新)、404(访问失败)。当你的网站的某条数据有被“百度蜘蛛”访问过,并且sc-status(协议状态)显示的数字为200(成功访问),那么你的这条信息就已经成功的被收录了。如果sc-status(协议状态)显示的数字为304(已索引或未更新),就表示这条数据已经存在了。如果是404(访问失败)就说明蜘蛛无法成功访问这条信息,这样你就应该检查一下路径了。

  好,现在我简单的给大家说一下百度的收录程序:蜘蛛来访索引——蜘蛛携带已访问到的数据返回——百度服务器判断数据并且返回信息——数据入库。

  当数据成功入库之后就表明已经成功收录了,但为什么在百度的搜索引擎里找不到呢?因为百度收录了你的数据后不会马上就给你放出来,要经过一系列的审核过程,当审核通过了才能在搜索引擎中出现。

  说到这里也许有朋友会问?百度的审核过程也太漫长了吧?我的一个新站近一个月后才出现在百度搜索引擎中,有的甚至要两个月。据我理解,当你的网站所有数据被百度收录到有70%左右的时候百度才开始审核你的数据。以一天收50条数据量来计算,1000条数据若要等收录到700条左右才开始审核,那么也要近半个月的时间。所以这就是为什么有些网站需要一个月,有些网站需要两个月了。

  以前有很多朋友问过我这样一个问题:比如我是这个月1号提交网址到百度,等到20号的时候百度的搜索引擎中出现了我的网站索引。但是百度快照旁边显示的时间是3号的,这是为什么呢?

  其实当你了解了百度的收录过程后就不难理解这个问题了,百度快照旁边显示的时间正是这条信息的收录或者更新时间,刚才已经讲过,只要蜘蛛成功访问到的信息就是已经收录了。而搜索引擎中显示的时间就是这条信息从蜘蛛索引到入库的时间。

  好了,以上就是我个人认为的百度收录过程了。

二 : 百度在K了我60天后重新收录

  小弟的站前段时间由于是采集文章,才上架一个月就被百度无情的K了个干净,不知道为什么,当时的心情都不知道是怎么形容了!当时我就想着,既然封了,大不了我换个域名,一时也想不出什么好的域名来,所以换域名的事也就一直没有落实,每天一有空就上万网碰下运气,在找域名这段时间,有空的时候还是继续添加文章的,多的时候一天十来篇,虽然域名被封,但换了新域名后文章多点,是是不是可以对网民有吸引力些,当时我是这么想的。另一方面我也在找有关网站被K后重新收录的文章,想办法让百度重新收录,毕竟还没有找到合适的域名,每天的日子就是找域名,发文章,但时间一天天的过去,一个月了,还是没有被收录,小弟心灰意冷,认为此域名肯定是上了百度的黑名单了,永无出头之日了!

  昨天,就在昨天,我记得这个日子2008年10月24日,本来打算彻底的放弃,这个域名的,准备把空间腾出来,重新上个站的,可我site:,不会吧,我没看错吧,百度既然收录了,虽然快照时间是2008年8月份的,但我以前的努力终于被百度认可了,心中暗喜。到了晚上我再site一下,竟然又出来了个首页,而且时间是10月19日的,说明什么呢?我觉得,说明百度早已经收录了我的站,只是在看我的表现如何,表现好就放出来吧!

  下面我把自己被K后所做的一些工作给各位站长说一说,供各位参考!

  1、放弃采集,人工添加数据每天保持更新。最好不要ctrl+C ctrl+V ,应该适当的修改,最好能自己写原创。

  2、多增加友情链接与外链,增加百度的入口。

  3、坚持着每日三更。早上起床,更新一次;中午,更新一次;晚上临睡觉的时候,再更新一次!我不知道这样到底对百度收录有没有用,但我敢发誓,百度重新收录我站的这段时间,我就是这样做的!

  4、在页面上,多讨好百度(增加对百度的友好度)。

  成也百度,败也百度,大家做自己的站,让百度来收录吧!

  以上是我自己的一此看法,希望各位多交流,这是我的新站 http://www.haorx.com 转载请注明版权

三 : 惊现新域名百度5天收录

  先感慨下,我太惊讶.做了这么长时间的网站.大家都知道百度的收录是最慢的.但是5天之内从我的域名注册到被收录只用了5天,你可能以为我在说笑,但是着是真的!

  11号我想去注册两个域名,当我登陆到名富网的时候我发现我的帐号里多了一个域名f64.com.cn 我的帐号里的钱也没少.注册的域名不知道是不是回馈给站长的呀?迷糊中````

 

  

 

  17号的时候我准备做个山东人家地方站,我就用着个域名做了站但是做的时候也没发现什么.18号做的站当天只写了6篇文章,保持一天3篇更新.做站当天就提交到百度和GG了.20号的时候我无意间百度下site:f64.com.cn当时我很诧异,居然我的域名在15号就被收录了.当我跟本就没有解析我的域名.21号的时候我又site:f64.com.cn了一下我更以外的发现我的站的首页被收录了.现在我什么都不想说了.

 

  从注册域名到被收录只用了5天,可能我就是传说中徘徊在牛A和牛C之间的人```!

四 : 周三,百度新收录了100多页

  周三,百度更新网站,我查看了一下,我的网站有170个页面,本次更新之前,总共是74个页面,这一次共收录了100多页。

  收录的页面中,绝大多数是具体的文章页,但没有全部收录,有好些文章,都是自己写的,纯属原创的,在百度的收录中查找不到。标签页收录的标题千篇一律,不知道这样对搜索引擎是不是有好处,在谷歌的搜索中,也有这样的现象,但是谷歌是只要你是网页,它都收录,博客才一百多篇文章,可谷歌已经收录有近四百多的结果了,可看出谷歌的收录是无所不包。对于这一现象,还不知道是怎么一回事,有待以后研究。

  现在百度的收录是苟刻一些的,不是全给你收录,听说原创百度很喜欢,很合百度的胃口,可从现在收录的情况来看,也不尽然。总之,目前对百度是捉摸不透。

  查了下统计,今天从百度来的流量比以前多好几十个,,关键词也多了几个,那是今天百度更新博客的结果,从此可以看出百度的强大,网络上不管别人怎么说百度,但是大家都在用百度,这是一个事实,我们做站的,不得不围绕百度来做。本文首发网站、作者博客:wslearner.com ,新建的一个博客,做得不是很好,欢迎大家的批评指正!

        站长查询工具 http://tool.61k.com

本文标题:百度收录-详谈百度收录过程
本文地址: http://www.61k.com/1138116.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1