61阅读

百度蜘蛛-老站长谈如何把握百度蜘蛛的粘性度

发布时间:2017-12-02 所属栏目:baiduspider

一 : 老站长谈如何把握百度蜘蛛的粘性度

你看了这个题目,可能会笑话我,百度蜘蛛也有粘性度,今天我们就用实例给大家谈谈如何把握粘性度。

一。 网站首页粘性

百度蜘蛛进入你的网站一定是从首页进入,从其它页面进入的机率基本上为1%。从这一点来说,要想把百度蜘蛛给粘住,我们更新网站内容时,一定要让更新的内容上首页。只有当蜘蛛发现首页有变化时,才会顺藤摸瓜的去发现其它页面,去爬其它页面。比如我的站aabc.cn,每天蜘蛛爬行首页的比例占了其它页面比例的五分之一,我每天更新内容不超过五条,全部让它在首页显示,更新五条的时间也不是一次直接更新完,分几次进行更新。你可能要说了,你为什么不一次全部更新五条呢。我想到是想,那样也省事。但是百度蜘蛛可不想省事,人家每天来爬行那么多次首页,每次你就不给点新东西,你认为它还会长期来吗。当我们发现百度蜘蛛爬行首页过多时,我们的更新量同时也要配合它,加大更新量。

二。 内容页粘性

我们大家都知道,一个网站所有的页面,百度不可能全部爬行完,更不可能全部给你收录完,但是我们得想法让它多爬行,只有蜘蛛多爬行了,你站的收录量才会更多。当百度蜘蛛进入首页发现有新内容时,就会立刻爬行内容页。我们在设计内容页的时候,尽可能的设置一些内部链接显示,比如当前排行、今日更新、相关内容。你可能要说了,加了这些内部链接显示,我的内容就显示不了多少呀,没关系你认为加在右面或左面影响了你的内容显示,你加在网站的下面。在说加上这些同时也方便用户查看其它内容,当然也能粘住用户停留时间。在计划设置这些时也不能设置得过多,过多后就会影响蜘蛛的爬行速度,爬行速度影响了,可能你站的收录量到不多。一句话,我们得想法把蜘蛛引到你以前更新的内容页上去。当然内容页的这些内部链接,你得经常换,不要总是那么一些,你经常换了,这样百度蜘蛛爬行的机会才会更大。比如我的站fljsq.cn,设置了这些,从网站后台蜘蛛记录来看,百度蜘蛛貌似非常喜欢。

三。 列表页粘性

列表页对于百度蜘蛛来说,不是那么重要。大家有时间看看自己网站在百度收录量中列表页所占的比重就知了。当然不重要,并不是说对于百度蜘蛛来说没有用,当我们更新完内容时,一定要记住更新列表页,或每天定时的更新列表页。

以上说了这么多,大家可能有疑问了,百度蜘蛛来没有,我怎么知道,这个很简单你可以去查看服务器的记录日志。你如果查看不了记录日志的话,看一下网站后台有没有记录蜘蛛爬行记录的。给大家推荐一款源码露珠CMS,这个建站源码后台能比较清晰的记录各大搜索机器人的痕迹,有各个机器人来访的时间,来访的页面,对来访的详细数据作了分析,进行24小时时间段分析,对各个频道的分析,对你所加的内容的版块进行分析。对各大搜索机器人喜欢你网站的哪个频道,哪个版块都进行了分析,同时也给你提出了补救其它频道和版块的建议,哪个时间加内容收录最快等等。

综上所述,我们每天不但要关注网站的流量变化,更应该关住百度蜘蛛的爬行情况,只有掌握了它们的活动规律,我们更新网站才能得心应手。在些祝大家好运,以上就是我本人的一些看法,谈得比较肤浅,欢迎大家给我指正,与我交流QQ:93065410网站:http://www.luzhuba.cn。

注:相关网站建设技巧阅读请移步到建站教程频道。

二 : 百度蜘蛛(Baiduspider+)爬行返回代码的含义

拥有自己的博客或网站的人都希望百度能收录自已发表的文章,尤其是对运作网站的站长来说,更是希望百度蜘蛛(Baiduspider)多抓取自己网站的内容,查看服务器日志时我们会发现如200 0 0 17571等代码,这些代码是什么含义你明白吗?

下面,以抓取一家网站的访问日志来作为案例:

Software: Microsoft Internet Information Services6.0

#Version: 1.0

#Date: 2011-05-28 16:12:15

#Fields: date times-sitename s-ip cs-method cs-uri-stem cs-uri-query s-portcs-username c-ip cs(User-Agent) sc-status sc-substatussc-win32-status sc-bytes

2011-05-28 16:31:41 W3SVC854 116.254.252.22 GET/news/1032.html - 80 - 220.181.108.179Mozilla/5.0+(compatible;+Baiduspider/2.0;++)200 0 0 17571

注意粗体内容:

date表示记录访问日期;

time访问时间;

s-sitename表示你的虚拟主机的代称。

s-ip访问者IP;

cs-method表示访问方法,常见的有两种,一是GET,就是平常我们打开一个URL访问的动作,二是POST,提交表单时的动作;

cs-uri-stem就是访问哪一个文件;

cs-uri-query是指访问地址的附带参数,如asp文件?后面的字符串id=12等等,如果没有参数则用-表示;

s-port 访问的端口

cs-username 访问者名称

c-ip 来源ip

cs(User-Agent)访问来源;

sc-status状态,200表示成功,403表示没有权限,404表示打不到该页面,500表示程序有错;

sc-substatus 服务端传送到客户端的字节大小;

cs–win32-statu客户端传送到服务端的字节大小;

1**:请求收到,继续处理

2**:操作成功收到,分析、接受

3**:完成此请求必须进一步处理

4**:请求包含一个错误语法或不能完成

5**:服务器执行一个完全有效请求失败

100——客户必须继续发出请求

101——客户要求服务器根据请求转换HTTP协议版本

200——交易成功

201——提示知道新文件的URL

202——接受和处理、但处理未完成

203——返回信息不确定或不完整

204——请求收到,但返回信息为空

205——服务器完成了请求,用户代理必须复位当前已经浏览过的文件

206——服务器已经完成了部分用户的GET请求

300——请求的资源可在多处得到

301——删除请求数据

302——在其他地址发现了请求数据

303——建议客户访问其他URL或访问方式

304——客户端已经执行了GET,但文件未变化

305——请求的资源必须从服务器指定的地址得到

306——前一版本HTTP中使用的代码,现行版本中不再使用

307——申明请求的资源临时性删除

400——错误请求,如语法错误

401——请求授权失败

402——保留有效ChargeTo头响应

403——请求不允许

404——没有发现文件、查询或URl

405——用户在Request-Line字段定义的方法不允许

406——根据用户发送的Accept拖,请求资源不可访问

407——类似401,用户必须首先在代理服务器上得到授权

408——客户端没有在用户指定的饿时间内完成请求

409——对当前资源状态,请求不能完成

410——服务器上不再有此资源且无进一步的参考地址

411——服务器拒绝用户定义的Content-Length属性请求

412——一个或多个请求头字段在当前请求中错误

413——请求的资源大于服务器允许的大小

414——请求的资源URL长于服务器允许的长度

415——请求资源不支持请求项目格式

416——请求中包含Range请求头字段,在当前请求资源范围内没有range指示值,请求也不包含If-Range请求头字段

417——服务器不满足请求Expect头字段指定的期望值,如果是代理服务器,可能是下一级服务器不能满足请求

500——服务器产生内部错误

501——服务器不支持请求的函数

502——服务器暂时不可用,有时是为了防止发生系统过载

503——服务器过载或暂停维修

504——关口过载,服务器使用另一个关口或服务来响应用户,等待时间设定值较长

505——服务器不支持或拒绝支请求头中指定的HTTP版本

上以这些代码,有些或许你从来都没有见到,那是好事,呵呵,见到了说明网站有问题了,那就要对号入座,好好分析一下在日常的操作中有什么不当的地方,及时改正,毕竟,网页只有被搜索引擎收录并放出来了,别人才能看到。

三 : 百度蜘蛛更新时间表

百度蜘蛛更新时间表

步骤/方法

百度更新时间基本上以周为单位
星期一
这天百度蜘蛛会在网站上面爬的很勤快,所以是我们更新文章的好时候,一般早上8-10点的时候更新文章最好。
星期二
如果星期一没有更新,星期二还可以补救,因为星期三关键词会有一次更新,可能影响排名。
星期三
这天百度会大更新一下,凌晨(1:00—4:00),这天也是整个星期最动荡的一天,是让人又喜又恼的日子,可能你的网站快照回退得很远,可能你的排名升的很高,不过这天不能决定整个星期,主要在星期四。
星期四
星期三也许是百度服务器调整,到了星期四的凌晨(1:00—4:00)百度会把星期三的大动荡稳定住,这一天的更新会决定下个星期的排名,而且基本不会动了。
星期五
这天可以轻松一下,因为星期四的更新排名已经基本上定型了,可以更新下文章。
星期六
这天也会有小小的更新,但是没有星期四那么大,也不会像星期三那样动荡,可以看做是星期四更新的补充。
星期天
可以舒口气,休息一天,但也做好准备,下个星期再接再历。

综合来说,百度每周90%的大更新是在周三、周四这两天,这两天可以决定你的网站在百度上一周的排名。

百度每月会有一次到二次的大更新,一般是在每月11号、26号(或者是月底),就目前来说不影响网站的排名。

据江湖传闻:百度的排名是百度员工操作的。它的更新时间是上午的9:00—11:00,下午的2:00—5:00。由此看来很有可能,因为都在上班时间。不过这个谁都不确认,也只是传闻。

本文标题:百度蜘蛛-老站长谈如何把握百度蜘蛛的粘性度
本文地址: http://www.61k.com/1099967.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1