61阅读

百度收录快的发帖网站-解读百度的网站收录和网站清除规则

发布时间:2018-04-15 所属栏目:搜索优化

一 : 解读百度的网站收录和网站清除规则

  本篇文章来源于 麦田里的守望者

  在网上见到一网友发的一个帖子,要求百度制定搜索收录规则,而实际上百度早就已经制定了名为《百度与站长》的建站指南,公布了如何让网站被百度收录,什么样的网站会被百度拒绝收录或抛弃等相关条款。

  百度相关规则的全文见于《百度与站长》,仔细阅读完毕,可以得出,一个站点被百度拒绝收录或惩罚的可能原因有如下几条(注意:每一条后面加上了对应的分析):

  1、在标题中堆积与正文无关的关键词。

  强调了标题和网站内容的相互呼应,如果标题中涉及到某一关键词,而实际网站内容中与该关键词无关的话,那么可能会百度删除.这一条款反映了百度的严格.但值得思考的是,百度是用什么方法去判断网站的内容与标题关键词的相关性呢?是不是标题出现了某关键词,正文就一定要出现呢???如果不是,那么百度目前的搜索技术难道能象人一样,会从意义和逻辑上去分析?比如机器能不能判断区标题中的亚克力跟正文中提到的有机玻璃是同一个意思呢?当然,如果百度全部采用人工审核站点,那么这一条就非常好,非常有操作性!但是这样又出现一个问题,人工审核相关不相关,以谁的说法为准?

  2、使用自动跳转的页面,可能会被百度丢弃。

  这一条不需多评论,主要针对一些作弊行为采用的跳转。大多数搜索引擎都会有类似的条款。

  3、在同一个页面上,不要有过多链接。在那些站点地图类型的页面上,请把重要的内容给出链接,而不是所有细枝末节。链接太多,也可能会导致无法被百度收录。

  究竟多少连接,才算过多?Google好歹还建议最好不要超过100个,百度呢?百度凭这一条就可以任意的惩罚大部分的大型站点,大部分的大型站点首页都有了那么好几十个甚至好几百个连接的.

  4、如果您的站点做了很多针对百度的优化,但却给用户带来大量负面体验,那么,您的站点最终可能还是会受到百度的冷落。

  什么叫过多针对百度的优化呢?能不能有详细一点的标准?虽然这句话的意思是非常好,似乎任何一个有良知的网民都应该叫好,但是关键问题在于具体操作标准是什么?过度优化和负面体念,任何人都有不同的看法。比如我就是觉得百度搜索结果第一页全是广告,影响了我的感受,是不是该删除?

  5、对于已经被重复了千百遍的内容,百度可能会不予收录。

  这一点,不做评论。只是提醒大家复制内容也要找一点有新意的。

  6、与一些垃圾站点做友情链接,很可能会使您的网站受到负面影响。

  因此,当有人很热情的要求您为他的站点提供友情链接时,请审视以下两点:

  a、对方的站点在他那个领域是否是高质量的?站长间所谓的流量以及排名,很多都是用欺骗手段获取的,无法保持长久。

  b、对方要求的链接名称是否和对方网站地位相称?用一个涵盖范围广泛的关键词来做一个内容非常局限的网站的链接名称,很可能会使您的网站受到负面影响。

  百度这一点,就有点太过天真了,百度惩罚了一个站点,也可以根据这一点任意的解释。如果你的网站上有几个连接,中间有那么一个连接名称和对方地位不相称的话,就可以找理由抛弃你的站点。

  7、如果您的网站内容有不符合中国法律的地方,则无法被百度收录。

  这一点,无需多言。

  8、如果您的站点页面结构复杂,则可能无法被百度收录。

  结构复杂导致无法收录的可能原因,百度只提到了上面的1、2、3点。

  9、百度并不允诺能收录所有站点。

  我们尊重百度的自由。当然百度如果不需要尊重用户,他封杀任何一个站点,都可以用这一点解释,而且让人呀口无言。

  10、如果您的站点中的网页,做了很多针对搜索引擎而非用户的处理,使得:用户从搜索结果中看到的内容与页面实际内容完全不同,或者站点质量与站点在搜索结果中的排名极不相称,从而导致用户产生受欺骗感觉,那么,您的网站就有可能被百度丢弃。

  这两点,靠机器是审核不出来了,只用人来定了。什么叫不相称。什么叫被骗,就只有公说公有理,当然百度是老大,他的反作弊小组成员说了算!依据此理由,可以删除不知道大部分站点。看样子以后百度得要求网站提供相关的权威和行业地位证明书,这样才能获得对应的排名,否则一律删除!

  11、如果您的站点上的网页,大量都是复制自互联网上的高度重复性的内容,那么,您的站点也有可能被百度丢弃。

  见第5点的分析。

  通过上面的条款和具体分析,发现百度大部分的条款都是过于主观,宽泛的,大部分的条款在实际操作中,只能依靠人并且该人当时的判断和情绪来定。根本不可能保证公正公平!依据这样的条款,几乎可以任意的删除和封杀目前至少50%以上的网站。比如搜索新闻的时候,中国新闻网(www.chinanews.com.cn)排在第二位,主要百度喜欢,完全可以根据站点质量与站点在搜索结果中的排名极不相称为理由来删除,而中国新闻网又可以拿什么来证明他们的网站确实有资格排在第二位,仅次新浪新闻呢?

  显然,以上的条款完全是从百度的意志出发,从制度上也确实为百度大规模的清除或肆意惩罚站点清除了障碍,这样的条款,谈何无公信力?所以才会出现百度虽然有条款,却有人觉得不满要起诉,虽有条款,还有人呼吁要百度制定相关条款的事件!看样子,百度如果要真的做到让人信服,还真的有必要仔细研究一下相关的条款该怎么写了。

二 : 百度站长平台:将加快对“新好站”的挖掘收录

百度站长平台 百度搜索引擎 网站惩罚 网页抓取

(图为百度站长平台高端沙龙上海站)

在百度站长平台上海站的高端沙龙上,发布了一项新计划计划——对新好站的挖掘和收录,可谓是对广大年轻但又优质站点的一大福音。

“新好站”,顾名思义:

“新”——网站成立时间较短,这里需要指出的是,“新”也包括大型网站的二级域名;

“好”特别体现在服务稳定,响应速度快;满足用户特定的需求,尤其是目前尚未满足的需求;有一定的社交传播度。

以上这些是对于新好站判断的有利参考。

新好站的福利

宽进严出——一旦站点被认为是“新好站”,百度会加快对网页的抓取速度,进一步审核站点质量和网页质量,如果符合要求,直接提高收录速度。

奖惩分明——优质则以加快收录等作为奖励;违规作弊则将受到惩罚。而奖惩制度也将变得透明化,比如因为什么受到惩,受到何种惩罚百度都会告知。

马太效应——每一个站点都会有自身的信用评价体系,整个成长历程都将被记录下来,在数据挖掘过程中,百度会参考网站的历史表现,这将会使得优质网站变得更为优质,而曾经有过负面行为的网站提升改进的成本更高,难度更大。

三 : 网站快照不更新导致网站没收录禁忌使用的做法

一个新站快照不更新确实是站长最头疼的一件事,我们做网站优化的,一切都是围绕着搜索引擎开展的,特别是一些新站,上线半个月甚至许久都没有快照,虽然快照是一种工具,但是一个新站快照都没有这是让站长坐于待毙。

急中生智不行,那么我们就得去分析网站哪方面是不是出错误了,哪些问题是需要改进的,从而使网站给百度收录。

网友提问到:

新网站多久会收录啊??等了快一个月了,为什么百度还不收录?网站上线当天也提交给百度了还有谷歌各大搜索引擎都提交了,并做了一个PR4和一个PR6的友情链接,网站每天都会去更新虽然都不是原创的但是都是别人那里买来的伪原创文章,也有做好内链,每天做10几个有时候20多个外链,可是网站就是不收录这是为什么呢?快照一直没有,急啊!!

笔者:

新站快照一般都是半个月和一个月左右时间,也有些网站很快就能得到百度的快照,新站上线的话百度收录的时间不等,可以查看下网站日志,看是否有百度蜘蛛抓取记录,还有就是一个细节,做网站设置上去的robots.txt阻止蜘蛛抓取的,看是否没删除掉,通常新站做几个高权重的链接以及都有去发外链都是能让蜘蛛来抓取的。如果这些都未能解决,那么你可能打出了一套“七伤拳”我给大家一一指出:

⑴ 内容都是些采集重复内容过多

这是一个新站最不该使出的损招,有些新站长为了省时省力,为了快速的填充内容,而使用采集软件来填充自己网站的内容,采集回来的大多数是些没有一点价值的内容,没有经过加工的,也就是跟他人的内容是重复的,而百度的数据库中已经存在这些内容了,再大的数据库都会有负担,蜘蛛已经收集过这些内容了,就不会再来收集了,蜘蛛第一次来第二次来还是如此,那么他就不会来第三次了,这是百度快照没有更新的原因之一,也是站长打出的“七伤拳”之一。

⑵ 网站长期未更新

上述说的跟这恰恰相反,网站内容是搜索引擎抓取的第一个目标,而你的网站本来页面就少,没有新鲜的内容给蜘蛛抓取,就好比你的网站是一家餐厅,蜘蛛是来你这吃饭的,第一天来你说没有菜了,第二天来你又说没有了,那么客人还会来第三次吗?换成谁都不会来,这也是些站长没有注重网站优化的原因,这也是站长使出“七伤拳”的原因之一。

⑶ 网站未建好而过快提交网站视为改版

很多粗心的站长,在网站没有建好的情况下就提交自己的域名给各大搜索引擎,这一类很少,但是也有,还有就是网站上线后,就过分的改版,网站改版虽然是正常的事,但是对于一个新站应该先建好了,再上线,不然这是对搜索引擎极度不友好的,不能随意的大动干戈的去改动,对原本的网闸结构改动太大了,就算你的快照更新了,也很容易让百度快照回档,如果真的要改版,笔者SEO空城建议大家改版是需要技巧的,尽量的减少改版给网站的推广带来负面影响,这也是站长使出的“七伤拳”的原因之一。

⑷ 网站标题以及关键词的修改频繁

很多新手站长觉得自己的网站的快照还没有,就过度的去更换网站标题,以及添加关键词,等百度快照有了,就可以完美的呈现给大家了,其实这一种错误是最低级的,以为标题、关键词使快照不更新的原因,其实不是的,什么标题什么关键词百度的蜘蛛都会抓取,如果你频繁的去改动标题和关键词这会使蜘蛛搞不清楚你的网站究竟是做什么的,你一下就让百度蜘蛛弄混了头,这不是对蜘蛛的不恭敬吗?笔者SEO空城建议新手站长在网站上线之前就先定义好自己的网站主题以及关键词,这也是新手站长使出的“七伤拳”原因之一。

⑸ 站外链接过度优化

刚上线的网站,外链不宜太多,有些站长一开始就拼命的去各大论坛各大平台上去发链接,每发一条就开心一下,朋友你这是白开心啊,这是会受伤的,这很容易让百度觉得你是在作弊很容易受到百度的惩罚的,也会出现百度快照回档甚至更严重的后果就直接K掉了,毕竟你的是新站不可能就一下的去发布太多链接,新站是有考察期的,如果一个新站你一下吃太饱是会消化不良的,所以外链优化不能操之过急,这也是站长使出的“七伤拳”原因之一。

⑹ 友情链接连带反应以及不相关的网站做链接

很多新站以为一开始只要添加一个高权重的链接就能是快照更新了,这想法是错误的,这个高权重的链接第一一定要与自己的网站是相关行业的,不然会视为作弊的,特别注意的是在互换链接的时候,一定要搞清楚对方的网站是不是作弊的行为,是不是一个健康的网站,如果你链接的一个不健康的网站,如果他的网站被惩罚过,跟他做链接的网站也会受之牵连的,遇到这种情况一定要尽快的去处理掉这样的网站链接,以免真的造成连带反应,这也是站长使出“七伤拳”的原因之一。

⑺ 服务器或空间不稳定

服务器跟空间如果不稳定的话是会影响到网站的整体运行的,无论是用户还是百度蜘蛛,都会产生阻碍,一个网站那么难打开,换成是谁都没有耐心的去等待打开为止,建议在购买服务器或空间的时候要选择一家比较有实力的空间商去购买比较好的,因为你的网站是需要长期运行的,不然是会前功尽弃的,这是站长使出“七伤拳”的原因之一。

七伤拳打出去就自我伤害的,所以站长们千万别使出这七伤拳,这些都是会是网站快照不更新,百度不收录的原因,请谨记。

四 : 影响百度收录的网页相似度你解决了吗?

  页面相似度有什么危害?

  在提及页面相似度的危害之前,先来解释下蜘蛛爬取网站并解析网站的过程。首先蜘蛛爬取页面时抓取的是整个页面的源码,然后再进行分析。它并不会像人阅读网页一样会自己选择有用的,所以当相同的内容过多,蜘蛛就会认为页面内容重复。使搜索引擎对网站整体权重的判断下降并且引发收录不是很理想,难以获取排名等不利影响。

  两个页面检测结果如图所示:

  A页面:

  B页面:

  如果当两个页面的相似度达到80%或者以上,那么搜索引擎就会认为两个页面完全一样,从而删除一个页面的收录。如果是大量这样的页面,搜索引擎甚至会删除所有的收录,直接K(封闭)站。

  页面相似度的解决办法

  1、企业站的相似度处理?

  企业站产生页面相似度的常见问题:

  1)全站的调用,新闻、技术文章,关于我们到每个页面,导致多个页面相似度过高的问题,撤掉,我们可以改为人工推荐

  2)产品页的参数过的、大致一样,真正有利于用户搜索,对用购买成交的信息内容几乎没有,同有的竖排导航,以及底部的交易方式,售后服务,都是共同的样板,大量的这样的页面相似度很高,也不利于权重获取和网站排名。

  多个页面文字信息很少,以图片或视频为主的页面相似度很高,要增加文字信息,可以降低相似度,同时也会更利于搜索引擎收录。多个这样的页面要增加文字的信息才好!

  如果是两个页面大致一样,可增加内容降低相似度,也会利用搜索(搜索引擎主要抓取文字信息);

  2、商城网站类相似度过高问题?

  首先我们来讲述下一般商城网站哪些方面会产生页面相似度的问题,然后再实际解决每一个问题。

  1)消费者保障、购物指南、物流配送等之类的申明

  2)商品页的产品参数多、文字内容过少(可以做到图文并茂展现)

  3)尽量避免无内容,多个参数选项的空白页面。

  4)内容主要以图片为主、文字内容少导致相似度高

  下面我举例来说明常见的几个问题:

  案例:

  1)商城类网站每个页都有的:购物指南、会员注册、购物流程、常见问题、支付方式;这个精简到只在首页有即可。如果全站有友情链接,改到首页有就可以了,如下图:

  2)同一个产品,多个型号,我们在对待这个问题时,往往并没有注意到,当点击不同类型的产品时,只是图片会变化,产品的信息内容是没有变化的,这样就造成了多个相似页面的问题,建议大家可以用以下方式来降低相似度问题:

  第一种:只做一个页面,增加一个可以变化选择的参数——度数。而且这样还能节省用户的点击选择时间。

  第二种:还要做两个页面,而且2个页面基本一样。使用 rel=“canonical”代码指定一个权威页面让搜索引擎只收录其中一个页面并且给予好的权重。(针对一些企业网站同页面中有多型号的产品也可以使用)不然的话,只能在内容上下功夫解答相似度高的问题。

  3、其它页面相似度解决办法

  1)不重要的内容(这里是指对关键词排名不起作用的内容)但是对用户解决疑问有用处的内容,我们可以采取图片的形式来处理;

  2)站点广告可以采用外部JS文件调用,这不光是降低相似度的好处,还能提升网站内容的相关性。

  3)尽量使用丰富的文字性的内容来描述语言

  4)全局性的内容尽量少出现

  总结:以上我们讲到了对于各种页面相似度解决的办法;不解决这些问题我们的网站是不可能收录的,但是这只是解决了相似度问题,站内优化的好与不好也是影响收录和关键词排名是否上前三的直接因素。

本文标题:百度收录快的发帖网站-解读百度的网站收录和网站清除规则
本文地址: http://www.61k.com/1115768.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1