关闭
关闭

61阅读

教学中的互联网搜索-互联网产物“人肉搜索” 利器还是凶器?

发布时间:2018-05-14 所属栏目:教学中的互联网搜索

一 : 互联网产物“人肉搜索” 利器还是凶器?

  据消息报道,深圳市律师协会正在起草的《深圳市个人信息保护条例》,由此引发了深圳市民的极大关注。对于“人肉搜索”,现在的网民都不陌生,互联网就是个大熔炉,什么都有,作为人肉搜索,在大众的眼中,是相当有争议性的,网友说法各不相同,正方觉得,可以禁止不良人士利用人肉搜索进行人身迫害;反方认为,人肉是有效的监督利器,能倡导社会正义。事实上,我们需要多方面分析,做一个理性的分析。

  案例重现

  09年初,某家上市公司“被人肉”,当时,众多的公司信息与资料出现在了各大投资论坛和股吧,引起上市公司的局势动荡。同年,一名驾车女子因与路边摆摊大爷发生纠纷,下车扇了大爷耳光,上万网民人肉搜索,将当事女子的住址、工作单位及“三围”曝光,后该女子下跪道歉仍未得到网友谅解,导致该女子轻生。

  10年,唐骏的“学历门”引发了网友对名人资料的人肉。很默契的,在当天消息后,诸多的明星、名人开始主动“人肉”修改自己在互联网的监理资料等。据当时据百度百科相关负责人透露,事件发生后,至少上百位名人的词条都有不同程度的更新。在名人、明星的主动“自我人肉”中,百科、博客、新闻网站、实名SNS社区等最被重视。

  有些人肉是被迫的,而有些人肉却是引导性的,比如说网络代表人物:芙蓉姐姐、凤姐、小月月等。当然,还有不那么雷的,比如“我爸是李刚”,在这件事件中,如果不是网友们的人肉,也许会存在事情过后销声匿迹。所以,对于网民来说,人肉不是简单的娱乐,同时也是监督的利器。

  人肉搜索存在着越来越大的舆论影响力,有时候甚至被誉为“民意体现”、“反腐利器”。但它的存在如何正确使用得当,却受到了各界的议论。

  在09年12月,阿里集团董事马云就曾说过:一方面我们很恨互联网的人肉搜索,但我愿意大力发展人肉搜索,去把那些不负责任的企业,那些往江里倒化学物品的人,揭露出来,银行应该停止对他们的贷款,所有年轻人应该不买他们的产品。”

  作为互联网是个开放的平台,个人隐私是相当容易暴露的,一不小心,就“被肉”后生活随之将被严重骚扰,这对当事人造成的心理压力可想而知。也同样让众网友心有余悸。

  在09年,《徐州市计算机信息系统安全保护条例》中就有规定:未经允许,擅自散布他人隐私,在网上提供或公开他人的信息资料,对发布者、传播者等违法行为人,最多可罚款5000元;情节严重的,半年内禁止计算机上网或停机;一些违法的单位,还可能面临吊销经营许可证或取消联网资格的处罚。

  浙江人大也有类似规定的起草,其中写到:“采集社会组织或个人的信息,应当通过合法途径,并依法合理利用。任何单位和个人不得在网络与信息系统擅自发布、传播、删除、修改信息权利人的相关信息。”在今年的7月1日开始,《侵权责任法》就已经正式实施。

  如何健康发展

  专家看法

  北京信息网络法律事务专业委员会主任:人肉搜索,有可能侵犯公民的隐私权,但是并不必然侵犯隐私权。人肉搜索作为获取知识和解决问题的一种信息处理的复合工具,并不违法。但是,在发起人、参与人的行为目的、行为方式以及参与内容等方面,存在违法、甚至是犯罪的可能。

  互联网研究者表示,“人肉搜索”有助于提高社会公德。它能够让丑恶行径原形毕露。但“人肉搜索”目前确实存在着过火现象,尤其是它与谩骂、骚扰等行为结合起来,确实在一定程度上存在着侵犯他人隐私权的嫌疑。

  律师说法:“人肉搜索”应有底线

  廖律师表示,“人肉搜索”有一个底线,那就是在不侵犯隐私的前提下进行,比如,网友们用盗密码进入空间,窃取照片等形式,明显就是网络暴力,是一种侵权行为,作为网民需要更加理智的对待人肉搜索。

  网友说法:人肉搜索可以规范其使用范围

  网友:“事实上人肉搜索容易被滥用,正如一把刀切菜快是好事,但用来杀人就是凶器了。所以对待人肉搜索最重要的是要规范它的使用范围、程度和责任义务。”

  深圳人大代表:在舆论监督的范围内,人肉搜索是合情合理的,这对于预防和揭露贪污腐化都有着积极的作用。像公务员、政协、人大等职能部门相关人员的信息都应该更加透明化,但普通公民的隐私内容则应该和公职人员区别开来。

  来源: http://www.ok.net.cn/blog/?post=797  声明:转载请保留来源,谢谢合作。

二 : 帮你找好图!99%的互联网从业者都要学会的图片搜寻方法

  @珞珈Carlos :收藏了十几个图库,依然搜不到好图片?那就别错过今天这个教程!这个「图片搜索」系列,不仅教你学会如何榨干一个优秀的图库,而且还附上了那些无法另存的图片的下载方法,本文是第一二部分,站点推荐和下载技巧篇。

  图片力量教程分为三个部分:

  站点推荐篇

  下载技巧篇

  搜索技巧篇

  曾经有同学问我关于搜索图片的问题,把他的网站收藏夹截图发给我,一打开我就懵逼了,小小的收藏夹里面居然有数百个网站。这位同学反应了一个问题,收藏本身的作用,是在全球海量的网站中挑出自己最喜欢的那个,而大多数同学都是见到一个就收藏一个,好不好用,适不适合自己用都没有整明白。

  收藏夹数量少的时候还好,可能会用,但是有一天数量大到一定程度,本身就失去了收藏的意义了。

  其实,真正想提高自己的对于图片的搜索技巧,与不停换着网站去搜索相比,不如努力尝试用一个网站搜索出自己想要的结果。

  毕竟每个网站都有着自己的特色功能与内容倾向,与收藏更多的网站相比这些才是我们应该明白的。

  能够拿来长期使用的图片网站有哪些?

  500px

  

 

  如果只能推荐一个网站的话,我会毫不迟疑的去推荐500px,这是全球最老牌的摄影分享社区,这里面汇聚了全球各种各样的优秀摄影师。 我们基本上可以在这里面找到任何我们需要的图片。

  无论是你是想找到静态摄影:

  

 

  还是合成摄影:

  

 

  大部分人,一上500px都是马上就去搜索所需要的关键词,诚然,500px的搜索功能非常重要,但是搜索其实真的只是最入门的玩法,毕竟这是一个社区,如果我们遇到一个合适的摄影师,要的应该是毫不留情的去关注他。

  所以,当我们去尝试使用500px 的时候,第一步可以参与500px提供的口味测评,按照他们给出的结果去关注筛选一些摄影师。

  再教给大家两个小窍门

  1. 看摄影师关注了哪些人,然后再去关注他们。

  2. 看摄影师收集哪些作品,然后再从作品中找到作者。

  逐渐形成自己在500px偏好的照片口味,然后按照你的口味去筛选照片,这些才是我们应该在一个社区最应该存在的一个功能。

  奉上膝盖!网上有哪些脑洞打开且风格独特的摄影师

  

 

  千万不要只是把500px当做搜索工具。就像我们没人会把微博当作网易,新浪之类的门户网站,我们更偏向去阅读自己喜欢的内容。

  等到有一天你登陆到500px发现你的主页全是你喜欢的作品,当你需要一种风格的图片的时候,你可以很快的从关注的摄影师中找出这个风格的大拿,这种满满的幸福感才是我们所需要的。

  google

  google是我最喜欢的图片搜索引擎,因为是搜索引擎的原因,所以会收录各种各样的网页上,所以图片库毫无疑问是所有网站中最大的,但是质量就会参差不齐,然而,这些都不重要,最重要的是我们可以进行组合各种条件进行筛选,直到筛选到我们觉得合适的图片。

  而google作为一个综合站点,最强大的是他的筛选功能。

  

 

  他的筛选功能隐藏的比较深,需要点击search tools 这个按钮才能够弹出。

  

 

  筛选功能非常强大,简单介绍两个。

  第一个是尺寸筛选,我们可以在结果中筛选出想要的大小。

  

 

  第二个是筛选图片整体颜色风格,我们可以自行筛选所需要的颜色风格,当然最爽的在于可以筛选出透明底图。

  

 

  当然,其实因为google综合性特别强,最重要的反而是我们对于搜索词汇的优化,这个我们下篇再讲。

  Giphy

  Giphy 是一个非常有趣的图片网站,整个网站笼络了全网各种各有有趣的gif动图。

  

 

  这些动图不太实用,但是GIPHY是全球最大的GIF图墙地址,所以会有很多的设计师和艺术家把他们的GIF图片上传至这里。

  GIPHY专门开辟了一个艺术家板块来放置这种类型的图片。

  

 

  而这些可爱和抽象性的动图是我们可以利用的。我们可以放一些在你的幻灯片背景,作为修饰性元素,提升页面整体质量。

  这些非常有规律性的图片动图还能作为幻灯片设计的重要灵感来源。

  Wallheaven

  

 

  Wallheaven和上面推荐的几个网站不同的在于wallheaven是以壁纸居多,所以整体在图片的选择上更加面向艺术性和设计感。

  如果你需要的关键词能在这里找到图片的话,基本上就无需任何筛选,质量高到直接使用即可。

  

 

  当然,还是那句话,搜索只是针对初级用户,wallheaven 的强大在于他拥有非常多的用户去每日不停的上传各种各样漂亮的壁纸。

  所以wallheaven建立了一个用户论坛。

  Alpha.wallhaven.cc

  

 

  其实跟主站比起来,这里来时宝藏,因为有一群逗逼跟热心的用户,所以里面经常会发起一些非常有趣的话题。

  你看过的最酷的图片有哪些? → Alpha.wallhaven.cc

  

 

  wallheaven里丑的飞起的壁纸有哪些?

  

 

  甚至在论坛上会有一些用户把自己的收藏夹公开做一些分类推荐,如果你有需要某一类的图片,你可以在论坛上搜索有没有相关的用户做过收集。

  比如我搜索Low poly 的出来的结果。

  

 

  我点击楼主的头像,点击他上传的文件。

  

 

  里面有着不少这个风格的图片,那我们就毫不客气的都收下了~

  

 

  上面一共推荐了四个网站,但是大家应该能够看得出来,和推荐网站相比,我更偏向去教授使用方式,毕竟每个网站都不一样,和大量收集比起来,我们更应该花心思在弄清楚这个网站的使用方式和内容偏向。

  只有这样我们才能真正弄清楚这个网站,让它真正在我们的工作和生活中起到作用。

  下载技巧篇

  由于不少站点对图片下载进行了限制,我们无法直接在图片上点击右键进行下载。所以,在这里我给大家推荐一些我常用的图片下载方式。

  国内有不少浏览器都带有一键下载图片的功能,如360浏览器,UC浏览器等等。 我们可以非常方便的在图片上直接按住键盘alt键和鼠标左键即可一件下载。

  上面两种方式对于仅仅是屏蔽了右键下载的网站是有效的,但是对于改变了图片链接的500px则是无效,在这里给大家推荐两种方式来下载500px的图片。

  花瓣

  花瓣采集工具是一款灵感收集的工具,我们可以使用花瓣去全网收集我们各种各样喜欢的图片,兼容chrome浏览器,360浏览器,火狐浏览器。

  安装完毕之后,我们只需要在想要收集图片的左上角的采点一下采集,然后选择合适的画板即可。然后我们登录花瓣网,找到采集的画板,里面就会有我们所采集的画板。

  但我们该如何利用采集插件去下载图片呢?

  1. 我们在500px找到一个好的图片的时候,我们在图片上右键点击在新的标签页打开。

  2. 等新的标签页加载完毕之后,点击浏览器的花瓣插件按钮,选择采集图片/视频

  

 

  3. 然后会打开采集页面,我们挑选出想要下载的图片,直接鼠标左键下载到桌面即可。

  那是否可以批量下载图片呢?只要用花瓣结合豆皮图片下载器就可以了。

  1. 我们先在花瓣的个人主页建立一个新的画板

  2. 我们使用花瓣采集助手将所需要下载的图片逐个采集到这个画板中。

  

 

  3. 我们回到我们的花瓣主页找到并且打开这个画板,然后把这个画板的网址复制到剪切板。

  

 

  4. 我们打开豆皮图片下载器,将地址粘贴至窗口中,然后点击下载即可

  

 

  等待豆皮下载助手帮我们逐个下载即可

  检查/审查元素

  当然,相比使用花瓣采集插件,我们也可以使用最万能和最强大的检查功能,chrome浏览器与360浏览器都携带有这个功能。

  1. 我们在500px的图片浏览的网页中,在非图片区域点击右键,选择检查按钮。

  

 

  2. 在弹出来的工具栏里面找到选择元素

  

 

  3. 然后我们选定图片区域

  

 

  4. 在下面工具栏中找到开头为标签的最长的一行代码,找到原始图片所在的链接,点击右键在新的标签页中打开。

  

 

  5. 然后在新的标签页中我们直接右键下载到桌面即可。

  

 

  以上就是图片下载的几种比较快速的方法,希望大家可以学以致用。

三 : 3721、有道搜索、快播……那些轰动一时最后失败的互联网公司

  摘要:3721的失败有多重原因。首先则是百度和cnnic对于3721的激烈竞争,使得3721的市场份额有所下降。其次则是3721对cnnic和百度的司法诉讼,3721的失利使得3721的品牌声誉下降。

  1、3721

  3721的名字由“三七二十一”而来。3721公司由周鸿祎创立于1998年,至2008年,一直专注于中文上网服务,是中文上网服务的开创者和行业领导者,直到后来3721收购方雅虎中国放弃发展3721,3721在中国互联网失败了。

  3721大事记

  2001年10月,3721公司率先在中国互联网企业中宣布盈利。

  2003年,雅虎斥资1.2亿美元收购了3721公司。

  2008年,3721公司在华东、华南、华中、西北、西南设有分支机构,业务遍及中国内地所有县级以上城市,及中国香港、中国台湾、中国澳门,拥有近4000家的渠道合作伙伴。

  2009年1月4日,中国雅虎正式放弃发展3721(雅虎助手)的业务的发展。

  3721的失败有多重原因。首先则是百度和cnnic对于3721的激烈竞争,使得3721的市场份额有所下降。其次则是3721对cnnic和百度的司法诉讼,3721的失利使得3721的品牌声誉下降。而其后的百度和3721的无序竞争使得用户苦不堪言。到最后3721为雅虎中国收购后,由于雅虎中国(阿里巴巴彼时已收购雅虎中国)的发展重点是在围绕阿里巴巴,故而3721的发展逐渐放缓。致命的一击来源于360对3721的诛杀,自此后雅虎中国放弃了3721(雅虎助手)的发展。

  2、有道搜索

  网易于2006年底推出有道搜索测试版,而在2007年12月11日推出正式版。网易推出搜索的原因可以追溯到2004年,那个时候谷歌还占据30%的份额,百度已经迅速占领半壁江山,但是突然之间,门户们开始纷纷杀入搜索市场。当年8月,搜狐率先推出了“搜狗”,次年7月,新浪推出了所谓的互动搜索“爱问”。

  12月,腾讯也推出了独立域名搜索网站“SOSO”。相比其他几家,网易的动作是最慢的,当05年其他三家都已经推出搜索产品时,丁磊与网易高级副总裁周枫才“定下了做搜索的基调”,一年后,“有道”测试版上线,07年底,正式版推出。

  网易对于有道搜索可谓寄之予厚望,投入可谓巨大。有道搜索一度被整合到网易的各个产品线中,包括调整网易首页、将搜索框置于醒目位置,与网易博客及多个频道达成搜索推广,在邮箱中设置搜索入口,与网易微博一起推出实时搜索,甚至还和核心产品梦幻西游一起推出了游戏搜索,但是,这些都没有带来预想中的大批用户。即使在谷歌搜索业务退出中国时,它与SOSO一起瓜分了谷歌的代理商并自建了广告联盟,也没能在搜索市场上拿下更多份额。

  而在正式版推出的三年后,也就是丁磊希望有道能超越百度成为第一的那一年,根据易观的统计,有道仍然只有0.4%的市场份额,远低于排名第三的搜狗。360异军突起后,根据CNZZ 6月的数据,有道的份额仅剩下0.25%,甚至还低于雅虎。

  2013年8月2日,360与网易有道联合宣布在搜索业务达成新的战略合作,从即日起,360搜索(so.com)将为有道搜索提供技术支持服务,用户在使用有道搜索时,搜索结果将由360搜索提供,在页面的右上方将会有“360搜索提供技术支持”的标注。

  有道搜索失败了。这里的有道单纯的指有道搜索,不包括有道移动互联网产品,比如有道翻译、有道云笔记等。

  有道搜索的失败原因在于当时国内搜索市场格局基本稳定,而对手实力异常强劲,其次在于搜索引擎壁垒深厚,用户习惯形成。而搜索引擎的投入巨大,而网易的主要盈利点来源于游戏,对搜索引擎的投入

  相较于游戏较少,随着有道搜索成本的投入而市场份额始终没有突破,网易则选择放弃了有道搜索。

  3、快播

  快播(又叫Qvod或Q播)是一款基于准视频点播内核的、多功能、个性化的播放软件。在各种因素的推动下,快播发展速度异常迅猛。快播成立于2007年,搭上了P2P技术的快车,相继开发了“快播”服务器软件和“快播”网页播放器。2011年后,“快播”已成为全国市场占有量第一的播放器。2012年9月,“快播”总安装量已超过3亿,而截至这一年的6月,中国网民数量为5.38亿。

  然而随着国内正版化的发展,国内视频网站的的版权购买费用水涨船高,而快播的盗版则使得视频网站的高额投入无法得到相应的回报,故而视频网站则对快播恨之入骨,除之后快。

  据新闻报道腾讯曾于2014年1月2日、1月26日、2月17日三次通过公函的形式向快播发出停止侵权的诉求,但快播一直没有停止该行为。由此,腾讯于3月17日向深圳市市场监管局进行投诉,称快播公司未经许可,通过快播移动端向公众传播《北京爱情故事》、《辣妈正传》等24部作品。腾讯称这24部作品的采购价格高达4.3亿元,快播的盗播行为侵犯了腾讯的信息网络传播权,且对腾讯造成了重大经济损失。故而腾讯对快播进行了举报。

  后来快播因服务器中存在大量淫秽色情视频,以及涉嫌传播大量盗版视频而被调查。快播涉黄一案暂未有定性,不过快播涉盗版侵权一案却已落实。对此,深圳市市场监督管理局对快播开出了2.6亿元巨额罚款,而这也是深圳市市场监督管理局成立以来关于侵权知识产权最大的一笔罚单。

  虽然在之前快播做出了一些努力。2014年4月16日快播宣布关闭QVOD服务器,称是为了彻底清除利用快播技术的盗版和低俗内容,以前的“快播模式”全面终结。

  同时快播出台三大举措:购买影视类域名;把云帆搜索和快播娱乐风向标中的涉盗版内容全部技术屏蔽;投资不低于1亿购买版权、不低于3000万投入支持微剧创新。

  不过为时已晚。

  自此快播陨落,再无翻身之地。随后快播的工作人员转入湘鄂情投资建立的爱猫科技,而快播则不可挽回的失败了。

四 : 互联杂谈:网上导游超链接和搜索

  摘要 : 如果你只是在一个内容相对集中的站点中浏览,那么超链接可以给你很好的指引。但如果你想在茫茫的互联网上找到相关的内容,单纯的超链接似乎就力不从心了。搜索引擎的出现,就帮人们解决了互联网上的定位问题。

  【注】《互联杂谈》是我个人关于互联网的一些所见、所闻、所感。由于没有什么太成体系的思考,故只能杂乱无章的随意诌一下。在这个“互联网思维”被抬到无限高的年代,希望能用自己的视角给出一点点关于互联网是什么的答案。

  

 

  之前讲到了SEO这个事,而这都和搜索引擎的存在有关,这篇来讲讲和搜索引擎相关的一些东西。

  当我开始可以上网时,怎么找到你需要的信息就成了一个很大的问题。你知道网上有很多的东西,但你却不知道它在哪里。这时候伟大的搜索引擎就可以救你于水深火热之中。

  如同之前所说的,刚开始上网时,主要是通过门户网站上的超链接(就是点击了会跳到另外一个网页的文字或图片)来浏览网络。超链接的确是互联网中简单却又异常有用的发明。通过超链接,成千上万的网页得以互联连接。通过不同的组织方式,人们可以更好的浏览内容,发现相关内容,链接广告还可以用来变现等等。

  但超链接也有很大的局限性,如果你只是在一个内容相对集中的站点中浏览,那么超链接可以给你很好的指引。但如果你想在茫茫的互联网上找到相关的内容,单纯的超链接似乎就力不从心了。当你从一个页面进行了10几次跳转还没找到相关内容的时候,估计你就完全没有耐心继续寻找了。

  搜索引擎的出现,就帮人们解决了互联网上的定位问题。通过搜索引擎,只需要相应的关键字,你就可以很容易的早点相关的内容,而不需要通过似乎无止境的超链接导航一层一层的走。

  当然,搜索引擎并不是孤立存在的,能使搜索引擎存在的基础便是超链接的存在。搜索引擎能完成搜索最重要的两个核心要素——信息抓取和信息排序,都离不开超链接。

  搜索引擎依靠一种叫做“爬虫”(spider)的程序在互联网获取信息。之所以称之为“爬虫”就是因为这个程序会顺着它获得到的超链接一直“爬”,正是由于互联网超链接的互通性,从一些大的站点或者一些重要的导航站(目录站)出发,爬虫就有可能通过这些千千万万的链接走遍整个互联网。

  搜索引擎的爬虫在”爬“到相应的网站时,就会将该网站存到自己的数据库中,以便搜索排序之用。就是说,想要实现真正的搜索,搜索引擎厂商需要将几乎整个互联网都装进自己的服务器中。

  为了存储这些数据,搜索引擎公司需要有大量的服务器。谷歌中国前技术总监周杰在2008年的一次会议上曾经透露过Googl拥有的服务器数量级,他说“Google的服务数量大约相当于美国第三大PC生产商。”虽然不知道具体数据,我们还可以从另外一个侧面来看谷歌的数据中心规模,据谷歌公布的数据显示,谷歌全球能源消费达到2.6亿瓦特,这相当于弗吉尼亚州首府里士满或者加州欧文市家庭用户的所有用电量,或者说,这相当于一座标准核电站1/4的输出功率。大多数数据报告都认为谷歌是世界上拥有最多服务器的企业。

  当然,仅仅是储存这些数据是远远不够的,搜索的目的就是要找出最符合用户需求的网页。这时候搜索引擎就需要对不同的网页进行排序,而这个排序的基础也是通过超链接计算出来的。

  简单来说,搜索引擎的排序基础算法是这样的:大多数网页都有超链接链向它,或者它会链向别人,而这种链接可以被认为是每个网页对其他网页质量好坏的投票。搜索引擎认为,如果有大量的链接链向某个页面,那这个页面就是受欢迎的,就应该在搜时被排在前面。反之没有人链接的网站就是不受欢迎的。当然,搜索引擎还会考虑关键字匹配程度、链接网页本身的质量等多种因素,但大体上其工作原理就是上面所说的那样。

  正是由于搜索引擎的工作原理是通过超链接实现的,就可以理解大多数网站为什么那么喜欢交换友情链接了。因为增互相间的链接是可以提高网站在搜索引擎的排名的。当然如果你没有那么多“友人”的话,你还可在网上找到很多卖“友链”的人的,他们会很“友好”的告诉你每条链接的价钱。

  直接卖链接,是比较初级的做法。因为即使有链接,但效果怎么样实在难以衡量。在搜索引擎称霸互联网以后,就出现了一种特殊的工种——SEO(搜索引擎优化)。SEO的职责就是让网站的排名在搜索引擎里尽量靠前,这样你的网站就有可能被跟多的人访问到。正如上一篇所说的,很多网站会有专门的SEO人员来优化自己网站的排名。

  围绕搜索引擎,有很多相关的上下游产业。这边就不一一展开去了。当你知道搜索引擎的大概工作原理,你就能大概理解这些行当都是做什么的。

  回到搜索引擎本身,如上面提到的,要从成千上亿条数据中快速找出需要的页面并完成排序,这在技术上也并不是一件容易的事情,调度上万台机器的资源可不容易,包括微软、雅虎在内的企业都曾经在搜索引擎上摔过跟头。

  搜索引擎在基础设施投资和技术门槛上都可以说是一件门槛非常高的事,但于此同时搜索引擎又有着一种令人着迷的盈利模式,这让很多企业都对引擎业务趋之若鹜。

  更多内容请关注公众号:baishuwo

五 : 分析2013年百度搜索算法对互联网生态的打造

  互联网每天新出现网站中,40%为采集或针对搜索引擎作弊网站,10%为欺诈、违法等有安全问题的网站,在论坛、blog等web2.0网站中,每天新出现的内容,30%为群发广告或者作弊,由于大多数web2.0建站系统存在漏洞,攻克技术成本较低,容易被作弊者利用,目前除论坛、博客等传统的web2.0站点受到困扰外,现已蔓延到微博、SNS、B2B商情页、公司黄页、分类信息、视频站、网盘等更多领域内,甚至连新兴的分享社区也受到了影响,与此同时,中文互联网每日被黑网站数量超过20万。

  总之,互联网网页垃圾变多,优质内容变少;道德底线越来越低,并且采集等网站挤占了优质网站的生存空间,越来越多的网站出现漏斗,出现泛解析,互联网生态环境变的越来越坏。

  

 

  而对于百度而言,让互联网生态回归本源,给用户展现更好的网站,让原创网站、提供优质服务的网站得到更多的机会,严厉打击破坏互联网生态的行为等应该是国内老大应该做的。百度对于维持互联网生态确实也没闲着,为了互联网内容的良性发展也做出很多:

  原创识别,识别并优待原创内容

  原创星火计划的推出,高质量原创内容, 百度会特殊照顾,跟踪谁是原创,随着识别技术的提高,百度会越来越多的支持原创内容,在展现结果显示上也会对原创文章进行标注。

  理想状态排序

  百度不断更新排序算法,将互联网上最优质的资源提供给用户,目的在构建理想排序体系。传统的排名因素越来越多的被消弱,而用户体验,用户投票的影响得到增加,让用户更好的参与到百度对于网页的排序。而百度知心搜索也是希望通过复杂的结构化数据了解用户的需求,将更符合用户需求的内容更完善、更个性化的展现出来。同时百度口碑的出台同样方便用户直接参与进来。

  打击买卖超链、采集

  百度绿萝算法1.0主要打击超链中介、出卖链接的网站、购买链接的网站。

  买卖链接行为一方面影响用户体验,干扰搜索引擎算法;另一方面投机建站者得利,超链中介者得利,真正勤勤恳恳做好站的站长却在这种恶劣的互联网超链环境中无法获得应有的回报。

  绿萝算法2.0主要打击垃圾软文外链买卖

  主要还是针对一些大型网站的二级域名卖软文的平台,但也不是全部的软文。对于优质的软文,不但用户喜欢,还乐意传播,只有垃圾的软文,广告性质十分明显,才会伤害用户体验,强迫用户阅读。

  石榴算法主要针对含有大量低质弹窗广告的页面

  石榴算法第一期针对含有大量低质弹窗广告及大量混淆页面主体内容等垃圾广告的页面算法升级,在保证优质页面的同时打压低质量页面,对于各种低质量网站及新闻站、采集站进行识别并打压。

  与此同时,百度站长工具还推出超链工具,推荐站长对于网站垃圾链接进行查询,同时可以直接在站长平台拒绝垃圾外链。并且站长可以通过站长工具对死链和结构化数据进行提交,工具也会对不网站的异常情况对于站长进行提醒。

  互联网安全巩固

  百度需要提供更安全的结果给用户,让用户接触不到虚假信息,同时能让用户对于互联网信息更加信任。

  引入haodf、39、天极维修等领域内权威的信息,引入航协、医院协会、教育协会等权威认证信息,并且百度算法改进,权威结果更容易排到前面,而对于比较边缘的行业,比如医疗、教育等,百度还退出百度健康、百度教育等。

  不仅如此百度还对于互联网安全加大普及与提示,对钓鱼站、风险站都会识别,同时与安全联盟合作,引入知名安全厂商扫描百度结果,站长平台引入scanv,提供漏洞扫描服务。为互联网提供更安全的信息。

  既然百度在维系互联网生态的良性发展,那么站长就应该与百度合作,按照百度的要求来打造自己的网站,只有符合良好互联网生态的网站才能更取得百度的青睐,欢迎关注微信公众账号:mumuseo。

  作者:木木seo

本文标题:教学中的互联网搜索-互联网产物“人肉搜索” 利器还是凶器?
本文地址: http://www.61k.com/1216641.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1