61阅读

百度深度学习研究院-百度开发超级计算机 用于深度学习算法研究

发布时间:2017-12-12 所属栏目:搜索优化

一 : 百度开发超级计算机 用于深度学习算法研究

  [摘要]百度正在大力投资,研究深度学习算法。未来将用于更好地处理现实世界数据。

百度开发超级计算机 用于深度学习算法研究

  腾讯科技讯 1月16日,百度表示,正在开发全球最准确的计算机视觉系统Deep Image。这一系统运行在针对深度学习算法优化的超级计算机之上。

  百度称,在Imange Net对象识别评分中,这一系统的错误率仅为5.98%。而2014年,来自谷歌(微博)的一个团队凭借6.66%的错误率获得了冠军。在试验中,对于Image Net给出的数据集,人眼识别的错误率为5.1%。

  Deep Image的主要优势在于其超级计算机Minwa。百度开发这一超级计算机的主要目的就是为了容纳Deep Image系统。过去几年,关注深度学习的研究者利用GPU(图形处理单元)去处理重度计算任务。实际上,Deep Image的论文援引的一项研究显示,在著名的谷歌Brain项目中,3台机器中12颗GPU带来的性能就达到了包含1000个节点的CPU簇的水平。百度首席科学家吴恩达此前从事了谷歌Brain项目。

  不过到目前为止,还没有公司开发出类似Deep Image的专用系统,利用深度学习算法去完成计算机视觉的相关工作。以下是论文中给出的配置信息:

  这一系统包含36个服务器节点,每一服务器节点配备了2颗六核英特尔至强E5-2620处理器。每个服务器包含4颗英伟达Tesla K40m GPU,以及1个FDR InfiniBand(速度为56GB/S)。这带来了高性能、低延时的连接,以及对RDMA的支持。每一颗GPU的最高浮点运算性能为每秒4.29万亿次浮点运算,而每一颗GPU也配备了12GB的内存。

  整体来看,Minwa内置了6.9TB的主内存、1.7TB的设备内存,而理论上的最高性能约为0.6千万亿次浮点运算。

  百度开发Minwa是为了解决与Deep Image算法相关的问题。“考虑到随机梯度优化算法的特性,设备互联需要极高的带宽和超低的延时,从而最小化通信开销。对于这类算法的分布式版本来说,这是必要的。”论文作者表示。

  凭借如此强大的系统,研究人员可以使用与其他深度学习项目不同,或者说更好的训练数据。因此,百度没有使用常见的256x256像素图片,而是使用了512x512像素图片,并且可以给这些图片添加各种特效,例如色彩调整、增加光晕,以及透镜扭曲等。这样做的目的是使系统学习更多尺寸更小的对象,并在各种环境下识别对象。

  百度正在大力投资,研究深度学习算法。在Deep Image之前,百度还开发了语音识别系统Deep Speech。这一产品已于去年12月公开发布。百度高管曾表示,该公司已经看见,语音和图片搜索的比例正越来越高,而未来还将继续上升。如果百度的产品能更好地处理现实世界数据,那么就能带来更好的用户体验。

  百度并不是唯一一家从事此类研究的公司。在互联网市场,有多家公司正在投资研发深度学习算法,并且已取得了不错的成果。到目前为止,谷歌仍在ImageNet的实际竞赛中保持最高纪录。该公司也在大力开发深度学习算法,而本周还发布了可能利用了这一技术的新版谷歌翻译服务。微软和Facebook也拥有知名的深度学习算法研究员,并正在这一先进研究领域继续努力。

  雅虎、Twitter和Dropbox等公司也拥有自己的深度学习和计算机视觉团队。(李玮)

二 : 百感集(89)学习和研究“孙武杀妃”的启示

百感集(89)学习和研究“孙武杀妃”的启示

《史记、孙子吴起列传》记叙了这样1个故事:孙武拿着自己所著的《孙子兵法》去见吴王阖闾,吴王读后说:“你的十三篇兵法我都读过了,你试一下怎么样啊?”孙武说:“可以”。吴王又说:“用妇人行吗?”孙武说:“行!”于是孙武将宫中美女180人分为两队,让吴王的2个宠妃当队长。孙武约好口令,规定动作、宣布纪律后,便将大斧排立起来,宣布军法,三令五申。于是击鼓发令向右,妇人们个个笑个不停。孙武说:“规定不明确,约令不熟悉,这是将帅之过”。又重申纪律,击鼓令向左,妇人们又大笑。孙武说:“约令不熟悉,那是将帅的罪过,既然已经再三说明了,再不执行,那便是下级士官的罪过了”。遂下令斩两队长。吴王从台上看见要杀自己的爱妃,大为惊骇,急派人传下命令说:“我已知道将军善用兵了。我离开这2个妃子连饭也吃不下,希望不要杀他俩。”孙武说:“臣既已受命为[www.61k.com]将,将在军,君命有所不受”。便杀了两队长示众。另用一妇人为队长,重新击鼓操练。这下,妇人们的动作都合乎规定和要求了,没有敢出声了。孙武派人报告吴王说:“队伍已训练好了,大王可以下来看看,这支队伍赴汤蹈火都可以了。”

“孙武杀妃”的故事至少给我们有以下两点启示:

第一,作为领导,要有吴王的辩识能力,吴王的宽容,既然授命于下,那就要放手让他去干。孙武训练宫女,这也是他的孙子兵法在实践中经过检验的过程。实践证明,孙武不仅会写,而且也会干,不是么?他把宫廷妇人训练成能赴汤蹈火的队伍了!

第二,作为人才,要有敢作敢为的魄力和勇气,不能唯唯诺诺,无所适从,孙武放开手脚训练宫延妇人,他敢作敢为,杀了“有令不行,有禁不止”的吴王的2个妃子,即使“得罪”了吴王,但吴王是明智的,是心存感激的。孙武的出名,不能不说和“孙武杀妃”事件有关。

三 : 百度热力点击图的深度研究

  作为一名SEO人员,你一定在困扰,为什么你的网站优化到中期,使用正常的优化手段优化,收录和排名就是没有变化,这时候你就要考虑参考一下热力点击图,热力图的主要功能是以特殊高亮的形式显示访客热衷的页面区域或访客所在的地理区域。以颜色变化展现访客在页面上的点击分布情况,图中,红色表示用户点击密集、橙色次之、绿色表示点击较少!下面石家庄SEO小编带领大家认识一下热力图:

百度热力点击图的深度研究

  百度热力图(又称为百度点击图)是百度为了鼓励站长做好用户体验的一种工具,主要分析出用户来到自己的网站,点击了哪些地方,通过热力点击图,我们可以了解到以下信息:

  1、了解访问我们网站的用户,对哪些内容感兴趣,哪些内容不感兴趣。感兴趣的内容,应该对该部分内容进行加强建设、更新频率等,不感兴趣的内容,应该进行删除或者修改等。

  2、了解哪些链接点击量更高,适当的把点击量高的链接往明显的地方转移。

  3、当我们网站设计营销活动的时候,可以观察是否有用户去点击,检查营销活动的效果,还有哪些事需要进行改进的。

  下面石家庄SEO小编给大家指导如何添加热力点击图。

  为你网站添加热力点击图的方法,在“百度统计”后台-顶部导航条“页面点击图”-点击“新增点击图”-输入你要统计的网址,就可以了。

  安装好热力点击图之后,等待几天有了足够的数据之后,就能看到统计后的效果了,下面显示的是石家庄SEO小编的博客的热力点击图。  

四叶草博客的百度热力点击图

  其中,热力图中越红的地方,就是用户点击越多的地方,也是大部分用户最关注的内容,此外,热力点击图还有一个功能是“链接点击图”,通过这个功能,可以看到我们的页面的链接在一定时间段的点击量。

  链接点击图主要是展示用户对于链接的关注度。这样可以从点击图中分析,哪个栏目用户点击率高,可以考虑把相应的栏目前移。这样才能更符合用户体验。综上所述,热力点击图是一个很好的用户需求分析工具,通过这个工具我们可以直观的了解到我们的网站的访客最喜欢的内容,让我们可以针对性的展开下一步的优化策略。

  只要我们针对用户喜欢的内容进行了优化,就可以优化我们网站的PV量、跳出率、停留时间等数据了。这些数据好了,百度自然会给我们的网站加分,排名自然也就上去了。加油!

  本文由石家庄SEO原创,原文地址:http://www.sjzseo010.com/?p=794,转摘请保留版权,谢谢。

四 : 百度组建深度机器学习开源平台 研发“虫洞”项目

百度虫洞 机器学习 人工智能

由百度牵头的分布式深度机器学习开源平台日前正式面向公众开放,该平台隶属于名为“深盟”的开源组织,该组织核心开发者来自百度深度学习研究院(IDL),微软亚洲研究院、华盛顿大学、纽约大学、香港科技大学,卡耐基·梅陇大学等知名公司和高校。

据透露,“深盟”目前的重点开发项目被命名为“虫洞”,其将成为所有深盟项目的统一入口。虫洞将自动构建深盟所有项目,为对所有组件提供一致的数据流支持,无论数据是以何种格式存在网络共享磁盘,HDFS,还是Amazon S3。

此外,它还提供统一脚本来编译和运行所有组件,使得用户即可以在方便的本地集群运行任何一个分布式组件,又可以将任务提交到任何一个包括Amazon EC2,Microsfot Azure, Google Compute Engine在内的云计算平台,并提供自动的容灾管理。

截止目前,“深盟”分布式深度机器学习开源平台的已有组件已成功覆盖三类最常用的机器学习算法,包括被广泛用于排序的决策树模型(GBDT),用于点击预测的稀疏线性模型(如Sparse Logistic Regression),以及目前的研究热点深度学习。

未来“深盟”将致力于将实现和测试更多常用的机器学习算法,并通过更好的融合当前各类组件,将提供更为一致性的用户体验。

资料显示,机器学习是人工智能研究领域中的重要方向,而深度学习则是近年机器学习领域的一个重大突破, 作为目前最接近人脑的智能学习方法,深度学习可以完成需要高度抽象特征的人工智能任务,如语音识别、图像识别和检索、自然语言理解等,有着广泛的应用前景。

在深度学习的研发上,百度一直在布局,早在2013年,其便组建了百度IDL(深度学习研究院),面向全球延揽一流学术人才,并尝试将深度学习应用于语音识别和图像识别、检索,以及广告CTR预估(Click-Through-Rate Prediction,pCTR)等领域。

2014年,百度又将Andrew Ng招致麾下,Andrew Ng是斯坦福大学人工智能实验室主任,入选过《时代》杂志年度全球最有影响力100人。百度称,到目前为止,已有8项深度学习技术在百度产品上线,在用GPU提升计算效率,处理海量训练数据,语音识别,OCR识别,人脸识别,图像搜索等领域均有突破。

百度称,通过深度机器学习开源平台,世界各地的开发者们可免费获更优质和更容易使用的分布式机器学习算法源码,从而降低开发和部署分布式机器学习系统及相关应用的门槛,包括今日头条、汽车之家等在内的多家公司已通过该开放平台受益。

深盟项目负责人之一、百度深度学习研究院李沐介绍称,此次百度推出的深度机器学习开源平台,和其他开源软件一样没任何使用限制,个人和机构均可自由使用。其最大优势在于达工业级应用标准。

李沐指出,目前业内流行的分布式平台例如Spark都基于JAVA语言,开发难度虽然较低,但通常在性能上有所缺陷。而此次“深盟”推出的深度机器学习开源平台,其核心则完全采用C++语言,性能成熟稳定,能满足各种工业界需求。

注:相关网站建设技巧阅读请移步到建站教程频道。

本文标题:百度深度学习研究院-百度开发超级计算机 用于深度学习算法研究
本文地址: http://www.61k.com/1141414.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1