• 维护主题插件开发者利益,本站取消所有破解模版获取方式!
  • 最美的贴图库,分享最美的那一刻我要分享
  • 手把手教你申请QQ公众帐号,公众空间
  • 简单的PHP域名授权函数
  • 免插件实现Adblock检测,全网通用
  • Phuong My 2015时尚独特女性魅力
  •  11个月前 (01-15)  慢生活  技术宅 隐藏边栏 评论关闭  1036 
    文章评分 0 次,平均分 0.0

    百度送代码,雅虎送数据,科技大佬都在AI拼命圈地

    今天,人工智能领域发生了两件大事:百度开源人工智能系统代码,雅虎送出13.5TB用户数据。

    像是说好的一样,年末年初,谷歌Facebook、雅虎、百度等科技大佬纷纷开始在人工智能领域拼命圈地,送代码,送数据,简直停不下来。

    开源关键技术圈定开发者社区

    百度在国内水深火热,在国外倒是惊天动地了一番。百度硅谷 AI 研究所 (SVAIL) 今天开源了百度的关键人工智能 (AI) 软件 WARP-CTC,希望通过机器学习社区继续提升 WARP-CTC。

    WARP-CTC是干什么的呢? CTC结合了多个不同的神经网络设计,以处理不完美的数据集,而百度的正是基于CTC方案开发了自己的系统WARP-CTC,优化了语音识别产品。

    百度为何开源这一软件? 据新浪科技报 道,百度希望使“端到端的深度学习变得更简单、速度更快,加快研究者的进度”,而“此前的代码在训练端到端网络时速度太慢”。这当然只是漂亮的说辞,其 实,从去年11月起,谷歌Facebook也相继开源了自己的人工智能技术,而他们的目标是共同的:吸引第三方开发者,让自己的技术成为主流。百度如果 不开源,那么开发者很可能竞相学习竞争对手的技术,百度的技术则会边缘化。

    去年11月,谷歌开源人工智能系统 TensorFlow,也就是谷歌的第二代机器学习系统,它的速度是第一代系统DisBelief的两倍。有媒体评价说,TensorFlow相当于人工 智能领域的安卓。到了12月,Facebook公开Big Sur人工智能硬件架构,这是一种易于组装的计算机服务器,可以运行最新的人工智能算法,此举也标志着人工智能领域的开源从软件迈向硬件设计。

    当然,谷歌、Facebook、百度都不是慈善机构,开源的目的,一方面是“集思广益”,把科研众包出去,减少经费压力;另一方面,一个平台使用的人越多,就越容易形成自己的社区,最经典的例子就是安卓借助广大开发者的力量夺回了手机市场。

    公开数据收买研究员

    同一天,雅虎送出的是13.5TB的用户数据大礼包,这里面装的是将近2000万匿名用户在浏览雅虎新闻时产生的数据,甚至细致到鼠标的每一次点击、悬停和滚动。雅虎此前曾56次发布这样的数据,但这次的数据集规模尤其庞大,相当于国会图书馆数据的三分之二。

    海量数据同样是机器学习必不可少的食粮。通过分析这些数据,计算机就能够学习到用户的许多习惯,比如从雅虎的角度来说就可能是:什么样的标题更加吸引点击?什么样的文章能让人长时间去细读?而在雅虎此次公开数据之前,研究者很少有机会能够接触到真实反映用户习惯的数据。

    根据TechChurch报道,加州大学圣地亚哥分校的电器与计算机工程教授Gert Lanckriet表示,如此大规模的数据,“能够直接并极大地推进人工智能、机器学习、以及大数据应用技术的研究。”

    但其实,公布用户数据以期改善算法的做法其实并不新鲜,AOL、Netflix也曾公开用户数据以期从公司外部获得改善产品的灵感,Netflix甚至提供一百万美元奖金,明码标价换取算法优化。不过雅虎似乎还有别的打算。

    虽然没有明说,但雅虎这两年人才流失的窘境早已是路人皆知,因此,它对在像人工智能这样的高新技术领域吸引人才表现得十分饥渴。卡内基梅隆大学计算机科学院院长摩尔表示,科技公司不论有多少人才,老板永远都觉得不够,他们总是觉得想做的事情还差人手。

    人工智能界的“圈地运动”本质上是“圈人”,谁能赢得技术人才以及开发者社区,谁就能掌握话语权。

    然而,也有开发者在谷歌宣布开源TensorFLow的时候就表示:“人工智能的发展还是初级阶段。好比处于原始社会的医学,武当的技术当主治医生。谷歌一个公司不可能主导新技术的发展,人工智能还需要全世界几代科学家的共同努力。”从这一角度来看,在人工智能领域,圈地进行得再热闹,一家通吃的现象或许暂时还不会出现。

    微信公众账号:技术宅
    分享互联网科技新闻轶事,各种数码使用小技巧。
    760人已关注
    切换注册

    登录

    忘记密码 ?

    您也可以使用第三方帐号快捷登录

    切换登录

    注册

    文章目录