本文节选自「I/O」会员通讯。欢迎加入「I/O」会员服务获取全文,每周你会收到三封专属会员邮件,包括独家的科技书评,科技新闻、趋势的独家解读以及你从别的地方看不到的文章、图书、视频推荐

根据 Venturebeat 的一份数字对比:

Investors dropped $681 million into A.I.-centric startups in Silicon Valley last year.This year, the number will likely reach $1.2 billion. Five years ago, total A.I. investment spiked at roughly $150 million.

但仔细去看,这些资金基本都流向了机器学习领域:

The truth is — artificial intelligence does not exist yet and every single company pretending to have one is in most cases arrogantly re-selling an old concept of machine learning – a technology first introduced in 1959 that truly started to take off in the 90s. Cloud technology, big data and amazing search algorithms finally became the fuel for this rocket. Systems and services could self-improve thanks to insane amount of statistical data pouring their way. But this has nothing to do with A.I.

这些资金和媒体关注度也让机器学习(Machine Learning)似乎成为新的创业热点,但真实情况则是,机器学习对于人才、数据、计算能力的需求非常高。这几年,计算能力的瓶颈已经在云计算的帮助下逐渐变小,研究者或企业完全可以购买基于云端的计算能力,但人才和数据方面的难题还亟待解决。尤其是数据。

ML@B (Machine Learning @ Berkeley) 的两位创始人 Ted Xiao 和 Gautham Kesineni 介绍了当下数据如何制约机器学习

随着机器学习受到的关注越来越多,其社区支持也不断壮大。网络上有了大量公开数据,种类也极其丰富;许多大公司也秉着开源精神,释出了许多优质数据库(比如 YouTube 8M)。关于一些具体的研究问题,甚至有标准数据库(如 The MNIST Database)用于研究或测试算法性能。

对于科研人员和学生而言,当下可以称得上是机器学习研究的黄金时代。然而对于真正的企业而言,获取一个具体问题的大量数据仍然是算出好的模型的关键。Gautham 告诉我,就目前而言,数据造成的企业差距还没有那么明显;但是有一天,数据也终将成为一种壁垒;而这一天正在慢慢接近。

深度学习作为机器学习的一种算法,目前已经和「人工智能」一词的效用等同。绝大多数媒体即便是科技媒体也都搞不清楚机器学习、深度学习、人工智能三者的区别.....

而针对深度学习,Google Brain 团队工程师 Eric Jang 介绍了哪些产品正在被深度学习改造着(顺序不分先后):

定制数据压缩、压缩传感、数据驱动型传感器校准、离线人工智能、人机互动、游戏、艺术助理、非结构化数据挖掘、语音合成。

这里特别强调两个:离线人工智能和语音合成.....

当世界开始被深度学习改变的时候,整个科技的产业链条也开始了某种程度的充足。尤其是随着摩尔定律寿命越来越短的大背景下,《连线》杂志 Cade Metz 表示,自己最近几天被来自咨询公司的人「骚扰」——对方表示可以付费让其分析芯片业的走向——这是因为 Metz 早前报道了 Google 如何为人工智能制造芯片的文章,同时《连线》杂志也在上月长文独家披露了微软围绕 FPGA 的研发历程。咨询公司此举多数是由其背后的客户——芯片厂商所驱动,由此可见芯片业对于人工智能的不确定性。

那么人工智能、机器学习、深度学习又会如何重构芯片业呢?