编者按:
在去采访 Andrew 的路上,心里特别的没底气。总担心自己无法和学术大牛高智商怪兽级别的人物顺畅沟通,在前一天晚上还尝试看了一遍 Andrew 关于COTS HPC 系统论文... 的摘要部分。但另一方面又有种异样的亲切感,终于可以在 Coursera 教学视频外,与现实生活中的 Prof. Ng 交流。Andrew 身上的有着斯坦福教授,Google 大脑创始人,百度首席科学家等等各种光环,但是在光环的背后,我看到是其实是一个亲切,谦逊,有着笃定信念的学者,一个甚为可爱的丈夫。Andrew 总是能保持着对未知事物的好奇心,在采访前拿着我的米 3 把玩了很久;Andrew 讲话声音不大,给人娓娓道来的平静感;下面,我们就来和 Andrew 一起,聊聊他对在线教育的愿景,聊聊他作为百度首席科学家,对未来大数据和深度学习的看法。
36氪:Coursera 如今是在线教育全球性的品牌, 超过 700 万的注册用户和 12 种语言的课程教学。有着科学 / 工程背景的人都倾向于规模化地去解决一个问题。所以当年成立 Coursera 的使命是为了更好的规模化地提供在线教育体验(scale up online education experience),还是要通过科技改变线下教育的现状呢(shake up the status quo of offline education)?
Andrew:Coursera成立的初衷并不是为了改变线下教育的现状,而是为了解决高等教育的延续性的问题。从 2007 年开始,我和我的团队成员都在尝试不同的在线教育体验,譬如早期的OpenClassroom。我们一直想要做的都是可以让所有人都获得免费的高等教育资源,但是并不是要取代线下教育。线下教育可以有很好的及时交互(instant interaction),线上教育更多的是点播式的(on demand)。线下教育对学生的深度理解和启发是线上教育无法取代的,线上教育的灵活性也是线下教育无法取代的。所以二者更多的是一种互补关系而非竞争关系,我们的团队也从来没有考虑过要改变甚至取代线下教育体验。
36氪:但是我们注意到了 Rick 作为耶鲁大学任期最长的校长加盟 Coursera,人们不可避免地会联想到,这是不是 Coursera 要向传统高等教育市场进军一个信号?毕竟如今美国社会最需要颠覆的,一个是医疗市场,另一个就是教育市场。如今美国高等教育平均学费(私立大学)约 4.5 万一年,基本和美国中产家庭年收入相当。在高昂的学费压力下,颠覆传统高等教育难道不是 Coursera 未来的方向么?
Andrew:颠覆传统高等教育并不是我们的目的。首先,大学本科的教育我个人觉得非常重要,而且是在线教育无法取代的,至少现在的技术还没有达到那个程度。假设你被加州理工大学录取,同时加州理工提供本科在线教育,你在纠结选择哪一个,我会毫无疑问建议你去传统的线下大学教育而不是线上。其次,我们的定位不是18 到 21 岁的目标人群,我们要做的是解决高等教育延续性的问题。Coursera 的平均用户年龄是 35 岁,并且 75% 的用户已经拥有学士学位。我们认为高等基础教育是无法取代的,在有了线下高等教育基础后,对于那些需要继续学习或者扩展知识面的专业人士,Coursera 上的课程才是更好的选择。所以我们更多定位是在高等再教育或者研究生课程,因此在 Coursera 上的课程一般专业性的要求都相对要高。我们这样做的目的是,对于所有的像你和我这样的职业从业者,我们需要继续学习保持竞争力,但是我们没有整块的时间或者条件去大学课堂进行再教育,这个时候 Coursera 就是一个很好的选择。
36氪:如今有了 Rick 的加入,Andrew 你会继续为 Coursera 发展添砖加瓦么?
Andrew:那是当然的。首先我成立了 Coursera,出于一个很简单的想法。而且我在 Coursera 上教课,我是 Coursera 上 800 多位教授的其中一员。我比任何人都希望未来 Cousera 能做的更好,未来我也会不遗余力地为 Coursera 的发展做贡献的。
36氪:能和我们聊聊对硅谷最近几年炙手可热的大数据浪潮有什么看法么? “大数据” 是在 2011 年之后开始有了指数增长的关注度,我甚至觉得这个标签已经是被过度滥用了,因为大数据太泛且太不明确(too broad and too undefined)。有无数公司有了自己的 Hadoop 集群,就号称自己是大数据企业,或者随便一个什么和机器学习沾边的产品,都号称自己是大数据产品,你对这个 " 大数据 " 现象怎么看?你觉得真正的大数据产品应该是如何定义呢?
上图为 Big Data 在 Google 的搜索热度趋势
Andrew:“大数据”是在两种趋势的发展下催生的产物。第一个趋势随着我们进入数字化社会,我们越来越多的行为是在数字世界中进行的,随之而来是大量数据的产生,特别是由人们行为产生的机器数据(Machine generated data as a result of human behavior)。第二个趋势是数据存储以及计算的成本降低让我们有能力去存储和处理这些数据。百度在北京的大数据实验室做的就是如何能在同一时间计算 / 处理更多的数据量,并且使用这些数据去做更好的预测。我认为所有可以有效利用这种海量数据进行预测和功能优化的产品,都是大数据产品。
36氪:很多人说到大数据都会自动和 Hadoop 联系起来,但是 Hadoop 只是大数据基础架构的一种(infrastructure)。在大数据的应用层面上你认为未来可能的突破点会有哪些呢?
Andrew:我们现在在百度的策略,是先把基础建设以及算法层面的技术难点攻破,然后再去考虑有什么可以产品化的应用。产品不是难点,技术瓶颈一旦突破产品化是分分钟钟的事情。有许多商业化的应用,譬如电子商务里的图像识别,都是因为技术层面的精准度达不到要求而无法很好的进行应用。虽然我们在探索一些可能可以产品化的应用,但是我们现在没有任何可以对外公布的产品。譬如图像识别,语音识别,深度学习和人工智能,这些都是基础层面的技术需要我们进一步去加强和改进,只有基础层面的技术成熟了之后,我们才能进行应用层面的选择和开发。譬如当年我在 Google Brain,我们团队也是利用我们的深度学习技术大大改善了 Google Now 语音识别的表现。其他应用还有譬如 Google Keep,这些都是产品化的例子。
36氪:关于人工智能,许多人都觉得是一门非常深奥且科幻的学科。我很好奇你当年是如何选择了人工智能这个研究方向,因为很有可能这个领域在你有生之年都没有重大突破,也许在 50 年后这个领域和你设想的 1% 都没有达到,那么是什么动力驱动你在人工智能领域不断前行呢?
Andrew:其实我的想法很简单,就是如果能让计算机聪明些,那么人类社会的潜力是无穷大的。人工智能其实早已在我们日常生活中有了广泛的应用,不是只有科幻电影里的那些才叫人工智能。譬如最简单的数码相机的笑脸捕捉,那个就是人工智能。还有电子商务里的推荐引擎,那个也是人工智能。还有电子邮件,如果没有 spam filter,估计电子邮件完全就成了垃圾信箱,这也是人工智能的功劳。这些都是让计算机变的更聪明,从而改变人类生活的例子。还有许多应用的现阶段瓶颈就是人工智能,譬如农业上的自动化收割,我要摘樱桃,怎么分辨好的和不好的?这个就是计算机视觉可以解决的问题。但是现在人工智能还有很长的路要走才能达到实现这些应用的高度。我早年花了很大的精力在解决人工智能硬件层面的架构问题,现在是时候进一步提高技术的可用性了。
36氪:我们很多人都想知道,为什么是百度。硅谷这么多企业,为什么最终选择了百度呢?
Andrew:硅谷确实有很多在这个领域做的很好的企业,但是百度的优势不仅仅是在于他的资源,技术侧重点,更多是在于它的强大的执行力(Baidu is unusual in different aspects, and it‘s not just its resources, focus, but also the nimbleness to excute)。百度作为一个如此大的企业,对于科技的强大执行力是让我非常吃惊的。我在百度的好朋友余凯(余凯为百度深度学习研究院常务副院长),决定要在百度建 GPU 集群,执行速度快的出乎我的意料。这种执行力在许多大企业来说非常难得的。百度一个最大的优势就在于,对于想法的快速迭代和产品化。我知道中国国内对百度,腾讯和阿里巴巴的评价,许多人觉得百度近几年甚少创新。但是很多技术创新并不是用户可见的,特别是对于人工智能或者深度学习这种后端技术。某个算法精准度提高了 1%,用户不会有切身的体验。百度的强项绝对是在于后端技术,这个是着眼未来 10 年,甚至 20 年的布局,并非短期内的效益。科技这个东西很有意思,往往最好的技术都是不可见的(the best technology is always invisible)。如果有人说这几年百度什么都没有做,那我看到的完全不是这样。另外你要知道,核心技术是非常难,门槛非常高的一项资产,而且非常难被模仿复制或者超越,这些都是百度在技术端的优势所在。我觉得我加入百度,能最好地位人工智能事业做贡献,百度有强大的执行力,技术支撑,以及人工智能研究所需的大量数据和资本,综合这些因素,百度是我最好的选择。
(Andrew 这个时候看了看手表,满脸歉意的对着我说 “I really have to take off at 6 o‘clock. I have been late for home everyday and I promise my wife will be home early today”. 老婆大人在家等,果然是比神马都重要啊!于是我们下面边走边闲聊了一下 Andrew 的婚后生活,经 Andrew 同意可以和大家一起分享~)
简单介绍一下 Andrew 的妻子 Carol Reiley. Carol 是约翰·霍普金斯大学的医学博士以及在读计算机博士,研究方向是生物医学方向的机器人应用。Andrew 结婚这事儿还上了 IEEE 主页... "Robots Bring Couple Together"
36氪:觉得已婚生活怎么样?我们都很好奇两个计算机科学家在家里都会讨论什么样的话题。
Andrew:貌似从来没有人问过我这个问题哈哈。我们的婚后生活很美好。很多人之前在我们约会的时候和我说,如果你已经有了一个很稳定的关系,结婚之后的生活不会有什么改变。但我个人觉得不是这么回事。我结婚以后,回到家见到 Carol," 这是我的妻子 ",这种感觉非常温暖。
36氪:你们是更互补呢?还是更相似?你们在家是不是也继续在讨论机器学习的学术问题,感觉是一个非常学术的家庭呢。
上图为 Carol Reiley 在 MAKE 杂志的封面
Andrew:我们几乎无所不谈,学术性的,社会性的,各种话题。我们更多的是讨论很多高层面的东西,譬如科技未来发展的趋势,机器人应用策略等,实现细节不会怎么聊。其实有时候很酷,我一回家发现 Carol 在家里经常会折腾些她做的小玩意,各种各样疯狂的机器人设备,或者在网上买的某个新型传感器,有些东西也让我大开眼界。她有次还登上了 MAKE 杂志的主页,是个女超人的形象,把我乐坏了(上图)。我们平时周末最好的休闲时光就是一起去一家安静的咖啡馆,在那里阅读,工作。"Carol is a wonderful woman"
作者简介:德芙,女,36氪驻硅谷负责人,差点儿 90 后。对自己预期曾经是可罗可御,现实却是可宅 Geek。希望能在硅谷结识更多创业小伙伴,能为更多的华人创业者服务。
邮箱:dovey#36kr.com 微博: @万卉Dovey
[36氪原创文章,作者: Dovey]
发表评论