雷锋网按:5月20日,由中国计算机学会(ccf)主办、xtecher协办的2017 ccf青年精英大会在北京国家会议中心举行。中国工程院院士赵沁平、香港中文大学教授汤晓鸥、百度创始七剑客之一雷鸣等围绕“科研·产业·融合”这个主题做了一些分享。其中,百度创始七剑客之一、酷我音乐创始人、北京大学人工智能创新中心主任、国家特聘专家雷鸣做了主题为《ai时代,科研如何创造产业价值?》的演讲。
雷鸣表示,ai时代,科研人员不仅要做基础研究,还要把研究与产业结合,加速落地,提高研究成果的转化率。此外,他还对ai领域的创业公司给出了一些建议。在他看来,虽然大公司们掌握了足够多的数据,但是创业公司依然有机会,特别是在医疗、交通、农业、制造业等领域。
以下根据演讲实录整理,雷锋网做了不改变原意的删减:
很高兴,今天能够跟大家分享一下我对人工智能时代科研如何跟产业结合的一些想法。我本人关注人工智能产业大概有四年之久。几年前我和百度的创始人以及谷歌的高层有过沟通,大家认为这个方向发展前景很好,后来在这一方面投入了不少的时间,做了一些孵化、投资、研究,中间有不少想法,在此跟大家做一个分享。
首先讲人工智能对人类影响多大。大家都知道霍金,去年剑桥大学的人工智能中心成立的时候,霍金讲了一句话,“人工智能的产生可能是人类历史上最重大的事情。”科学家说话都不愿意说得太满,他既然说到最高级,那就表示他认为人工智能是非常重要的。他对人工智能有很强的个人看法。
加州大学的gregory clork教授研究了人类一千年来的收入水平,到公元1820年为止,几乎过去两千多年,人类的劳动生产率基本没有什么变化。工业革命之后出现了非常完美的指数曲线,今天我们看这个会议室所有的东西,我们自己穿的用的吃的,基本上所有东西都是过去两百年前的产物,甚至是过去几十年。
因为科技不断进步,淘汰了很老的蒸汽机,现在都是最新电子电气化设备,社会发展得很快。工业革命在这里给我们演绎了一个完美的拐点,从这儿我们再想:为什么工业革命会使人类有一个突变性的变化?这一点值得我们深思,如果我们找了这个东西,我们就会知道是什么在影响人类的发展。
举一个简单的例子,从农业社会到工业社会,劳动生产率的客观数据就是以收割为例,农业社会一天一亩,工业社会一天一百亩,这是一百倍劳动力的提升。为什么会有这个提升?因为有了收割机,而收割机只是一个事情,但并不是因为收割机而产生劳动生产力。
收割机分为设计、创新、生产、销售使用等一些环节,哪一个环节是最重要的,是整个价值链的起源?显然就是创新。谁第一个把收割机设计出来了,这才是推动社会劳动生产力的根源。包括我们刚才看到的,现在收割机一天一百亩,如果说谁通过创新把它变成一天两百亩,在劳动生产率这项任务上又提升了一倍,也就是说,我们认为社会的快速发展来源于创新,来源于不断创造出这个世界上不存在的东西,而这个东西恰好对社会的发展起到推动作用。
大量有效的创新在推动着社会的发展,第一个造出电脑,第一个发明算法,第一个做了o2o等等,创新不仅仅是科技,也包括了我们刚才讲的商业模式。所以创新是推动社会发展的根源,工业革命之所以能够拉出一个完美的曲线,就是因为工业革命使得更多人开始参与创新。
工业革命之前是农业社会,农业社会、工业社会,现在要进入智能社会,或者说是信息社会。农业社会很重要的体力劳动者占社会的90%,他们基本上是农民;技能劳动者占社会总人口的个位数,这些人就是我们平常所说的铁匠、磨坊等等;手工业者和管理人员,创新劳动占1%,比如发明新事物(四大发明)的人等等。
但是过去发明创造更多是偶然事件产生的,工业社会之前很少有一个机构专门负责研究、创造。而进入工业社会后,工业革命产生能源和机械。这两个因素做了什么事情?其将体力劳动完全从社会舞台上抹掉了,所有的农民不能从事以前的工作了,进而改变整个社会结构,改变技能劳动。
工业革命也是现在教育的起源,在这儿开会的都是大学教授、研究者,都是现代教育的一份子。现代教育为什么往这儿走,就是因为在农业社会里面我们更多依赖生物能量,即体力。工业社会靠技能,技能和体力不等价,技能是需要培育的。现在来看,技能劳动占社会90%以上,另外一部分也把很多人逼向创新劳动,有明确的机构做创新,比如大企业里边的研究院,比如我们所说的学校,咱们中科院的各种研究机构、研究中心,经费支持也很多,所以大量的资源、人力、物力、财力涌向创新,使得创新推动社会迅速进步。
智能到底会做什么事情?大家说数据等价于过去的能源,这个比较对不对?在与很多专家及企业家都聊过后,我们觉得也对也不对。对在哪儿呢?数据确实与过去的能源有相像之处,没有数据,算法根本转不起来。那么不对在哪儿呢,就是其中一个属性很不一样。能源是标准化产品,是可流动的,你去国际原油市场按照标准的价格一定能买来相应的石油,是可购买标准化的产品。但是我们今天发现数据私有化非常严重,虽然我们也在推动所谓的数据交易平台,但是大量的数据,由于各种原因是私有的,比如微信数据,除了腾讯可访问之外,我相信任何其他一家公司很难访问到,还有一家可访问的是政府。这样的话,数据的私有化在这一波里面是很有意思的事情,大家创新很多都需要顾及到这一点。
智能革命到底改变什么?其实智能革命会不断的替代技能劳动者,我们可以看到扫地机器人,下一步的人脸识别会把安防领域保安以及检票员替代,自动驾驶会把司机替代。不断往前推动,进而把人类逼向创新劳动。在座大部分都是创新劳动,在研究各种新算法,新的东西,所谓的技能劳动更像你经过了一个培训学习之后,然后有相对标准化的方法对社会提供一个服务。创新劳动的人的数量提升之后,可以预计社会进步还会再加速。将来还有一条曲线更快,会迅速走上去。
未来20年,人工智能的发展会如何?未来总是不可预期的,我们只能大概的看一看,去想一想。所说的有可能都是错的,但我们还是尽量地想去透见未来的星星点点。全球前五大市值公司跟互联网、或者软件有关的公司,也可以做某种预期。
我们认为20年前前五的公司都是和人工智能有关的公司,人工智能的公司正在快速改变世界,互联网到现在不过20年的时间,很多人认为去年或者今年是人工智能的元年,最多推到前年,这样的话,未来20年将会翻天覆地。
这里面其实有几个特别有意思的事情,我们看这个图,首先是这里没有百年老店,愿意读书的人,尤其读管理学的,有一定年纪的人一定看过一本书叫做《基业常青》。这本书非常火,后来这本书出版以后5-10年,《基业常青》里的公司有一半就不常青了,大家觉得很困惑,总结出来的规律到底有没有用?后来写了叫做《从优秀到卓越》。看这个图会发现一个很有意思的点,这五家公司历史最长的是微软,1975年建立到现在为止不过40年的时间,苹果和微软是40年的公司,另外三家是20年的公司。我们因此得到一个东西,不存在永久的伟大公司。第二,伟大公司在一个伟大的时代,做了一件非常重要的对于人类有贡献的事情。所以人工智能正处在一个风口,这里面将来会涌现出很多重要的公司,会改变这个世界和人类。
实现路径,人工智能怎样影响这个社会,大体上总结有几点:
第一,未来20年还是弱人工智能时代。很多人一谈就谈到了什么天网灭掉人类,跟人类竞争,这个东西还比较远,我们都是搞科技的,那是几十年以后我们再说的事情。
第二,低技能到高技能,这个技能人学的时间越短,机器学相应复杂度低一点的。最普遍的机器人就是扫地机器人,因为扫地这个技能比较容易,还有停车场的收费现在也在变化,我记得这是最近两年的事情,以前每次都要取个卡,现在你的车直接开过去,摄像头拍一下就过去了。这个就是低技能到高技能,高数据化向高技能,互联网有关的数据走得早一点。现在金融走得不错,历史上这些产业上积累了很多的数据,因此大量的数据就容易学习。但是有一些行业比较累,比如说自动驾驶,谷歌等各个企业其实现在都在攒大量的数据,包括农业、工业也是数据量严重不足,医疗数据量很大,但是质量严重不足。这些都面临着一些问题。不管通过创业公司或者大公司,当这些行业从零开始攒数据或者清洗数据,等到数据量足够的时候,相应的智能也会慢慢发展起来。
智能驾驶领域基本上来看,5年左右应该有可以商业化的车。很多时候我们开玩笑,或许20年以后人在路上开车都是违法了,因为自动驾驶,通过车联网它们之间可以有非常好的交流沟通,人跟它们反而很难沟通,所以人其实有一个很大的问题,从生物学上来讲,就是我们看到了事情,然后转化为脑子处理,再转化为行动,这之间有一个0.1-0.2秒的延迟,如果车上的高速传感器高速运转,比这个高效多了,互相之间可以同步做很多的事情,使得效率大幅度的提升。
机器人我们看到有挺多的,扫地机器人卖得不错,我跟国内很多家企业都讨论过这个问题,包括百度、华为、联想都在想人工智能到底怎么起来。亚马逊并不是人工智能见长的公司,但其智能音箱全球销量超过一千万台,正在逐步建立自己的生态,变成一个新的所谓互联网入口,这些都值得思考。很多人都认为这是一个对话系统,但它是其实更像是一个万能系统。一开始只解决狭窄领域的问题,现在逐渐往上面加东西。
工业制造,现在这一块也是发展得非常快,比如特斯拉工厂就实现了所谓无人化,无人不是没有人,而是没有流水线的工人,只有工程师盯着整个系统的运转。
医疗,大家也知道了,今年开始或者去年年底,陆续有过几篇文章,在医学影像、疾病预测等等方向上取得一些突破,逐渐在一些狭窄领域上、一两个点上达到或者超过了人类医生的水平。
整个蚂蚁金服估值非常高,在全球独角兽排第一的公司,它的核心就是阿里积攒了大量的交易数据,进行分析之后做出来很多模型,用到金融上。对于信用和贷款这一块,我们更相信它会变成产业链或者行业金融的形式,谁拥有这个行业的数据比较多?进而产生一个衍生品,有数据对借贷者进行准确评估、风险控制,因此就可以更准确、更敢于把钱借给他,保证他能还。如果说从外面弄,没有这些基础数据,难度会非常大。所以很多人说现在kensho(雷锋网注:美国金融大数据公司)很火,想想它未来在哪儿,谁有竞争优势。
有些人说创业是过程,中间热一段,只有未来能够站得住脚的假设,才能真正走下去。
大公司和创业公司。现在创业蛮多的,我知道现在很多人,尤其很多院校的一些教授、博士参与或者说已经出去创业了。我相信未来的五年、十年,还会有很多这样的现象。因为我们有非常深厚的技术积累,用到产业上,一旦找到一个好的点就真的能够突破了。
这里面去创业到底有什么风险,大概几年前很多公司的高层都在聊,人工智能这波创业,创业公司有没有机会?是不是就是大公司的菜?bat有钱有人有数据,怎么办?
我们看一下这大论据,第一叫人才很贵,招人很贵。在座的人更多有两个想法,第一个是说我管这个部门,我管这个系,这个学院,我下面的老师被挖的差不多了,还有一堆人正在被抢怎么办?还有一种想法,我正在被挖,我到底该留下来还是该走?现在很多的一些博士刚刚毕业,美国的话有一些好学校,做得非常好的博士一毕业薪酬往百万美金冲,国内上百万人民币的也有一些,这个行业是真的非常热。你说一个创业公司招不起人怎么办?
数据刚才也讲了,bat真的有很多数据,他们天天都在搜集数据,处理数据,分析数据。我们作为一个创业公司没有数据怎么办?怎么跟bat相比?
机器,大公司有机器,小公司有梦想。你可以融资,挑战就是机遇,你被逼到死角要找。我特别欣赏北大的师兄俞敏洪,绝望中寻找希望。这个创业事情永远都是九死一生,如果你只是看到困难就不要做了。
在这种高压下,有没有机会?
从人才方面讲,最优秀的人才是愿意打工还是愿意自己干?大家心里其实比较明白。最近我们看到了很多创业公司,都是从bat、谷歌、脸书、微软跳出来的,有一定成就的人做的。他们更愿意追求自己的理想。有时候在大企业他会遇到很多限制、机会的问题,所以很多的创业者觉得优秀人愿意出来创业。
不能把数据狭窄化,认为互联网数据就是这个世界上仅有的数据。其实我们要知道现在互联网仅仅是有一些产业的数据,比如说阿里是零售业的数据,百度是信息服务业的数据,腾讯是人的交流和沟通的数据,但是比如说医疗数据,交通运输物流的数据,农业数据,制造业数据,法律数据,很多行业的数据他们都没有,因此这些行业都有很多机会可以做。
机器,最近大家都知道,人工智能公司还是很能融钱的。我刚才跟他们聊,他们以前投的公司最近刚刚拿了三个多亿的融资,一旦有未来的话,很多vc真的给你钱,你烧起钱来比大企业胆量还大。你还记得o2o的时候,可以烧到百度跟阿里发颤,创业公司还拼命烧,没有上市,就没有股东,所有股民的股东。投资者只要看远期,他是支持你烧的,但是作为大企业,你的利润突然有一个剧烈的下降,你很难跟股民解释。所以这个里面有时候不好说,创业上还是有机会的。
怎样做产业需要的科研呢?大家对这个问题蛮感兴趣的,我自己也做很多的事情。我在北京大学人工智能创新中心当主任。我们主要想做的事情,就是学校、科研机构拥有最好的技术,怎么样能够落地呢?
我特别关注ai 产业,包括北大也开了一门课,我发现因为ai很火,学校选修的学生很多,400多名研究生选了这门公选课。因为教室的原因,最后录了两百人。人工智能是大家热切关注的领域,那么怎样做一个有用的研究呢?
我简单分享一下个人的想法。我从网上获得的数据显示(这个数据不保证完全正确),中国的研究成果转化率:发改委副主任说是10%,欧美是40%,当然我也不知道这个欧美40%是不是真实的,但是总体来讲中国确实不高,做了这么多研究真正能够落地的多吗?
我们再看一个事情,科研和产业真的能够联合起来做成一些事情吗?其实不一定。
先说不同点,首先科研追求学术价值,产业追求生活中的需要。什么是学术价值?在一个地方做到世界最领先这是学术价值。但是产业不是这样,他说我解决一个问题,能解决问题就行了,不需要最先进的技术。比如:扫地机器人,也是人工智能,但是并没有太多人工智能,就是路径规划加一些硬件,然后做得比较好。
解决实际的问题和高大上的、做最火的东西之间确实有一些不匹配的点。另外我认为有一点特别重要,科研是单点突破,产业则需要完整的产品或服务。学术在一个点上精益求精,很多人参与创业或者在一些公司做顾问,你就会知道如果做产业的话,其实我不关注你那个刷的榜,把这个摄像头安在海关上,能够给我抓一个罪犯,这个人到底是不是假证,能不能认出来这是我最关注的事情,同时要给我一个完整的米乐m6平台的解决方案,这个不能宕机,要保证稳定性,是个完整的东西不是一个某一个点。
科研为了做一个事情不惜代价,但是产业不可以。举一个例子,大家做量子研究,需要非常高的投入,但是产业绝对不可以这样,产业要以买得起来衡量。举个例子,比如说谷歌的眼镜,感觉蛮酷的,但是这个东西很重,我记得在美国卖的时候大概是一两千美金,完全不是老百姓可以买的,因此这个东西很难落地。例如,像汽车也是非常贵的,所以必须要降到一个可接受的范围。比如做一个特别好的手机,一个手机卖两万我敢保证不一定卖得很好,但是卖四千我觉得你可以把苹果干掉了。
科研是不断进步的,但是产业的要求是能不能用,好不好用。比如说人脸识别,错误率从8%-7%,每一步进步在科研上都是重要的,都是全球最好的。但是产业根本不管,产业说我雇了一个人,假如说人的错误率是3%,你达不到3%对于我来说没有用,你一旦超过3%立刻就有用了。
研究的时候完全可以从真实需求中探求课题,做人脸识别挺好,不要做狗脸识别。完整服务的这一块确实很难服务。我们需要找关键的部分,比如说用来抓坏人,这个人脸怎么识别,你把这个解决了,再配一些其他技术就可以卖钱了。研究的时候看这个东西成本是否是可控的,保证良好的性价比。
我并不否认做基础研究,大家一定要注意,确实需要很多人做一些基础的研究。大家需要有一个长远的思路,有些人更愿意跟产业结合,用这些东西好好想想,选择研究课题的时候确实落地起来更容易一些。
鱼和熊掌可不可兼得?你选择理论物理学咱们就先别想它能不能用,产业研究就想怎么样落地。科研 产业型研究可不可以?这项东西很高大上,但是接近产业化了。ai时代,科研产业化有什么特点?什么样的研究特别有价值?
第一,ai做的东西快要接近或者超过人了,这一般都是非常有价值的,一旦超过人,它的产业价值立刻就可以出来了。第二,有足够的数据。不要做一个bat有足够数据的东西,你没有数据真的很难打,但是跟医疗机构合作,跟教育机构合作,有数据可不可以,这非常好,bat跟他们合作相对更难。因为传统产业在过去很长时间老被颠覆,它都快狂掉了,这个时候bat再找他合作,他们的第一想法就是“黄鼠狼跟鸡拜年”。然而小企业合作起来更顺畅,你可以跟他一起共赢,但是我们也不知道最后能否共赢,那是一个未知数,但是起码开始进得去。
关于创业我有几个建议:
第一,找到需求。创业团队在介绍自己技术的时候,常说自己的技术可以应用在很多行业,例如教育、安放、工业等都可以用这个,但就是没用。因为技术不落到一个实际场景上,不能解决实际问题就是没有用,所以我们要迅速找到你的需求。
第二,找到产品化的团队。一个技术能用到、实用有很大的距离,光靠科学家完全不行,要找到工程团队。
第四,要找到商业化的团队。
第五,调整到产业态度。我知道很多创业公司在那儿刷榜,其实刷榜已经少了。刷榜没有什么太大用处,一个技术发展到一定程度,大家差得不多,但是实际的应用环境下的话,你结合不好反而差得特别多,所以一定要调整到产业态度:我解决实际问题解决得好不好,我让产业人评价而不是搞技术的人评价。
最后,找到商业模式,现在很多vc最后一个问的很多,你怎么样赚钱你跟我讲清楚,你有技术别人也有,现在的技术不太稀缺了,不像两年前你说我做ai,别人说你很有名我就研究。大型科技公司已经占领的领域确实有挑战,但是有没有机会?也有机会,不过难一点。这个世界没有任何是必然的,只是概率问题。
下面这些领域我觉得很有机会,比如说企业服务,以前叫bi换成新bi,客服机器人,帮企业找到他的客户,还有舆情监控等等一些东西。医疗健康,包括家庭机器人,扫地机器人,助理,自动驾驶,包括法律、审计这些,其实都是有机会的。
每一个产业都有很大的市场,比如医疗领域,占中国gdp的6%,美国18%,在每个都比整个互联网产业还要大的产业里,当然有机会。比如驾驶,基本上也是在中国10%以上的gdp的产业。我指的较物流运输业,整个加起来非常大,机会非常多。
其实我们在一个非常令人振奋和激动人心的年代,ai的技术已经到了一个突破口,因此这些技术会不断应用在各行各业里面,大幅度提升这些行业的效率,解决实际的问题,进而使得行业有深远的发展。我相信未来20年一定会比过去2年更加精彩,机会更多,无论大家搞研究或者搞产业,只要在这个领域里面,我相信,能够为社会做的价值、机会,比以前还要多。
谢谢大家。