AI行业如何“反内卷”?
2021-12-01
来源:AI前线
从技术的发明到落地的“最后一公里”问题,是最具社会价值的命题。在人口红利逐渐消退的今天,各行各业都面临着人力成本居高不下,流程效率亟待待提高,拓客面不断变窄的影响,AI的兴起带来了一股转型的新风,却仍与人们最初的期待存在着差距。
11 月 23 日,粤港澳大湾区数字经济研究院(International Digital Economy Academy,简称“IDEA”)CTO Labs 总负责人幺宝刚与氪信科技创始人朱明杰、智加科技中国区总经理容力、 翼方健数首席科学家张霖涛等 AI 产业界代表者共同开启 AI 产业落地论坛,分享了各自在行业深耕的经历和思考。
以下内容由 InfoQ 整理自现场速记,经过不改变原意的删减。
主持人: 人工智能产业化的时代已经到来。但如何做“可落地”的 AI,真正体现出 AI 的社会效益和商业价值?在这个论坛上我们会邀请几位来自不同领域的行业大咖,分享他们在 AI 落地过程的经验和心得,共同探讨 AI 产业化的挑战、道路和前景。有请:
IDEA CTO Labs 总负责人幺宝刚
翼方健数首席科学家张霖涛
智加科技中国区总经理容力
氪信科技创始人朱明杰
幺宝刚: 大家早上好!我在 IDEA 是负责 CTO Labs 建设的,所以我对 AI 产业化一直非常关注。
昨天 Harry 也提到过,我们既要仰望星空又要脚踏实地,所以选择了一个很脚踏实地的话题。
首先我介绍一下在座的三位嘉宾:
朱明杰博士是我们 CTO 工作室第一批入驻的成员,氪信科技的创始人,毕业于科大少年班是 MIT Take Review 评选出的 35 岁以下创新的 35 人之一、上海市青年拔尖人才,氪信也是首批与 IDEA 成立 CTO Labs 的企业,我们也很期待接下来把这个工作室一起建设好。
张霖涛博士,毕业于北京大学和普林斯顿大学,也是 IEEE Fellow,在翼方健数担任首席科学家。翼方健数是我们昨天刚刚宣布的第二批工作室成员之一,也非常感谢霖涛博士的支持。
容力博士,毕业于清华大学和滑铁卢大学,在人工智能领域有 20 多年的实践经验和经历。他现在是智加科技的工程高级副总监和中国区总经理,也是自动驾驶领域,自动驾驶领域一直是我们很关注的赛道,也非常希望未来有这个领域的 CTO 工作室成立,也期待跟容力博士一起探讨未来的合作机会。
接下来请几位嘉宾先从他们自身的业务出发,来介绍一下他们怎么定义可落地的 AI。从明杰博士开始。
朱明杰:AI 要落地,首先行业的痛点要足够明显。氪信科技是一家 AI 公司,面向落地的行业主要是金融行业。现在中国尤其是银行,资产规模前 15 位的银行应该大部分都是我们的客户。我们是帮助他们做深度数字化转型的合作伙伴。
关于 AI 可落地这件事,首先要回答:这个行业或者这个场景为什么需要 AI?我们就拿银行来举例子。
2010 年以前,银行业是跑马圈地阶段,是一个人口红利时代,遍地是客户。一个银行要发展很简单,开网点,多去超市门口发金龙鱼。那时候肯定不需要什么 AI,只要多雇人,多开网点就可以。
2010 年以后,是来自于互联网的创新的良性启发阶段,大家都去开网点,竞争有点饱和了。还有像蚂蚁、微众包括很多互联网金融创新的挑战。金融行业里大家为了争夺开户,必须要学习互联网的服务方式,要围着客户去转。反映到银行身上,就是学习像余额宝一样做一些创新。
现在行业信息基础建设进程普遍起来了,这几年银行可能真的很痛苦,因为用户今天不缺金融服务,想做个转帐和支付交易,都可以不需要银行。而且现在风险越来越高,监管越来越严,这就是内卷。内卷以后要逼着大家找一个能放大它的生产力的大杀器,那就是 AI。
今天你再问一家银行需不需要 AI,他一定说需要的,因为痛点真的很强烈的。再举个具体的例子:去年中国破获的电信网络诈骗案件 32 万起,今年上半年同比增长了 60%,这个工作量和精准度不是人力能包揽的。
在这种场景上,我们也可以看到 金融行业很像中国社会的代表缩影——从人口红利开始往工程师红利。要借助工程师的力量、AI 的力量做这件事情。 我们做的也就是落地的事情。
幺宝刚: 有一个跟进的问题:我在物流领域工作过一段时间,一个大的问题是我们去哪里找机会点。
当时我们有一个非常简单的原则,就是哪儿人多就去哪儿找机会点。物流行业就是人力成本,把人力降下来。这是立竿见影能看到效果的。那金融领域怎么找机会点呢?
朱明杰: 我们从 2015 年底开始创业面向金融行业时就提到过:真爱只能用钱表达。我们做的事情一定是客户愿意买单的,愿意买单就是真实的痛点。
就像我刚才讲的,现在电信网络诈骗,它真的非常痛。因为这件事情如果没有做好,用户会来投诉,监管又要罚款,很多时候有这种客观的诉求存在,但又不可能靠业务人员一笔一笔查到是怎么回事,倒逼着他要想这件事情。这里面来自业务的需求在,我们就去做这件事情。
我们也定义了一个概念:有效 AI 应用场景。 要甄别出无效或者是伪应用场景,以免干扰我们的资源和经历。很幸运的,氪信过去这五年里,跟中国头部的金融机构不断探索、探讨哪些领域是刚需的。我们梳理了大概 24 个有效 AI 应用场景,包括信用反欺诈、反洗钱、可疑交易识别、智能营销。
这里面有很多细分领域,感兴趣的同志可以关注我们公司后续一些产品介绍,谢谢大家!
幺宝刚: 谢谢明杰博士。容力博士,从你们业务角度介绍一下什么叫可落地的 AI。
容力: 我们公司叫智加科技,是做重卡干线物流上的自动驾驶。所谓干线物流是指长途运输,主要跑高速公路,做自动驾驶,重卡是指我国拉着集装箱的大卡车。
谈到落地应用,我们做了这几年,深有体会。因为我们做的不是一个研究的项目,是要应用在重卡上的项目。
基本总结,一个可以落地的人工智能技术,在我们看来有三个点很重要:一是选中的应用一定要解决一个什么痛点或者是一个什么问题。可以是一个经济问题,也可以是一个社会问题,也可以既是经济问题也是社会问题。重卡的运输,是经济 + 社会的问题。
从经济上来讲,降本增效。未来如果能够实现无人驾驶,卡车司机这种繁重的工作,而且工资也比较高,它可以达到很高的降本增效效应。社会效应也是,如同以前织布机替代纺织工人一样,带来的是产业上的变化,社会效应也很大。
二是要可以应用。因为社会上痛点很多,问题很多,但不是所有的问题能在看得见的未来通过技术解决的。所以我们要选择一个技术能够落地解决的问题。比如现在脑机接口,不是说不能解决,十年看不到最后的应用成果。包括要探索人类的下一次移民的地方。这个问题很严重,看过《三体》的都知道,很多问题。
但我们现在作为一个公司,看中的是在看得见的三五年时间里能解决。
三是 Scalable。选择一个 AI 能够解决社会或者经济问题,而且可应用,还得 Scalable,这样才能挣更多钱。我们所看中的物流市场,是万亿级的市场,市场规模非常大,国民经济将近 15%GDP 花在物流运输上。如果对物流运输带来降本增效的作用,哪怕是几个百分点,都是巨大的经济效应。
幺宝刚: 下面有请张霖涛博士为我们分享。
张霖涛: 首先非常感谢能有这个机会跟大家分享一下我们在 AI、数据方面做的一些工作,非常荣幸能够加入 CTO 工作室,来和 IDEA 合作,我们也 Looking forward 很多成果。
我们公司叫翼方健数,做隐私计算赛道。公司已经有五年历史。最近几年隐私计算是大家比较关注的行业,我们也希望在这方面为 AI 助力。
我们公司跟其他一些隐私公司不太一样的情况是,我们公司比较专注于医疗健康、生物信息等等行业。原因很简单,因为我们公司成立得比较早,当时其他行业都还在买数据。
所谓可落地的 AI,可能跟金融等行业不太一样。比如金融,大家能够看到这个数据的价值,比如能获多少客,或者我的风险降低了多少个点。在有些数据使用得不是特别好的行业,比如医疗健康,这是非常传统的行业,非常难啃的骨头。怎么样把这个技术落地,是非常有挑战的事情。
医疗行业有非常大的潜力,我们称之为有很高势能的行业。这个地方有很大的势能,但中间有一个坝,怎么能敲掉其中一些石头,把这个水流下来一点,就会产生很大的经济效益,但你说上来就能把整快山移开,这是不太现实的。
我们在这个行业的思考是,用 AI 的能力帮助医生或者帮助一些其他的医疗患者。这个功能必须要有医院会买单或者对医生有实实在在的价值。比如刚才说的诊疗医生,如果我能做一个医生,非常了不起。你想做一个 AI 医生,需要诊疗模型。这个诊疗模型的意思是根据你的症状就知道得了什么病,或者根据这些病,要得到什么药,要建一个大的 AI 系统。
但这个事是非常难做的,包括 IBM 做沃森,Deep Mind 做这些,都想一下子做出来。在实际应用中,你说“我想跟医生说我有一个东西能代替你。”这是很难做的。我们想做一些医生能认可的,像病例自控。比如你做了一个诊疗,这个人得了胃病,但你发现你的病例上诊断都是肺部的,肺的 X 光等等,要么是病例写错了,要么是当时的诊断有些问题。对于医院病例科都是非常有价值的。
另外我们还可以帮助填写病例,叫病例助手。医生要花二三十分钟写一份病例,把各种观察记录上去。我们能不能根据从病例中学习的一些知识,帮助医生来填。我们发现用知识库、诊疗模型等可以帮助客户省非常多时间。我们在一些大的三甲医院做测试后,发现很多医生都非常欢迎这样的产品,因为它帮医生省了时间。这都是业务落地的场景。
我们当然希望最后做的技术就是做一个病例辅导,随着我们能够收集更多数据,更多的医院 Deploy 这些系统,就可以训练出更好的模型,最后希望可以往诊疗方向走。
幺宝刚: 谢谢三位嘉宾对这个问题的分享。刚才有两个点大家都不同程度的提到,一个是怎么样能够找到真正的痛点和需求,一个是怎么样能够规模化落地。
我讲一下我自己遇到的一个亲身体会,AI,尤其是技术型的公司,往往会针对一个具体问题,定义得很清楚,去解决这个问题。但从产业或者企业的角度,往往是把整个解决方案提供出来。
举两个物流行业实际的例子,一个是用光学识别的方法,快速识别物品要到达的地址。后来我们落地时发现这个数据实验室很准,到场地不准。原来是上面有一个风扇在吹传送带,很薄的快递就被吹跑了,解决的方法是把电风扇换个位置。
另外一个例子,AGV 在场地里运输货品。一到实际场地里,速度、精准度都有问题,主要是因为灰尘太大。
从企业的角度,你只给他解决一个技术上的单点问题可能不够,他需要一个解决方案。我想知道,从氪信的角度,你们是会端到端把问题解决还是跟他们一起合作,把技术难点突破一下?
朱明杰: 氪信是第一批成立 CTO 工作室的,主要做了些什么呢?我们通过这段时间和幺宝刚老师合作,宝刚老师很多经验,包括 IDEA 其他研究员丰富的经验,对我们本身的工作和产品有很多启发,这是很也共通的。大家面对的问题,不同行业都差不多。
刚刚宝刚老师说在物流行业遇到什么问题。在金融行业里,我们说到底提供什么东西时,一样会遇到。
这个事情是业务和技术之间的距离,或者叫人机距离。 操作的人跟最后给他一个算法的东西,算法解决只是其中一个问题,这之间有很大的距离。业务员不懂到底怎么回事,出来一个数字或者模型,要解释给他。尤其 AI 又是黑盒子,在金融里这个问题非常重,但在一开始时又不得不给他提供的是单点的技术问题。
最开始时我们什么都没有,面对的客户又是非常大的银行。大金融机构被逼到内卷后没有办法,就要开始自动决策,会抛出一些单点的问题让你来解决。AI 公司都是去解决这样的技术问题。但后面的客户说他既不是那么熟悉数据,对业务的了解也没那么多,还需要你去告诉他该怎么做这件事情。
我们提供的产品解决方案是 AI 部分要加上业务部分,所以我们把这个东西叫 AI+Professional knowledge(专业知识)+Integration(融合),简称“API”战略。 我们过去几年在给大客户里做的单点技术问题过程中,一直在学习业务的 Know-How。把业务的 Know-How 变成内核是 AI 的技术框架,外面加一个业务解释层,能让业务的人懂,而且还能预制一些业务指导操作的经验,这样才能把产品给推广出去。
归纳下来,我们做这件事情,是需要在前期做单点,越到后面沉淀的东西越多,能固化下来的东西就越多。像最开始,大家拿的 AI 是电动机,不知道能干什么,我们就去不断向主人科普:你洗衣服怎么做的,我是不是可以帮你做一个壳?那就做成洗衣机;或者你需要做一个制冷的东西,我们可以做一个电冰箱。
客户要的是电冰箱、电饭锅、空调、洗衣机,不是要你的电动机。
幺宝刚: 容力博士,自动驾驶现在可以说是风口,大家都在往这个方向投入、努力。肯定这里面有很多需求,因为它既是经济问题也是社会问题,你们为什么选择了重卡领域而不是乘用车领域?
容力: 这里一个关键点是重卡作为运输的,按照我们以前学的理论,它是一个生产资料或者生产工具。它跟我们平常用的车是不一样的,作为一个生产工具,你如果给它一点降本增效的效应,就会让资本家有极大的兴趣。
卡车做自动驾驶和乘用车做自动驾驶都有一个共同点,现在技术不是完全成熟。如果在路上碰见一辆车在公开道路上开,车里没有司机,这还是比较罕见的,只有在非常少的限定的小区域里测试可以做到。
这个技术还没有那么成熟,但我们认为重卡的自动驾驶将会率先落地,率先落地的逻辑是因为我在能够完全去掉驾驶员实现之前的情况下,就带来降本增效的效益。因为现在通过人工智能、大数据、算法,能够让人工智能的辅助驾驶在开卡车时比老司机还省油。
大家做过物流行业,尤其是重卡驾驶,就知道我要是做一个物流企业尤其做一个车队,一年的费用里,将近 25-30% 是油费。如果通过人工智能自动驾驶方法,比老司机能省大概 10% 的油费。这是巨大的效益,尤其在物流行业内卷比较严重的情况下。
在完全无人驾驶实现之前,我们目前看到中的这个赛道,用重卡做无人驾驶,今年、明年就能达到这个效益。
我们公司做现在的自动驾驶卡车,是前装量产,跟一汽解放合作的,今年已经量产下线了。我们认为我们过去两年多的努力没有白费,现在能把自动驾驶、人工智能技术落地到重卡上。如果我们去做乘用车,它是看起来很性感的东西,比如我们做人工智能做到了比特斯拉还强,这一定是新闻头条 。但在我们作为公司来看,我们看中的不是上新闻头条,也不是把自动驾驶这个技术让大家都知道。我们是想挣钱的,这也是为什么选重卡自动驾驶。
幺宝刚: 容力博士,你既然提到特斯拉,我必须问一句。特斯拉花了很多精力投入到 FSD(完全自动驾驶)技术,在新闻上也做了很多这方面的宣传。乘用车的 FSD 技术跟重卡有什么关键的核心上的不同?
容力: 技术本身差别不大,两个流派:Waymo 流派、特斯拉流派的。Waymo 从收集数据开始做,大概现在有 600 台车在路上跑。还有一个是特斯拉这种方式,一边造火箭,一边造车。火箭是星辰大海,车是现在就挣钱,车给大家带来推背感的体验。
在我看来和重卡相比,技术没有太大区别。我们认为特斯拉的路线可能是正确的,首先要让车在路上跑,跑了才有足够的数据,有 100 万辆车的自动驾驶在路上跑,最后才能说那么快能实现 FSD。这样的数量规模是 Waymo 这几百台车没法比的。
可以说我过去受到宝刚和其他同事们的教育,一直认为大数据,100 万辆车的规模在路上跑,收集的各种各样数据,这是无法用一个实验室里拍几百台车的数据能解决的。
幺宝刚: 霖涛博士,刚刚您也介绍了你们在医疗领域的一些具体应用。但在我心目中翼方健数首先是一个很大的平台公司,隐私计算也是你们很关注的领域。回到需求,有一个说法,说隐私计算是“AI 落地的最后一公里”,您同不同意这个说法?
张霖涛: 我当然非常同意。我刚才说到很多 AI 应用问题,我们不是传统意义上的 AI 公司,是隐私计算公司,做数据和平台的。
问题在于我为什么要去做 AI,隐私计算本身不一定有任何价值,价值最后还是要数据的价值,用户觉得我需要这个东西。
像朱博士刚才谈的电,我们之所以要做这些应用,就相当于先弄个灯泡。我怎么能告诉你说电有用,这很难。你告诉我电有用,将来怎么样怎么样,人家说我现在有什么用?你说我现在就能给你点亮灯泡。我们现在讲的辅助诊疗是做这样的事情。
我们不希望说以后你家里的电器都我包了,这不是我们的目的。我们希望电给你布好了,将来有更加专业的公司能够把其他事情做起来, 比如医院里有各种信息化,比如药企就愿意用医院的数据做药物研发。比如保险公司会愿意用医院的数据对医疗的保险做很多控费,能够更有选择的进行保单的定价等等。
像这样事情,不一定是我们能做,当然我们也会去联系数据员和数据提供方。但我们也深深知道,数据全部用起来,数据的价值,这是几十万亿的市场,肯定有很多很多公司在这个 ecosystem 里大家一起贡献。但最重要的事情是一开始能把这个数据先变成一个可用的情况。
所谓可用的状态,医院里以前信息化是各种公司的设备宕出来的数据,每一家医院的影像设备都不是同一家公司造的。他们也无所谓,因为这个数据是不准备给别人用的,只是万一出了什么事需要查,就拿来用。我怎么把这个数据弄成将来被药企、保险公司用。我们需要做这个数据的治理、清理、归一和数据标准的制定。这些事情我们都得做,而这个东西也要用很多很多 AI 的技能,因为不可能全部都用手做,我们在这个过程中用了很多工具。
这么多工具,难道只是为了医疗上给大家填病例吗?不是的。后面希望把这个事情 skill 起来,需要各个其他公司的贡献或者一起协作。
幺宝刚: 谢谢霖涛博士。三位嘉宾都是有科学家头脑的创业者,从企业角度,企业对投入产出还是很在意的。在 AI 落地过程中,很多时候遇到的问题是项目制和规模化。怎么样避免被困于定制化的瓶颈中?
张霖涛: 也不是,这是所有 To B、To G 业务的痛点,我们公司主要是 To B 和 To G,不像 To C 的业务,做一份东西所有人都能用,To B 和 To G 往往是要定制的。我们也是深刻认识到这一点,其实没有什么特别好的答案。
我们在过程中不断地优化自己的能力。比如像做数据清洗,第一个医院进去,折腾得不得了,为了折腾这些工具,就建了很多自己的工具,用 Machine learning 的方法做得更快一点。到第二家医院就发现好多了,但又出现各种各样的问题,我们又得修。等做到第十家医院,该见过的事情都见过了,希望是这样做。从我们过去的经验来说,确实是这样。
很多 To C 的公司也会遇到这样的问题。第一个客户和第二个客户可能不一样,但第 1000 个客户和前面 999 个客户已经覆盖得差不太多了。
容力: 对于自动驾驶来讲,第一步就想得非常清楚我们要做一个产品,所以非常仔细的花一些时间定义这个产品,包括跟一汽解放合资成立像智途公司来发布这个产品,包括和我们的大股东满帮集团,我们很早就定义了这个产品,按产品的方式做。这样很早就规避了做项目,从第一个做到第十个的情况,取决于产业链最开始的建立,绕过了很多问题。
这是我们公司过去走的路。
朱明杰: 解决这个问题,最重要是产品化。我们这几年的实践下来有两点心得:一是用 AI 工程化的能力解决这个问题。我直接拿一个电动机给人,他就问你这个电动机能不能抽水,能不能干啥,你每一个都要给他做一套。
我们的 AI 决策引擎叫“非或然引擎”,外面套了一个 Pilot“业务专家驾驶舱”的壳,缩短人机交互的距离,能让业务人员更透明的看到输出结果和业务之间的关系。这需要跟业务场景磨炼很长时间,我们希望快速的做出“洗衣机”和标准的东西。
再者,就是跟大的头部客户做标杆,跟相对小的客户做规模化拓展。 因为相对小的客户自己知道他的业务知识也需要依赖于你,你的 Pilot 系统加“非或然引擎”给他的东西能够解决他 90% 的问题,也会更信赖你。
总结起来,还是响应沈向洋老师的建议:躬身入局。 我们做了好几年这样的工作,从这两年开始能看到一些收获,逐渐把这个业务和形成的“非或然引擎”+Pilot 系统集成 API,在通用场景上把它推广开。我们也希望以更快的速度让更多客户能够用上这些东西。
幺宝刚: 我们刚刚都谈了一些非常脚踏实地的话题。最后我想问一个仰望星空一点的问题:有一个说法是未来所有的企业都是 AI 企业。我也想请几位畅想一下,我们离这个未来还有多远?
朱明杰:行业进入到内卷时代后,就不得不成为 AI 企业。 说白了就是人口红利没了,必须借助工程师红利,如果工程师红利也不能解决,可能就留给未来去解决的问题吧。
比如我就自己开一个包子铺,不用什么 AI,只要把我家门口的生意做好就行了。但我要开一个连锁包子铺,要管理上千家企业,这么多流程,一定要从浅层数字化到深层数字化做到,做到这件事,必然倒逼 AI 的企业转型。
容力: 说所有的公司都是 AI 的公司,看怎么去理解。我认为这是一个非常非常美好的前景。对于我们在座的大家应该是非常好的,一小部分公司会成为 AI 的公司,其他的公司不得不借助我们在座的人,这些 AI 公司,去拥抱未来。
为什么只有一小部分人才能做到真正的 AI 公司,其他的公司去仰仗我们这些公司做事呢?因为成为一个 AI 公司并不那么容易,要有 AI 的人才、文化,还要有 AI 的胸怀。
张霖涛:我们认为不一定所有的公司最后都是 AI 公司,但所有公司可能都是数据驱动的公司或者数据公司。这个数据要拿出来用,需要更多的 expertise。
比如要做 AI,我们现在知道算法、算力、数据。不是所有的公司都有这三个能力这三个能力是非常非常少的 combination。阿里巴巴有,但随便一个社区医院不可能有这方面的能力。我们隐私计算做的事情是希望把这个东西 decompose。decompose 的意思是提供数据的人不一定懂算法,做算法的人不一定有数据。
像刚才说的包子铺概念,我开一家包子铺,有很多数据,我的客户都是谁,每天来我这儿吃多少包子。但问题在于你这个包子铺一共就三个员工,不可能有这样的能力。但他有数据,如果能把这个数据 expose 给别人,让别人来用,并且在很小的摩擦,建立数据和服务,很容易做起来,这就是隐私计算希望做的事情。
做成这件事后可能就有别人来为他服务,有一个标准的应用,把他的数据分析,说你应该这么调你的包子馅,因为别人都是怎么做的,你这个怎么做的。将来可能所有公司都是数据驱动或者 AI 的公司。
幺宝刚: 这个话题是非常大的话题,随着技术的发展,人才的集聚,外面的大环境包括人口红利逐渐消失,产业升级的需求,这个问题也变得越来越重要,我们只是在这个领域从不同行业、不同方法去尝试。