cha

对话冯·诺依曼理论奖得主叶荫宇:ChatGPT于行业智能,更像是全科医生对专科医生|

  对话冯·诺依曼理论奖得主叶荫宇:ChatGPT于行业智能,更像是全科医生对专科医生|(图1)

  1

  钛媒体特别专题策划《数字思考者50人》:探访中国50位独具代表的数字化思考者。我们理解的 TechThinker ,涵盖了中国数字化浪潮中的技术践行者、政策制定者与投资决策者。在这场长达10年的乘风破浪中,我们每个人都在分享技术进步的果实,却鲜有人知道结果背后的故事。我们期待通过《50人》,还原中国数字化推进过程中的关键决策,同时也为你呈现数字思考者们的管理与经营之道。

  国际市场震荡不定,供应链波动剧烈、芯片短缺、碳排限制......百年变局叠加世纪疫情,大环境的震荡层层传递到企业生产制造中,当这些限制条件突然产生的时候,整个企业的生产运营如何应对?怎样能够在受到限制的情况下,仍然最大化利用产能去实现生产?

  这时简单依靠经验“拍脑袋”决定显然不再奏效,因为人工经验总是基于过去已经发生的,没有办法快速地应对不断产生的新问题,也无法精确优化一个高度复杂与随机的大系统。

  尽管在工业数字化的进程中,方式方法持续升级,但是常规的数字化系统要么协同性不够,要么精准度较差,计算和决策效率低,一旦遇到变化就显得非常脆弱,更不要说在多种突变因素之下快速制定优化方案,没有办法真正发挥数据的价值,而此类问题正是智能决策技术所擅长解决的。

  小到一个需求的波动、一个生产场景下的急单插单,大到疫情、国际形势这些黑天鹅事件,智能决策就是在大量的约束条件下,快速找到最优的解决方案,让资源的使用效益最大化。比如订单满足率最大化、库存成本最小化,或是运输成本最小化等等。

  随着数字化转型进入深水区,外部经济增长放缓,对于企业而言,如果不紧跟步伐做出转型,那么面临的就不是赚不赚钱的问题,而是生与死的问题。越来越多的企业渴望通过引入智能决策,以直观发现、分析、预警数据中所隐藏的问题,及时应对业务中的风险,向最优决策无限靠近。

  智能决策的共识在倒逼中逐渐建立起来,但实践道路比想象中艰难得多、复杂得多。

  技术被寄予厚望,但技术也有能力边界。随着ChatGPT大热,很多人都开始畅想AI技术能在工业的复杂决策场景中发挥越来越重要的作用。

  从上世纪80年代开始,叶荫宇教授就一直专注在运筹优化领域的研究。2009年曾获得美国运筹与管理学会最高奖,冯·诺依曼理论奖,也是获得此奖的首位华人学者。在他看来,精确的数学建模仍然是主流的方法,运筹学的诞生就是为了解决问题,因为有可解释性、可控性,“有些企业管理者会特别关注决策结果的可解释性。特别是在工业运用中,有些是多目标的,不是只有一个目标函数,要权衡各种不同因素,权衡不同的利益,完全靠黑箱是会有问题的。”

  不过,技术的使用并不是“非黑即白”的选择题,数字化的商务决策中,一般要经历建模、求解、决策多个流程,AI的强项在于量化、需求管理、规律性分析,而决策中则需要平衡与优化一些高度复杂,约束互相制约的优化模型和运筹学模型。盲目的追求单一技术的“通用性”并不是最好的方式,“AI也不会完全取代优化算法”,将运筹学和AI深度融合,各取所长,才是更实际的做法。

  比起短平快的To C企业,To B企业接受考验的链条更长、维度更多,技术之外,要解决的问题和场景更复杂。一方面既要深入行业,又要避免掉进劳动密集型的定制化陷阱。另一方面,像经营决策、计划排产、资源调度等等,这些答案都掌握在行业Know-How手中。

  技术与实践短兵相接的地方不是一个接触点,而是一个多方位的接触体,既要向内招揽行业专家,归纳不同行业底层逻辑,平衡服务边界与服务成本,又要向外坐在一起了解一个个具体的需求,向下扎根服务能力。

  面对技术在业务面前“自证价值”的问题还要拿得出“真金白银”的量化指标:在库存上节约了多少钱,在订单满足率上提升了多少个百分点,产能利用率提升了多少,产能浪费降低了多少,碳排放指标合理利用了多少……

  凡此种种,我们不难看到,智能决策技术落地的背后早已不是一个方向性的大问题,而是实践过程中十个、百个、千个的小问题。此刻,唯有扎扎实实的苦功夫,才是真实有效的。

  去年下半年,叶荫宇教授开始了六年一次的学术假期,这次他把大部分时间放在了国内,走访企业、在智能决策公司杉数科技指导算法研究、在大学授课。借此机会,钛媒体APP和叶荫宇教授聊了聊运筹优化的应用发展与趋势、AI的影响和融合等话题,希望借由他多年的学术研究视角,以一个更理性的角度看待当下的热点与实际问题。

  钛媒体:您有关注目前大热的ChatGPT吗?

  叶荫宇:从我的角度来说, ChatGPT在应用场景中还是属于一种你来我往的形式,有人把它叫做“博弈”,有人把它叫做interaction(交互)。之前的AlphaGo的场景是下围棋,也是你来我往的博弈过程。其实严格地说,瞄准这种场景的过程,在运筹学中很早就有模型,例如常见的“马尔可夫决策过程”(Markov Decision Process),就是刻画如何在不同情况下,采取最优的行动(action)。

  最近又出了一个Markov Decision Process with generation(生成式马尔可夫决策),generative有两个含义,一个含义就是更多的案例,更多的语种,用ChatGPT来说就是更多的文本出现了。可以采索的action可以不断地创造新的答案,新的回答。ChatGPT 将大语言模型和强化学习有机的结合起来,使得我们可以对语言模型的输出质量进行有效评价,这样的奖惩反馈机制可以使得ChatGPT不断进步,创造出更好的文章。而本质上,强化学习也是一个基于马尔可夫决策过程的多阶段复杂优化问题。它将机器学习和马尔可夫决策过程融合起来,自动地学习马尔可夫决策过程中的奖励函数和状态转移过程。

  钛媒体:也就是说,不管是AlphaGo还是ChatGPT,最终都可以追溯到求解优化问题。

  叶荫宇:所有这些模型都是先要搭建一个框架,多少层,多少个函数源,是什么架构等等,最后架构出来。AlphaGo和ChatGPT某种程度上可以看作数据,算力与算法在工程上的完美结合与实践。在这个过程中,每个部分都发挥了极其重要的作用。毫无疑问,算法是其非常核心的重要环节。

  钛媒体:之前看过您一个发言,讲到了当年选择专业的时候,也是AI和运筹学做了一些权衡的,后来还是选择了运筹学。

  叶荫宇:对,我1982年去美国的时候,AI也是非常火热的时候,当时我还参加了一个叫做“构造一个专家系统”(Experts System),就是建一个好的方法,希望把所有专家的东西整合起来,形成一个统一的回答、统一的意见。

  但是当时有两个瓶颈,第一个是数据不大,当时没有网络,大家只能在报纸上搜集东西,太慢了,没有很大的数据来训练那个专家系统;第二个就是哪怕数据大了以后,算力跟不上,就不可能把模型训练得很好。

  后来我就改做运筹学,搞算法,在某种意义上也是因为那个方向当时遇到了瓶颈,转而去搞底层算法构造、底层算法设计。

  钛媒体:我们和一些做大模型研究的人交流过,他们说原来很多算法随着参数、数据的增加,曲线会有平缓的趋势,但现在在大模型下,只要往里面灌更多数据,加更多参数,曲线还是在非常陡峭地在增长。所以我也想听一听您的意见,人工智能这套打法,将来对运筹学的理论和实践会有什么影响?

  叶荫宇:运筹学和ChatGPT能做事情还是有一些区别的。ChatGPT包罗万象,什么问题都能给你输出一个看似说得过去的回答,但是在专业性很强的问题上,比如超大规模复杂系统的快速求解,它肯定是做不了的。而且ChatGPT目前还很难自主的进行数学建模,比如为一个大规模复杂问题,准确的收集相关的数据,分析约束,自动进行建模。打个比方,某种程度上,他更像是一个全科医生,各种病都能看的,有些问题看得还不错。运筹学,以及求解器,像是一个专科医生,在某些特别复杂的专业问题上,造诣会更高深一些。

  运筹学有时候也有一些类似做法,比如穷举法。比如说有一个优化问题,现在算力这么高、这么强,把所有解都求出来,然后找一个最好的。但是这样的话比较暴力。

  目前像ChatGPT这种,毕竟有时间让它训练,哪怕训练一个月也可以等得起,就算是出下一代的GPT也可以。但是有些实际问题是等不起的,比如说现在杉数科技搞了一个南方电网的现货市场的调度问题,这个调度过程中状况变化太快,理想状态是最好是每秒钟都能重新计算,我们把它叫做online optimization(在线优化)。美国电力日内市场的计算间隔为5分钟,但国内日内市场更为复杂,当前的计算间隔为十五分钟,计算未来一小时(以五分钟为颗粒度)的机组调度问题。时间颗粒度的细化大幅度提高了调度模型的复杂程度,同时要求算法的求解能力也需要提升。

  再就是从人类的追求来说,暴力法总是太粗暴了,目前的做法确实可解释性也是个大问题,本来AI就是要把算法搞得更精细,能够节省成本,用最少的时间,最小的案例办更多的事,这也是为什么当时在美国后来对算法比较情有独钟的原因。

  另外,我觉得AI也不完全是靠暴力的。AI的底层设计中一定是有方法的,不然为什么说国内有些同样的产品可能训练不出来,不然它也可以暴力致胜。所以这点上讲ChatGPT肯定不是简单的暴力方法,必然有更好的技术,比如说在底层设计中运用了最好的优化算法。实际上国内要赶上去,不光是模型、架构、数据要比它全,也要把算法设计、底层训练搞得更精细,更有效。

  钛媒体:基于大模型的人工智能,其实是一个算法的黑箱子,很难追溯内在的逻辑。在整个求解器的模型里,现在存在不存在这样的黑箱子问题?

  叶荫宇:优化里确实也有黑箱问题。比如有一类问题我们连建模函数的形式都没有,需要用到优化的zero order method(零阶算法)来进行求解。这类问题的应用场景越来越多了。比如说石油行业的钻井问题,由于看不到底下的石油分布在什么地方,因此在什么地方钻井,在什么地方注水,这些就完全没有表达式,只能观测结果,只有input(输入)和output(输出)。

  又比如说工业界,当时我们做优化,结果钢铁行业突然来了一个碳排放,这个环境因素怎么表达成一个解析式放到优化目标里呢?此外还有一些社会问题,政策场景,甚至包括直播带货,这个模型有解析式吗?有公式吗?要优化什么东西?只能通过做了这个事以后得到,是a就有这个结果,是b就有那个结果,在某种意义上,这些都是属于一种黑箱优化问题。

  以前我们认为要用优化求解器必须要有一个所谓的特定目标函数,而且目标要有一定的表达式,约束也要用数学公式来表达。现在要跳出这个圈子了,就是要对付黑箱子。另外黑箱子问题的背后还是有一个规则,有一个好和坏的区别,虽然可能数学性质不好,甚至导数不存在,但是只要两个东西能够比较谁好谁坏,就可以做优化。

  钛媒体:黑箱会不会导致决策失控进而带来风险?

  叶荫宇:虽然模型是一个黑箱模型,但是解必须要有可解释性,这是我认为最重要的问题。而且,要能够控制。

  我们现在特别强调问题的鲁棒性,黑箱模型的决策一定要有鲁棒性,不能让它肆意妄为,通过这样的结果保证风险可控。我自己认为这要通过决策模型间的调节,把鲁棒性加上去,把风险函数加上去,这样尽管黑箱,还是可以兜底的。

  钛媒体:ChatGPT出来后,有些人就在预测说AI很快就会有自主意识。

  叶荫宇:我倒不觉得用ChatGPT做决策会带来失控,应该还是可控的。AI最终还是人在它的脖子上拴了一个绳子,你怎么引导,它就会怎样。包括黑箱这些东西,也可以通过调整参数让它的回答变成可控的,不是不可解释的。

  我现在倒是担心另外一点,就是如果我们这个社会普遍都来用这种ChatGPT,会带来单一化的风险。如果大家都用这个做作业的话,ChatGPT就是唯一标准,这个社会就不那么多姿多彩了,真正这个社会要能够开放,还是要多样化,还是要有一些个性化,不同的声音、不同的创新。

  钛媒体:您提的这个也是我有点担心的问题,现在大家如果都AI化,就有点像当年做高频交易的状态,都用同样的算法,会在一个时刻形成刺激振荡,变得非常可怕。

  叶荫宇:对,在某些特定环境下,可能要这样,但是对一个社会来说,并不希望都是一个面孔,都是一种声音。所以在这个意义上,我觉得反而是另外一种风险。

  另外,我觉得AI还不能完全取代优化算法,优化算法还是有一定的规律,有一定的机理的,而且把它的思路放进去,有些企业高层是能够理解的。现在有些企业高层还是觉得AI不可信,质疑是怎么出来的?下一次出来会不会又不一样?或者出来的话,为什么这个比那个好?特别是在工业运用中,有些东西是多目标的,不是只有一个目标函数的,要权衡各种不同因素,权衡不同的利益,所以完全靠黑箱还是有问题的。

  钛媒体:您在很早的发言里提到过行业定制版的AI,在您看来,行业定制版AI落地的难度有多大?瓶颈在哪里?

  叶荫宇:我跟葛冬冬、王子卓(两位均为杉数科技联合创始人)他们也提过,一定要做有定制化的求解器。我们以前搞运筹学,总是希望有一个算法能够解所有问题,后来发现,追求能够一个算法解所有的问题是很好,但却忽视了很多问题本身是有特点、有特征的。我们要根据问题的特征,选择不同的方法,有时用内点法,有时用单纯形法,有时用原始型的方法,有时用对偶的方法……

  最近我们就在做这个试验,针对不同问题,得出在那个特征下的最好的工具,也是通过机器学习的方式,我们把它叫ML To Optimize(机器学习驱动的优化方法)。

  以前我们在学术上认为搞特定问题的算法设计是不好的,但是你仔细想想怎么能够把问题解决,哪怕用不同武艺对付不同的敌人,这在某种意义上也是说得过去的,这就是定制化的问题,而且这个优化,你可以看到采取不同方法,速度可以提高十倍、一百倍。

  钛媒体:您觉得这个行业特点怎么体现出来呢?在将来的这套智能决策里,比如说行业know how怎么体现出来呢?

  叶荫宇:行业中的know how要结合领域知识,我现在感觉有个问题是国内的人才培养上,搞算法的和搞业务的是分开的。从教育层面要培养这样一种人,对算法也懂,但是不一定要非常精,但是业务又很熟,这个中间的桥梁作用非常重要。

  另外我觉得从我们搞求解器、搞算法的这些人,也需要主动走出去,了解某一个行业,了解他们的痛点,求解器作为最底层的软件,需要在外面做很多包装,需要很多系统,很多软件,这样才能提升它的应用效率。

  钛媒体:做定制化的话,投入和产出以及未来规模方面的问题如何平衡?

  叶荫宇:比如说做金融决策的FICO Xpress(美国一家分析软件公司),就是把优化作为核心部分,然后在核心上面构造了更多层的应用,那样就大多了,哪怕只是用到金融行业里,用户已经足够多了,结果它就更容易吸引顾客,更容易卖钱,市值也高。

  钛媒体:以前求解器相对小众,现在华为、阿里这些大厂都参与了进来。

  叶荫宇:光有求解器的话,这个量很小的,它是太底层的路线,大投入的话我觉得会浪费一部分资源,搞什么东西不能太多,大概三五家就可以了,搞得太多的话就恶性竞争了。

  可以去做,但是不一定要做求解器,比如专门做一些能源方面的、供应链方面的或者通信方面的,这就是我刚才说的个性化,我们最缺的是这样的东西。

  在美国,做求解器的主要是三家:Fico、Gurobi、IBM Cplex。谷歌虽然也有一些搞求解器的人,大规模线性规划搞得还不错。但是他们更注重研究这个东西如何加速DeepMind或者底层的一些东西,微软的那个部门直接叫Quantum Computing,跟我也保持交流,对量子计算和其它一些业务相关的算法更强调一些。

  钛媒体:优化算法技术有很多成熟的应用场景,例如金融、供应链、物流等等,这几年有什么新的应用场景被发现?比如前面提到的能源类

  叶荫宇:能源不是新应用场景,很多年前,国内的南方电网、国家电网,都有很大的OR(Operations Research,运筹优化)团队,专门做优化的,并且能力不错。

  但是新能源如何接入,这就是一个新问题。比如怎么更加安全地把一些新能源融合到供电体系当中。比如风能光能容纳进来如何考虑它的随机性,电动车的充电桩怎么布局。

  还有就是在医疗治病方面,包括癌症治疗决策,医疗资源规划等方方面面,优化都用上去了。再一个就是前些年比较火的自动驾驶,也会用到很多优化问题,就是最优控制的问题。

  钛媒体:在国内外,运筹优化的应用场景有什么样的不同吗?

  叶荫宇:在发展趋势上,其实没有很大不同。决策环境中比较有规则的,规则比较清楚的,标准比较统一的,运筹优化用得都会比较好一些。

  但是我个人认为运筹优化反而在国内有更好的发展空间,你像我刚才说的自动驾驶能不能上道,可能在美国要真弄个十年还弄不下来,但是在我们国内可能很快可以达到一个共识,运筹优化也是同样道理。

  不过,国内也要让那些企业有更多的自由空间和环境,不要把他们的手脚绑定了,让他们能够更有信心一些。

  钛媒体:目前优化算法、求解器产品的落地,都还是需要极高的智力资源投入,这也限制了这个技术在产业的渗透速度。您觉得这个问题的答案是什么?

  叶荫宇:这个发展渗透需要环境,需要生态构造慢慢培养,人家也在看我们目前正在做的这个事情,到底能不能起来。

  钛媒体:这些应用的企业有什么共同特点吗?

  叶荫宇:都是头部企业或者腰部以上企业,规模比较大。特点有三个,一是数据完备,没有数据,这个事情是做不成的;二是意识完备,领导重视,也有专门的部门或者人力;三是体量大,意味着它有足够资金投入,愿意花钱做这个事情。

  钛媒体:在应用智能化技术来帮助决策方面,您对国内企业的建议是什么?

  叶荫宇:还是要一步步地走,像美国那样,从一些比较确定的、可解释的决策模型、决策算法,主要是运筹优化方面的来做起,做得更高了以后再看AI。因为美国也在尝试AI怎么用,现在也比较彷徨,主要是它不能保证一定的鲁棒性,在一些像航空等对安全性要求很高的领域,要是出一点错的话,都是不得了的,是要用传统的工具。

  钛媒体:刚才也谈到了学术的起起伏伏,AI在美国的确做了很多年的学术冷板凳,它一直不是显学,这几年因为各种原因,算力、数据等等,一下子就起来了。您怎么看待美国这么年学术的起起伏伏,而且现在也在谈基础创新,您觉得坐冷板凳的能力是不是才是这种基础创新最需要的东西?

  叶荫宇:我觉得AI最近的发展不能说是AI自己凭空而起,而是得益于其他学科的不断发展,有很多综合因素需要考量,比如很重要的两点,一是硬件方面,计算机越来越快;另一个是算法的改进,比如大规模线性与非线性优化的算法不断提升。

  所以在这个意义上确实要耐得住寂寞,只要有兴趣你就去做,尽管当时不是在风口上,我觉得这也是好的。有时候搞研究不要追风,政策也不一定说因为这个东西很火,就赶紧把资源都放到那个地方去。各个学科像是一个网一样,不均衡发展的话,还是会被拖后腿。(本文首发钛媒体APP,作者|韩敬娴)

  1


您可能还会对下面的文章感兴趣:

登录 注册 退出