鞠海：主机技术转型，赋能更多企业级人工智能应用

专题：第25届中国国际高新技术成果交易会_中国高新技术论坛

（图片来源网络，侵删）

　　中国高新技术论坛于11月15日-17日举行。IBM中国系统开发中心总经理鞠海出席并演讲。

　　以下为演讲实录：

　　谢谢主持人，也谢谢大会组委会的邀请，能够让我有机会在这边和大家分享一些IBM在这些实践当中的体会和感受。

　　我是今天上午最后一个演讲者，我相信今天上午的头脑风暴进行到现在，大家人肉智能算力消耗得差不多了，我在这里不想做一个非常深刻的专业技术报告，我在这里分享一些故事，这个故事是关于在IBM是怎么样面对人工智能的时代进行转型，希望这个故事对大家有所启发。

　　大家对近些年的人工智能浪潮都有一个体会 —— 前些年，机器学习、深度学习等技术和计算机视觉的结合产生了很多非常有趣的应用；掀起了一波热潮后，最近两年又经过了一个相对“冷静期”；到今天ChatGPT为代表的生成式人工智能的崛起，我们意识到人工智能的发展已经来到了一个所谓的“网景时刻”——它意味着人工智能在企业级的广泛应用，将会迎来一个长期发展的周期，这也是为什么每一个企业，从事商业活动的每个人，从事基础研究、技术开发的每个人，都在积极的思考在这个长期趋势中自己的转型策略。

　　事实上，IBM早在半个多世纪之前就开始了这个心路历程和实践。大家知道，人工智能元年是1956年的达特茅斯会议，IBM作为会议发起方深度参与了相关的工作。从那之后IBM进行了很多探索实践，也参与了很多“人民群众喜闻乐见”的人工智能的游戏：从大家不太熟悉的“跳棋人机大战”，到很熟悉的“国际象棋人机大战”，再到2011年，IBM人工智能在语言类智力比赛中击败了人类世界冠军，拉开了这一波人工智能的新篇章。

　　今天，IBM持续投入大量基础性前沿性技术的研究开发。我们正在打造AI优化的云原生超级计算机Vela；我们率先交付了第一套商用量子计算研究系统。很多人提到“算力能耗”是人工智能时代非常大的一个挑战。IBM在今年刚刚推出的NorthPole神经形态计算处理器，就是在底层架构角度对AI算力进行的新探索，通过利用颠覆性的计算架构，极大地降低了人工智能处理的能耗。在更底层的半导体技术方面，IBM虽然不再运作大规模制造工厂，但保留了很强的半导体研究力量，我们在两年前就实现了2纳米先进半导体制程的突破。

　　那么，IBM在这么多具体领域都展开了研究并取得了突破，我们又是怎样把这些突破、技术应用到今天的人工智能实践当中呢？尤其是怎样把这些技术落地到企业级商业应用中，并产生实际的商业价值？

　　今年IBM推出的watsonx企业级人工智能平台，很大程度上就代表了企业级人工智能的未来。什么叫企业级人工智能？它不仅仅为企业提供人工智能技术的使用体验，它需要具备一个完整的AI技术堆栈、构建完整的业务价值链条。watsonx由三大组件构成：watsonx.ai、watsonx.data、watsonx.governance，从基础模型训练和应用开发，到数据支撑，到全链条的AI治理和监管体系，从而让企业利用AI将技术转化为业务价值。在刚刚过去的乌镇峰会上，IBM watsonx荣获了“世界互联网大会领先科技奖”。

　　以watsonx作为一个核心，向上，我们通过AI软件和咨询服务，对应用进行延伸。向下，我们通过混合云平台和IBM信息基础架构技术落实到具体的IT系统底座上。

　　讲到这里，就要请出今天故事的主角——IBM主机。比较熟悉IBM的朋友知道，所谓主机就是大型机，这是一个非常有年代感的名词，在今天主机平台仍然应用在金融等对性能、可靠性、安全性等最高要求的关键业务处理环境中。那么作为这样一个系统，它应该如何去参与今天的人工智能大潮呢？它如何能够在这样一个新的环境中帮助客户创造更大的价值呢？我们在这个课题上做了非常多的探索和实践。

　　首先，今天的人工智能生态是一个非常开放开源的技术生态。要去参与这样一个技术进程，我们就需要把自己也变成一个非常开发的计算平台。所以我们首先从操作系统和管理、应用软件角度对主机平台进行了重新的塑造，使它能够充分拥抱整个Linux的开放生态。在这个过程中，我们既保留了主机平台在可靠性、安全性和极致性能上的核心能力——比如单机超过99.99999%的可靠性；同时我们又让它能够支持完整的Linux开源技术堆栈。大家知道，这是个很困难的事情，因为性能、可靠性与开放性通常是一对矛盾。但是我们经过不懈的努力，获得了成功。这就是IBM新推出的LinuxONE——基于主机技术的开放的现代化平台。

　　在这个基础上，我们又继续思考这个平台能够怎样在人工智能时代为客户带来更大的差异化价值。我们知道，在人工智能时代，算力的能耗和可持续性是非常大的挑战。面向人工智能时代的现代化IT基础架构必须考虑可持续发展目标。IBM LinuxONE和主机技术平台从诞生第一天起就秉持面向环境的设计理念。我在国内有一个客户和我们分享过他的故事，他在20年前买了6套主机系统去部署他的金融核心交易业务。20年过去了，他的交易量已经成长了数百倍，但是今天他所有的业务仍然跑在6套系统上面。

　　所以大家看到，主机平台高度集成的计算架构为可持续计算提供了一个非常好的基础。那么我们在实际的运维部署当中，怎么样把它更好地转化成更大的现实的业务价值呢？我们把很多智能运维、自动化技术部署在这样一个平台上面，同时我们也利用人工智能的能力让这个平台变得更加现代化、可持续。

　　在这方面，比如IBM 和 Red Hat共同合作推进了“Kepler项目”，通过预训练的模型、机器学习等人工智能技术，我们在混合云的云原生环境中，实现了容器级能耗的管理，从而实现了对于应用级别的能耗的精准监控和调度。基于这一核心能力，我们构建了这样一个完整的“全栈实时能耗与碳足迹观测管理与优化平台”。以LinuxONE作为这样一个混合云异构数据中心里高效能计算节点，然后在计算堆栈的每一层上都部署这些人工智能驱动的能耗监控管理能力。在这样一个数据中心里，你可以在不停机的状况下一键切换，把应用从分布式服务器上转移到LinuxONE上，能耗降低75%，机房空间节省67%，同时提高的可用性。正是由于这种令人惊叹的降低能耗的效果，这个解决方案在上周的世界互联网大会乌镇峰会上，被评选为“构建网络空间命运共同体的精品案例”。

　　当运用了开源、开放技术和人工智能的能力后，整个主机技术平台，以LinuxONE为代表的系统就变成了真正开放的、现代化的，可持续的处理平台和计算平台。但AI时代下的主机不止于此，它还可以更好的去赋能人工智能的应用。

　　在这一波的生成式人工智能推进过程中，企业级人工智能怎样更有效地进行大规模、可扩展的推理运算，成为日益增长的需求焦点。因此，我们在新一代处理器当中加入了专用的人工智能加速引擎，它有非常多的能力，比如超低且一致的推理任务处理延迟。我们为一家大型银行客户部署反欺诈任务模型，在这个平台上，用一个核心就可以完成每秒11万6千次的推理处理，每一个推理的延时是一毫秒。当我们把这样一个系统扩展到32个核心的时候，就可以实现每秒超过300万次的推理，同时它的延时仍然保持在每次推理一毫秒延时，这对于金融业务实时反欺诈场景是非常重要的一种能力。类似这样的技术也被越来越多的客户和合作伙伴所应用，比如国内某大型民营医疗机构，通过运用LinuxONE技术，极大的节省了整个IT的开销和算力的成本。

　　随着以LinuxONE为代表的新一代主机技术平台不断演进，不断走向市场，我们非常欣喜地看到，不仅很多传统主机平台客户拥抱这个技术，部署更多的人工智能应用，同时也吸引了很多新客户积极地加入这个平台。除了传统的金融核心交易处理之外，他们也把越来越多的新兴业务部署到这个平台上面。他们发现对于人工智能来说，数据是非常“重”的，移动数据是非常困难的，所以当我能够把我的计算和我的数据靠得更近，我就可以找到自己更多的核心竞争力。

　　这就是我今天想和大家分享的故事：IBM怎样把主机技术进行转型，通过开放开源和人工智能技术，使它成为一个现代化的信息基础架构，并且去赋能更多的企业级人工智能应用。

　　我为什么要讲主机呢？大家知道因为主机被认为是IBM非常坚固的技术，或者非常顽固的技术，如果连主机都可以在这个时代进行重新定义、重新塑造，还有什么是不可以的。事实上IBM的数据存储，今天这样一个技术已经做了非常多的改变，我们的软件定义存储、云延伸存储，它现在被打造成数据底座，我们有用于超算的数据存储技术，大规模工业级渲染的高性能数据服务的基础。我们也有很老的可持续计算的关键技术。

　　我希望我今天给大家分享的不是一个关于老当益壮的故事，而是关于怎么样去涅槃重生的故事，或者许多个牛盘重生的故事，我希望我们有机会能够利用面向人工智能，或者因人工智能而改变的信息技术、基础技术和产品，能够有机会和大家一起拥抱人工智能时代。

　　好，谢谢大家。

　　新浪声明：所有会议实录均为现场速记整理，未经演讲者审阅，新浪网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。