专访微软陶然：很多人认为有GPU就能做大模型，这是一个很大的误区丨科创100人

2023-08-10 11:09:20 来源：新浪财经 A+A-

来源：新浪科技

(资料图片仅供参考)

文丨新浪科技周文猛

在今年由ChatGPT引爆的新一轮AI技术浪潮中，持有OpenAI 49%股权的微软公司，无疑成为最大的赢家。而在这背后，作为OpenAI商用化独家云服务提供商的微软Azure，同样也成了各界关注的焦点。

近日，微软大中华区Azure事业部总经理陶然在接受新浪科技《科创100人》采访时指出，AI时代，每个APP和应用都应该被AI优化，因为构造APP的方式和APP本身的架构，正在被完全颠覆，“未来的APP应该叫AI原生”。据他介绍，基于这一判断，“过去半年间，微软基于AI重写了几乎所有内部产品”。

据新浪科技不完全统计，截至目前，国内已经出现超过100个大模型产品，其中，仅定位通用大模型和“通用+行业”的企业，便多达26家。然而，长远来看，这么多大模型产品中，最终能够留下的只能是少数。在对大模型算力、网络、数据调度等不同维度的成本进行分析后，陶然指出，“大模型意味着大成本，在一定程度上，大模型的价格永远是不可控的。”

每个APP都该被AI优化，过去半年微软革了自己的命

在这一轮由ChatGPT引爆的AI浪潮中，微软公司布局尤为迅速。

今年1月，微软Azure作为OpenAI独家云服务提供商，正式推出面向企业用户的Azure OpenAI国际版大模型服务。3月，当全球科技圈还在因为GPT3.5的出现而感到兴奋时，微软便宣布将基于新的GPT4推出Copilot人工智能服务，并将其嵌入Word、PowerPoint、Excel等Office办公软件中。5月，微软宣布将在Windows 11中加入Copilot AI助手，Windows也接入ChatGPT。

“过去几十年来，微软最有名的产品是Windows、Office和Azure。但你会发现，过去半年内，微软所有传统的软件产品也都全部实现了 AI的智能化和大模型的集成。”陶然表示。据他介绍，在过去半年间，微软几乎每周都有基于OpenAI或者基于AI的新产品或者新工具推出。

而微软之所以如此迅速地推进AI智能化以及大模型布局，背后有一个基本理念。那便是——微软认为，在AI时代，每个APP和应用都应该被AI优化，程序开发者将不再需要从头开始编写基本的业务逻辑，而是可以让每个应用直接嵌入到AI能力和大模型中，甚至于直接使用自然语言进行AI原生应用开发。

“过去10年，关注云计算行业的人都知道有一个词叫云原生，微软认为，未来的APP应该叫AI原生，因为构造APP的方式和APP本身的架构，都可以完全被颠覆。”陶然表示。他指出，云原生时代的APP形态，有着诸如容器、数据层、应用层的开发，但在AI时代，程序开

发的核心将变成“数据+模型”，通过feed learning或向量数据库的方式与模型进行交互，实现智能应用，并将其写入网站、H5或APP中。

陶然进一步介绍指出，“以前我们是将业务逻辑、商业逻辑和需求整合成为Hardcode（硬编码），但在未来智能应用中，我们需要更好地运用这些逻辑。”以RPA为例，以前我们写流程化产品时，每一个业务流程和环节都是固定的，但现在，当你提交完成后，AI会自动识别你当前任务的类型，自动帮你归类并找到相应的流程，并指导你执行。

“模型可以根据当时的上下文实时判断，这就是AI原生APP的一些特定理念。”陶然表示。据他介绍，事实上过去半年间，诸如数字原生、互联网电商、游戏娱乐等行业，已经成为GPT大模型落地最快的领域；此外，零售制造、汽车等传统行业也开始认真地去评估，甚至已经开始使用OpenAI大模型去升级传统企业业务。

“AI辅助工作越来越常见，人类与AI的协作将引领未来工作模式的变革。各行各业都可以使用自然语言与‘智能副驾’一起‘共事’，借助AI帮助自己和企业分析判断、解决复杂问题，提升组织的生产力。”陶然表示。

大模型≈大成本，比自研更重要的是变现

伴随着大模型研究讨论及落地讨论的不断深入，当前，大模型的成本问题，也成了各界关注的焦点。在与新浪科技沟通中，陶然指出，事实上，大模型的产生和落地，成本是非常多元的，包括硬件成本、算力成本、网络成本、算法成本、边际成本等。“在一定程度上，大模型意味着大成本，大模型的成本永远是不可控的”。

目前，业界普遍认为，算力成本是制约大模型发展的一大要素。但在陶然看来，算力是大模型发展中非常重要的一部分，是提升向量、矢量运算速度的关键，但大模型成本的节约一定不只是因为算力。他指出，目前国内认为只要有GPU便能够做大模型，但事实上这是一个很大的

误区。以不同GPU连接的带宽为例，目前很多厂商和个人没有能力去实现这种连接，但事实上，卡带宽的速度，直接决定了大模型训练所需花费的时间成本，同样的一套模型，如果训练一次需要花费一周成本为100万美元，但如果带宽太小最终耗时两周，那成本就将乘以2。

“到了这一环节，真正的壁垒便不再是GPU，而是变成了网络层。”而且，即便你解决了GPU带宽的问题，后续编写数据调度算法，运用开发等方面，依然需要耗费大量的成本。“因此，大模型的成本永远是不可控的，大模型意味着大数据量、大参数量、硬件投入、算力成本以及算法成熟度都非常重要，如果写得不好，可能需要比别人多训练几十次，每次都会面临很高的成本。”陶然表示。

在他看来，大模型又被称为大成本，这实际上是市场的共识，并非微软的态度。与此同时，由于具备ChatGPT研发的先发效应和大量微软内部落地运用变现能力，目前微软已经联合OpenAI推动了数次大模型成本下降，真正让AI模型使用平民化。

陶然介绍指出，微软和OpenAI的战略一直非常明确，一致认为大模型应该成为AI时代的基础架构。类似于百年前的水电煤和过去10年的云服务，基础架构的特点便是使用灵活且成本低，可以让每个企业和个人都使用。在这种情况下，国内外厂商需要考虑是否具备足够的模型能力，以及模型的定价能力，来与微软持平，“从经济学上来说，这可能是一个挑战，这也是一个需要考虑的问题”。

自1992年进入中国市场，31年间，微软已先后在国内建立了5座数据中心。2022年3月，微软上线了最新的中国北三区云数据中心，据介绍，该数据中心的容量，相当于微软此前4个数据中心容量总和的2倍。在陶然看来，对于云计算企业客户而言，“选择云服务不仅仅取决于云服务本身的能力和定位，还要关注客户的生态”

关键词：