实时

您的位置:首页>企业 >

专访微软陶然:很多人认为有GPU就能做大模型,这是一个很大的误区丨科创100人

来源:新浪科技


(资料图片仅供参考)

文 丨 新浪科技 周文猛

在今年由ChatGPT引爆的新一轮AI技术浪潮中,持有OpenAI 49%股权的微软公司,无疑成为最大的赢家。而在这背后,作为OpenAI商用化独家云服务提供商的微软Azure,同样也成了各界关注的焦点。

近日,微软大中华区Azure事业部总经理陶然在接受新浪科技《科创100人》采访时指出,AI时代,每个APP和应用都应该被AI优化,因为构造APP的方式和APP本身的架构,正在被完全颠覆,“未来的APP应该叫AI原生”。据他介绍,基于这一判断,“过去半年间,微软基于AI重写了几乎所有内部产品”。

据新浪科技不完全统计,截至目前,国内已经出现超过100个大模型产品,其中,仅定位通用大模型和“通用+行业”的企业,便多达26家。然而,长远来看,这么多大模型产品中,最终能够留下的只能是少数。在对大模型算力、网络、数据调度等不同维度的成本进行分析后,陶然指出,“大模型意味着大成本,在一定程度上,大模型的价格永远是不可控的。”

每个APP都该被AI优化,过去半年微软革了自己的命

在这一轮由ChatGPT引爆的AI浪潮中,微软公司布局尤为迅速。

今年1月,微软Azure作为OpenAI独家云服务提供商,正式推出面向企业用户的Azure OpenAI国际版大模型服务。3月,当全球科技圈还在因为GPT3.5的出现而感到兴奋时,微软便宣布将基于新的GPT4推出Copilot人工智能服务,并将其嵌入Word、PowerPoint、Excel等Office办公软件中。5月,微软宣布将在Windows 11中加入Copilot AI助手,Windows也接入ChatGPT。

“过去几十年来,微软最有名的产品是Windows、Office和Azure。但你会发现,过去半年内,微软所有传统的软件产品也都全部实现了 AI的智能化和大模型的集成。”陶然表示。据他介绍,在过去半年间,微软几乎每周都有基于OpenAI或者基于AI的新产品或者新工具推出。

而微软之所以如此迅速地推进AI智能化以及大模型布局,背后有一个基本理念。那便是——微软认为,在AI时代,每个APP和应用都应该被AI优化,程序开发者将不再需要从头开始编写基本的业务逻辑,而是可以让每个应用直接嵌入到AI能力和大模型中,甚至于直接使用自然语言进行AI原生应用开发。

“过去10年,关注云计算行业的人都知道有一个词叫云原生,微软认为,未来的APP应该叫AI原生,因为构造APP的方式和APP本身的架构,都可以完全被颠覆。”陶然表示。他指出,云原生时代的APP形态,有着诸如容器、数据层、应用层的开发,但在AI时代,程序开

发的核心将变成“数据+模型”,通过feed learning或向量数据库的方式与模型进行交互,实现智能应用,并将其写入网站、H5或APP中。

陶然进一步介绍指出,“以前我们是将业务逻辑、商业逻辑和需求整合成为Hardcode(硬编码),但在未来智能应用中,我们需要更好地运用这些逻辑。”以RPA为例,以前我们写流程化产品时,每一个业务流程和环节都是固定的,但现在,当你提交完成后,AI会自动识别你当前任务的类型,自动帮你归类并找到相应的流程,并指导你执行。

“模型可以根据当时的上下文实时判断,这就是AI原生APP的一些特定理念。”陶然表示。据他介绍,事实上过去半年间,诸如数字原生、互联网电商、游戏娱乐等行业,已经成为GPT大模型落地最快的领域;此外,零售制造、汽车等传统行业也开始认真地去评估,甚至已经开始使用OpenAI大模型去升级传统企业业务。

“AI辅助工作越来越常见,人类与AI的协作将引领未来工作模式的变革。各行各业都可以使用自然语言与‘智能副驾’一起‘共事’,借助AI帮助自己和企业分析判断、解决复杂问题,提升组织的生产力。”陶然表示。

大模型≈大成本,比自研更重要的是变现

伴随着大模型研究讨论及落地讨论的不断深入,当前,大模型的成本问题,也成了各界关注的焦点。在与新浪科技沟通中,陶然指出,事实上,大模型的产生和落地,成本是非常多元的,包括硬件成本、算力成本、网络成本、算法成本、边际成本等。“在一定程度上,大模型意味着大成本,大模型的成本永远是不可控的”。

目前,业界普遍认为,算力成本是制约大模型发展的一大要素。但在陶然看来,算力是大模型发展中非常重要的一部分,是提升向量、矢量运算速度的关键,但大模型成本的节约一定不只是因为算力。他指出,目前国内认为只要有GPU便能够做大模型,但事实上这是一个很大的

误区。以不同GPU连接的带宽为例,目前很多厂商和个人没有能力去实现这种连接,但事实上,卡带宽的速度,直接决定了大模型训练所需花费的时间成本,同样的一套模型,如果训练一次需要花费一周成本为100万美元,但如果带宽太小最终耗时两周,那成本就将乘以2。

“到了这一环节,真正的壁垒便不再是GPU,而是变成了网络层。”而且,即便你解决了GPU带宽的问题,后续编写数据调度算法,运用开发等方面,依然需要耗费大量的成本。“因此,大模型的成本永远是不可控的,大模型意味着大数据量、大参数量、硬件投入、算力成本以及算法成熟度都非常重要,如果写得不好,可能需要比别人多训练几十次,每次都会面临很高的成本。”陶然表示。

在他看来,大模型又被称为大成本,这实际上是市场的共识,并非微软的态度。与此同时,由于具备ChatGPT研发的先发效应和大量微软内部落地运用变现能力,目前微软已经联合OpenAI推动了数次大模型成本下降,真正让AI模型使用平民化。

陶然介绍指出,微软和OpenAI的战略一直非常明确,一致认为大模型应该成为AI时代的基础架构。类似于百年前的水电煤和过去10年的云服务,基础架构的特点便是使用灵活且成本低,可以让每个企业和个人都使用。在这种情况下,国内外厂商需要考虑是否具备足够的模型能力,以及模型的定价能力,来与微软持平,“从经济学上来说,这可能是一个挑战,这也是一个需要考虑的问题”。

自1992年进入中国市场,31年间,微软已先后在国内建立了5座数据中心。2022年3月,微软上线了最新的中国北三区云数据中心,据介绍,该数据中心的容量,相当于微软此前4个数据中心容量总和的2倍。在陶然看来,对于云计算企业客户而言,“选择云服务不仅仅取决于云服务本身的能力和定位,还要关注客户的生态”

关键词:

推荐阅读
来源:新浪科技文丨新浪科技周文猛在今年由ChatGPT引爆的新一轮AI技术

2023-08-10 11:09:20

郯城县税务局厚植廉洁税务文化扎实推进“清廉机关”建设□王冲郯城县税

2023-08-10 10:43:23

财经网汽车8月10日讯日前,复旦大学-国轩高科先进电池技术校企联合研究

2023-08-10 10:27:49

【在这片辽阔的土地上38】光明日报记者崔兴毅或经年累月在野外奔波,或

2023-08-10 10:07:24

【美联储9月维持利率在5 25%-5 50%不变的概率为85 5%】据CME“美联储观

2023-08-10 09:40:19

央视网消息:据“文旅之声”公众号消息,文化和旅游部、工业和信息化部

2023-08-10 08:48:50

我在一家医药公司上班 合同到期了 公司一直没和我续签 我开始

2023-08-10 08:31:47

文|招商宏观张静静团队核心观点当地时间8月7日,国际评级机构穆迪(Moo

2023-08-10 07:56:17

波兰国防部当地时间9日表示,德国已正式确认将“爱国者”防空导弹系统

2023-08-10 07:00:53

未成年人暑期扎堆做整形?中消协提醒:冲动一时可能悔恨一生

2023-08-10 05:58:08

1、北京那个是三年都在北京的,中外合资的那个是属于林科大的国际学院

2023-08-10 03:07:37

2年1 2亿!丹尼尔斯:有他在,湖人客场球票提前售罄,湖人,nba,美国篮球

2023-08-09 23:10:31

人民网北京8月9日电(焦磊)近年来,招工诈骗问题备受社会关注,特别在

2023-08-09 21:59:14

女人的心里只有你,一心一意地爱着你,还是心里已经装着别的男人,甚至

2023-08-09 20:56:34

交通事故骨折可以进行鉴定伤残。伤、残鉴定是指伤后伤残程度鉴定。伤、

2023-08-09 20:13:04

天气详情唐山市气象台8月9日16时发布未来24小时天气预报今天夜间   

2023-08-09 19:09:42

五洲医疗:光大证券股份有限公司关于安徽宏宇五洲医疗器械股份有限公司

2023-08-09 18:48:14

8月9日,记者了解到,8月6日,浙江舟山朱家尖东沙湾景区的海水浴场,一

2023-08-09 17:51:38

“通天房”是指楼梯设置在房屋中央或内部从底层到顶层敞开式全部贯通是

2023-08-09 17:24:47

日前,省委人才办、省发改委、财政厅、人社厅、文旅厅等部门联合发布了

2023-08-09 16:48:31