在大型企业中广泛采用AI的第一步


【在大型企业中广泛采用AI的第一步】在制造业的经济领域中,众所周知,许多本应在一两十年前部署HPC仿真和建模应用程序以帮助产品设计以及其他任务的公司没有这样做 。随着基于X86处理器的HPC集群成本的降低以及执行许多任务的开源软件的出现,这似乎是违反直觉的 。困惑 。对于那些试图解决“缺失的中间点”的人们来说,这非常恼人 。
关于这里出了什么问题,有很多理论,但至少,即使降低了HPC产品的成本,购买集群,对其进行管理并使其忙于要证明大量投资是合理的,也很难合理化,无论潜在回报如何 。然后,很难弄清如何使HPC工作流(包括多个相互关联的应用程序组成),并在现有系统(使用科学工作站进行设计并且易于使用的CAD / CAM工具)完成工作时工作良好 。而且,即使在公共云中出现了HPC,HPC机器也可能更易于使用,但没人会认为它们便宜 。
没有人希望企业中缺少机器学习的中间环节,这是一个广阔的市场,可以肯定的是,这意味着随着诸如戴尔,惠普,联想,IBM等供应商的尝试,人工智能将民主化 。在HPC空间中工作了多年 。现在的好消息是,HPC和AI应用程序通常可以在同一个平台上运行,从而可以将投资摊销到更多(更多样化)的工作负载上 。市场的广度(每个人都在收集数据时希望爆炸数据集,以期将其转化为有价值的信息块)也有帮助,因为至少所有公司都可以使用AI,而并非每个公司都可以使用传统的HPC模拟和建模 。
戴尔的创立之初就是以合理的价格提供一款体面的X86 PC,而当迈克尔·戴尔(Michael Dell)于1994年11月凭借第一台PowerEdge机器正式进入数据中心时,这个想法就是将相同的商品X86理念带入温室 。戴尔和其他任何供应商一样,大力推动了X86议程,并从中受益匪浅,在2001年互联网泡沫鼎盛时期成为了最大的服务器发运商 。可以说,该公司知道一两件事关于将技术带到中间的问题,尤其是在收购EMC的同时,也将其推向了高端 。此次收购还为戴尔带来了VMware服务器虚拟化的领导者,其软件已被600多家公司使用,如今已有000个组织,并且在过去的十年中已成为企业中主要的管理基础 。戴尔铁和VMware软件的结合可以帮助缩小AI中潜在的缺失中间环节,并加快VMware对AI技术的吸收 。
戴尔“实现人工智能”工作的第一步是获得vSphere 7虚拟化堆栈,我们在三月份进行了预览,它的Tanzu Kubernetes容器编排器与VMware最著名的虚拟服务器平台集成在一起 。我们可能会争论在ESXi虚拟机管理程序上运行Kubernetes是否有意义,但这是有争议的 。对于许多厌恶风险的企业来说,这就是他们将要安装Kubernetes的方式,因为VMware堆栈是他们管理虚拟基础架构和为其打包的软件的方式 。这很难改变,这就是为什么VMware仍然具有不断增长且盈利的业务的原因,在ESXi的管理下,大约有7000万虚拟机,在截至2月的2020财年最后一个季度中,运行率约为110亿美元,据我们估计 。这大约是VMware业务的四分之三,vSAN虚拟存储驱动了另外15%,NSX网络虚拟化驱动了另外10% 。展望未来,ESXi仍将保持适度增长,到2022年底,我们预计其年化收入将达到115亿美元,约占业务总量的一半,其余一半将在vSAN和NSX之间平均分配 。
如果你想知道为什么-因为我们经常做- VMware的没有继续与“项目光子”,并创建一个干净的石板Kubernetes平台,这就是你的答案 。你不会为那辆苹果车感到不安 。但是您确实要告诉人们他们可以混合桔子和苹果 。
戴尔服务器解决方案产品管理和市场营销高级副总裁Ravi Pendekanti在今天的公告中表示,戴尔和VMware最终将在PowerEdge服务器上预安装VMware堆栈,这将为这些企业进行部署 。而且,vSphere 7堆栈还将包括VMware于去年夏天收购的Bitfusion GPU切片器和聚合器 。,扬起了一些眉毛 。(但不是我们的 。)Bitfusion软件允许将机箱中的多个GPU与服务器区分开并进行虚拟化,以便可以与服务器动态共享它们,还可以将它们合并以为AI和AI创建更大的GPU计算聚合 。事实证明,HPC工作负载 。这种分解和池化是关键,因为GPU昂贵且并非每个可以使用它们的工作负载都可以安装它们 。那太昂贵了 。因此,将它们分解并存储在一个池中可以提高跨时间的共享和在任何特定时间的利用率,从而为AI以及需要GPU的HPC工作负载提供更高的ROI 。
VMware的云平台业务部门高级副总裁兼总经理Krish Prasad在今天的公告中解释说:“我们实质上是在几年前为加速器领域所做的工作,” Krish Prasad解释说 。“但是,我们已经迈出了更进一步的一步,使客户能够合并加速器 。”
顺便说一句:很遗憾,VMware无法在单个服务器上对CPU和内存执行相同的操作,但也许它将购买TidalScale并进行修复 。无论如何,Bitfusion提供的称为FlexDirect的GPU中间件不仅可以进行聚合和远程池化,而且还具有分区功能-无需像Nvidia所做的那样,通过实际雕刻GPU硬件来创建“ Ampere” GA100 GPU,其中的切片可以充当一个大型GPU或八个较小的GPU 。与Bitfusion,切片可以小如1/20个GPU的和它的存储器中 。目前尚不清楚Bitfusion可以看到多大的池,但是在过去它仅限于八个GPU 。
Prasad补充说,vSphere 7对Bitfusion的支持最初来自Dell PowerEdge R740机架式计算机和PowerEdge C4140半定制,超大规模样式的计算机 。大概最终它将在其他Dell Iron上以及实际上在任何支持VMware的服务器上都可用 。

    推荐阅读