gpu人工智能(GPU人工智能)

1年前 (2024-04-23)

gpu人工智能(GPU人工智能)

数字化时代,每个公司都面临着变革,这也让企业拥有了比以前更多的数据。随着数据索引的增长,数据的载体存储数据、处理数据的方法、使用数据的方法都在不断发展。用户也在增加数据价值。所以企业用户期望通过数据快速带来商业价值。

然而,企业应该如何应对大量数据的涌入?Cloudera认为,数据的增加给了公司进行商业决策的机会。

最近,Cloudera推出了Cloudera数据平台(CDP),该平台使用NVIDIA GPU来加速Apache Spark 3.0软件。版本的Cloudra数据平台使用Spark 3.0加速NVIDIA技术,帮助运营团队实现8倍性能,让你无法顺利完成操作。

GPU加速如何启用Cloudera?

作为业界企业数据云,Cloudera data platform集成数据平台可以帮助企业更好地管理和保护数据迁移到云的过程。

Cloudera认为,数据的增加给了公司进行商业决策的机会。NVIDIA GPU支持的Cloudra数据平台可以使用几乎无和无限类型的数据,支持企业加快决策。

我们都知道通过有效的扩展工作,CPU无法适应工作负载,会继续使用CPU工作负载。

而GPU并行处理成为加速大规模数据分析和ETL流水线的关键,关键驱动关键驱动这些工作负载。数据中心通过大规模水平扩展支持复杂的数据分析项目。

借助英伟达的Cloudera,可以在集群中驱动GPU。这种技术进步先进的时候,需要一段时间去认识他们的实力,去发展他们。

,Cloudra数据平台将Cloudra数据平台与NVIDIA Rapids和AI相结,以获得关于使用Apache Spark的业务见解。

如何申请?

美国国税局就是这种情况。

作为一名数据科学家,黛博拉泰勒(Deborah Tylor)的任务是组织超过300 TB的国家税务数据库,并找到可能有助于识别身份和其他欺诈行为的法律。但是即使她通宵做了很多CPU服务器,他们也做不完这个数据。

Cloudera的解决方案工程师Nasheb Iailaies问Tikekar团队,是否有必要使用自己的GPU来加速Apache 3.0软件的Cloudera数据平台(CDP)。

在对软件进行快速测试后,泰勒在不修改代码的情况下立即加速了5倍,但仍有几个部分落后。

Iaily召集了一个NVIDIA数据科学家团队来检查代码的核心内容。他们很快发现一些数据结构非常糟糕的任务还在CPU上运行。因此,他们编写代码来处理这些任务,并将它们插入Spark的Rapids软件界面。Rapids是一个开放的存储库,通过GPU运行数据分析。

Taylor做过测试,结果显示在分布式spark组的GPU上一切都能流畅运行,提速非常明显。她在一个四节点集群上运行整个程序。

美国国家税务总局研究和应用分析与统计部门Joannaldi表示:“通过Cloudra和英伟达的技术整,我们可以利用基于数据的见解来推动关键任务。”

该团队计划利用其在数据准备方面的成功经验,即数据分析/转换/加载(ETL)。下一步是加速各种AI推理。

Tikekar表示:“这次与Cloudera和NVIDIA的作有助于我们在集群中驱动GPU。当这项技术先进时,满足他们的实力和开发他们的应用还需要一段时间,所以黛博拉泰勒真的制定了一个新的路线图——她是整件事的主角。”

具体来说,该团队将致力于通过构建深度学习经网络来执行自然语言处理和分析。

Cloudera作的案例表明,英伟达将加速GPU在数据分析、AI等领域推广更多。

写在一个。

NVIDIA技术支持的Cloudera数据平台允许公司无缝加速关键应用程序的数据分析,如Spark 3.0,而无需更改任何代码。这些突破将为公司提供实时分析能力,并为客户提供相应的智能水平。