欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

对象存储适合人工智能和机器学习的三个原因

程序员文章站 2022-07-10 14:22:39
如今,各种类型的企业都致力于采用和项目,但要发挥其真正的潜力,则需要克服重大的技术障碍。虽然计算基础设施通常是重点,但存储设施也同样重要。如今,各种类型的企业都致力于采用人工智能和项目,但要发挥其真正...

如今,各种类型的企业都致力于采用和项目,但要发挥其真正的潜力,则需要克服重大的技术障碍。虽然计算基础设施通常是重点,但存储设施也同样重要。

如今,各种类型的企业都致力于采用人工智能和项目,但要发挥其真正的潜力,则需要克服重大的技术障碍。虽然计算基础设施通常是重点,但存储设施也同样重要。以下是对象存储(而不是文件或块存储)适用在加强人工智能和工作负载的三个主要原因:

1.可扩展性

当有大量不同的数据源可供学习时,采用人工智能和技术最有效。数据科学家利用这些丰富的数据来训练领域模型。在“的五个v”(数量、类型、速度、准确性和价值)中,前两个(数量和类型)最为重要。简而言之,人工智能和依赖于大量不同的数据(图像、文本、结构化和半结构化数据)来构建有用的模型,提供准确的结果,并最终提供业务价值。

对象存储是最具扩展性的存储架构,特别适合支持人工智能和所需的大量数据。对象存储旨在通过水平扩展方法实现无限增长,从而使企业可以通过在需要的位置和时间添加节点来增加部署。由于对象存储使用单个全局名称空间,因此也可以一次在多个地理位置上进行这种扩展。另一方面,文件和块系统通常采用扩展方法。这意味着这些平台通过向单个节点添加更多计算资源来实现垂直扩展,这最终会受到限制。他们无法通过部署其他节点来增加计算资源,从而无法有效地水平扩展。

2. api

健壮灵活的数据api对于人工智能和非常重要,如上所述,它们使用了多种数据类型。存储平台需要支持api来容纳各种数据。此外,人工智能和的创新越来越多地在公共云上进行,但是仍然有相当一部分人工智能和在内部部署或私有云中发生,这取决于用例的具体情况(例如,科学研究和等领域通常最适合私有云)。这意味着组织需要一个存储api,以支持公共云和本地/私有云中的工作负载。

文件和块存储平台所支持的api受限制,部分原因是它们是较旧的架构。相比之下,对象存储使用云平台中固有的高级api,该api设计为以应用程序为中心,与文件和块存储相比,它支持范围更广的api,其中包括版本控制、生命周期管理、加密、对象锁定和元数据。此外,支持人工智能和用例的新对象存储api(例如对流数据的支持和对海量数据集的查询的支持)也是可能的。

通过围绕amazon s3的对象存储api的标准化,可以更轻松地在内部部署和公共云中集成。企业可以轻松地将人工智能和部署从内部部署/私有云环境扩展到公共云,或者将云原生的人工智能和工作负载迁移到内部部署环境,而不会损失功能。这种双模式方法使组织可以合作且可互换地利用内部部署/私有云和公共云资源。

由于s3 api已成为对象存储的事实上的标准,因此许多软件工具和库都可以利用该api。这允许共享代码、软件和工具,以促进人工智能和社区中更快的开发。示例包括流行的平台,例如具有内置s3 api的tensorflow和apache spark。

3.元数据

与api一样,使用人工智能和的组织必须利用无限的可自定义的元数据,这一点至关重要。元数据只是关于数据的数据,在最基本的层面上,是在何时何地创建的数据,以及是谁创建的数据。但是元数据可以描述更多内容:用户可以创建任意的元数据标记来描述他们想要的任何属性。

数据科学家需要丰富的元数据来查找特定数据以构建和使用其人工智能和模型。随着更多信息添加到数据中,元数据注释可逐步积累知识。

文件和块存储仅支持有限的元数据,例如上述基本属性。这在很大程度上可以归结为可扩展性,因为文件和块系统未配备快速无缝的增长功能,如果存储系统支持依赖大量数据集的人工智能和应用程序的丰富元数据,则自然会发生这种情况。但是,对象存储支持无限的、完全可自定义的元数据,从而使查找用于人工智能和算法的数据更加容易,并从中获得更好的见解。

几乎每一家财富500强公司都在考虑采用人工智能和,可以想象这些技术将在可预见的将来成为最重要的企业it计划。然而,要使人工智能和计划获得回报,企业必须利用正确的存储基础设施。对象存储由于其可扩展性、对各种api(特别是s3)的支持以及丰富的元数据,是人工智能和的最佳支柱。

版权声明:本文为企业网d1net编译,转载需注明出处为:企业网d1net,如果不注明出处,企业网d1net将保留追究其法律责任的权利。

(来源:企业网d1net)