这对于跨行业的所有组织

Latest collection of data for analysis and insights.
Post Reply
ayesha112
Posts: 29
Joined: Tue Jan 07, 2025 4:29 am

这对于跨行业的所有组织

Post by ayesha112 »

提供最好的 ETL 工具、最好的 AutoML 工具、最好的数据编目工具、最好的模型管理工具等(见图 3),将允许每个团队选择他们想要使用的技术,当试图让每个人都满意时,这是一个诱人的前景——诚然,在整个组织中达成共识并非易事。然而,这些组件之间的“粘合剂”虽然不像从头开始构建一切那么复杂,但仍然是一个巨大的挑战。

图 3:在寻找最佳工具时,数据科学、机器学习和人工智能生命周期的不同领域中存在多个难题——即使只将其中几个问题粘合在一起也会很快变得复杂。

图 3:在寻找最佳工具时,数据科学、机器学习和人工智能生命周期的不同领域中存在多个难题——即使只将其中几个问题粘合在一起也会很快变得复杂。

除了胶水问题之外,端到端生命周期中还有一些重要组件在从一个工具转移到另一个工具时丢失。例如:

数据沿袭很难跨工具追踪。来说都是一个问题,因为人工智能流程的可见性和可解释性对于在这些系统内外部建立信任至关重要(对于金融服务或制药等一些受到严格监管的行业,这是法律要求的)。如上所述,对于第二种选择,很难甚至不可能一目了然地看到哪些数据在哪些模型中使用、这些数据是如何处理的,以及使用这些数据的哪些模型正在生产中,哪些模型正在内部使用。
将同类最佳的工具拼凑在一起也会使团队之间的交接变得复杂(例如,数据清理后分析师和数据科学家之间的交接,或部署到生产过程中数据科学家和 IT 或软件工程师之间的交接)。将项目从一个工具转移到另一个工具意味着一些关键信息可能会丢失,更不用说交接可能需要更长的时间,从而减慢整个数据到洞察的过程。
Post Reply