本文翻译自:www.datanami.com/2021/05/11/… (Yusak_P./Shutterstock)
由于有了更好的工具和技术,管理大数据在某些方面已经变得更加容易。但它仍然是一个相当大的挑战,特别是在数据分散的环境中维护隐私和安全。那么,我们在未来将如何应对这些挑战?Gartner 分析师在上周的数据与分析峰会上分享了一些想法
根据 Gartner 分析师 Mark Beyer的说法,机遇很快就会到来(如果还没有的话),形式是机器学习和AI驱动的数据管理自动化。
“我们的机器伙伴现在是数据管理业务的实际同行,”Beyer在主题位「数据管理的未来」的论坛上说。”机器做某些事情的效率和速度远远超过人类”。
机器学习算法目前在模式匹配、分类和异常检测等领域超过了人类的能力。我们的机器伙伴能够帮助我们的最有希望的领域之一是提高数据质量,包括数据分析。
“在未来三年的数据管理中,我们将教会我们的机器伙伴相当多的东西,”他继续说。”但机器只能走这么远。因此,就像你的人类伙伴的同行一样,你的机器伙伴将不得不认识到他们能做多少,以及他们必须在哪里停止。”
让我们的机器伙伴知道何时停止并不是一件容易的事。最终,机器会更好地适应困难的环境–也就是说,根据学到的经验随机应变–而这很可能标志着数据管理历史的一个转折点。
“我们必须教导我们的机器模型,什么时候不同的碎片和零件可以在不同的组合中重复使用,”Beyer说。”我们还必须教他们这些组合变化的频率,这些变化的速度,以及什么时候一个模式实际上反映了一个……新模式。这就是即兴创作的定义。”
(来源:Gartner)
与其让机器经历失败,然后要求它们适应失败,Beyer称之为 “硬碰硬的学校”,未来的数据管理将需要将技能从人身上细致地转移到机器上。
贝耶尔说:”在某些时候,我们将拥有真正的增强型数据管理,而在真正的增强型数据管理中,所发生的是人类放弃了即兴发挥的作用。”
Beyer建议用户寻求采用能够提供连续数据分析能力的工具,这些工具能够自动发现新的数据。他说,公司应该寻找来自云供应商的工具或共享开放元数据标准的ISV工具。他还建议企业采用能够在多云环境中自动进行元数据分析的数据结构。
数据中心
Beyer的同事、Gartner分析师Ted Friedman表示,减轻数据管理负担的另一个方法是通过使用数据中心。
弗里德曼在上周的Gartner会议上发表关于数据中心的演讲时说:”你的应用和数据环境可能已经变得相当庞大,高度分布,非常多样化,孤立无援,而且整个数据不断变化,”。”这些条件显然不利于快速、可靠、有效、可信赖的数据流动。”
弗里德曼说,强迫用户遵守IT人员在过去几年实施的强硬治理类型,在新的数据范式中是行不通的。
他说:”你永远无法跟上不断增长的蔓延和复杂性的增加,”他说,”你永远无法让组织中的所有系统和所有人都按照你的期望行事。”
(来源:Gartner)
一种可能奏效的方法是采用数据中心战略。根据弗里德曼的说法,数据中心与数据湖和数据仓库有一些相似之处。但是,数据集线器方法有一个关键的区别,使它能够在大规模的湖泊和仓库变成不可理喻的混乱时发挥作用。
弗里德曼解释说:”数据中心是 “一种架构模式,能够调解、共享和治理从企业的生产点流向企业的消费点的数据”。数据中心将提供 “一个调解点,一个数据生产者和消费者可以见面的地方……并分享数据和沿途的良好治理”。
数据可能被保存在数据中心,也可能不被保存在数据中心,企业可能有一个单一的数据中心或许多不同的数据中心用于不同的使用案例。弗里德曼说,可能有一个用于主数据管理(MDM)项目的数据中心,也可能有一个用于分析的数据中心。
“他说:”数据中心基本上有两个方面,或两个层面。他说:”一个是关于流动、共享、移动、同步、提供关键数据的整合。另一个是关于数据的治理–从质量、隐私、安全的角度做正确的事情。”
弗里德曼说,在一天结束时,数据中心旨在帮助企业将数据管理挑战分解成更容易消化的部分。
“他说:”数据中心战略将帮助你消除很多复杂性,简化和精简企业中的数据流,提高信任水平。他说:”从本质上讲,数据中心是一种解药。它将帮助你获得对数据的共同理解的好处,减少整合基础设施的成本和复杂性,并帮助你从治理的角度拿回一点控制权–希望是很多控制权。”
历史上,数据要求收集它、分析它和大量使用它的公司作出让步。虽然技术已经帮助公司克服了其中的一些挑战,但不断变化的数据环境要求公司认识到新的挑战,并确定更多的方法来补救它们。