(1)客户介绍
Cerner 公司首席技术架构师 David Dvorak 最近帮助 Cerner 在云中开发了一个配置管理系统,为公司的 IT 业务运营团队提供了资产和配置管理库存的真实来源。现在,员工能够更好地执行他们的工作,花时间创新和部署代码,而不是简单地维护资产。
(2)项目背景
由于 Cerner 是一家向全球客户提供软件的 IT 公司,因此保持准确、可靠和当前的系统信息对于为客户提供价值至关重要。大约三年前,Cerner 的资产和配置管理结构正处于一个临界点。该公司拥有多个不同的资产数据来源,由不同的团队管理,但没有一个团队保持中央问责制。硬件资产管理、容量管理和漏洞管理等关键业务运营没有单一的真相来源。
理想情况下,Cerner 员工应该能够从本地 BMC 补救系统中提取数据,并相信所有信息都是正确的。然而,资产数据被存储在许多不同的地方,没有整合和一致的补救路径,数据往往不可靠。
每当技术程序经理需要有关公司资产的信息时,他们都会从多个资产数据来源之一提取数据,而不是直接使用 Remedy。从不同来源收集数据并验证其完整性的过程通常需要长达一周的时间。数据集完成后,技术程序管理器要求相应的团队验证数据集是否完整和正确。技术经理们浪费时间收集有关资产的信息,而不是专注于推动业务向前发展的任务,例如开发和发布代码。
例如,关键的资产和配置管理任务是能够快速轻松地识别其环境中的服务器数量。当"服务器"的定义根据您询问谁而更改时,这种看似简单的计算变得复杂起来。员工通常根据他们对服务器的定义提供不同的服务器计数,并且由于 Cerner 的资产数据来源不同,因此几乎不可能跟踪消费者到达服务器计数的位置和方式。然后,将花费更多时间试图了解哪些服务器被占,因此很难知道每个所需系统是否已完成升级和所需工作。
Cerner 核心业务流程的主要部分取决于消费者对所提供的数据质量是否最高质量的信心。为了检查数据质量,数据是根据其数据质量评分来衡量的。分数跨越五个加权维度:完整性、一致性、准确性、有效性和一致性。生成此分数需要复杂的计算,该分数由员工手动组合 Microsoft Excel 电子表格中多个系统的数据计算。这个过程漫长而乏味,员工需要几天时间才能完成。由于制作这个分数所需的强度和体力劳动,它既更新供消费者使用,也只提交给领导每季度。
另一个相关问题是维护和清理单个数据源所花费的时间。每个系统在聚合、存储和传输数据方面表现不同。由于每个系统都有自己的数据管理方法,因此在获取资产数据的整体视图方面存在不一致之处。
(3)解决方案
Cerner 的 Beacon 的成功集中在数据湖存储上,这是信标用于聚合和存储资产和配置数据的每日快照的大数据存储技术。
Beacon 团队开发了将三种类型的数据源组合到数据湖中的解决方案。第一类数据源是就地的。在尚未支持数据工厂连接的情况下,将实施名为 Rundeck 的开源应用程序,将本地数据推至数据湖。第二组数据直接从它所处的任何来源推入数据湖存储,而第三组数据集则通过数据工厂被拉入数据湖存储。通过数据湖存储支持的各种计算选项,数据湖中对来自各种来源的大量数据进行了清理、丰富和转换。
从数据湖存储中检索数据后,数据湖分析和数据砖用于聚合和转换数据,更新的数据存储在数据湖中或加载到 SQL 数据库中。大多数消费者需要从类似的信息集中获取信息。SQL 数据库实例的附加存储位置为消费者提供了更轻松的查询能力,具有高度结构化的存储模型,对大多数消费者来说非常方便。
在选择数据可视化工具时,Beacon 团队发现 Power BI 是唯一具有连接器的选项,允许那些还需要直接从数据湖中使用数据执行更复杂的查询的消费者这样做。因此,当数据直接从数据湖存储中获取时,Power BI 被使用,同时也作为使用 SQL 数据库数据的消费者的主要工具。一些 Cerner 员工仍然使用 Tableau,但 Power BI 是主要工具,因为它易于连接到数据源及其先进的可视化功能。
灯塔的好处
如前所述,Cerner 的资产和配置管理职责之一是确定公司环境中有多少台服务器,以便正确维护每台服务器并监控整个环境。在 Beacon 之前,跟踪数据存在的位置以进行适当的服务器计数是很复杂的。虽然 Cerner 的部门可能仍然对服务器有不同的定义,但获取最终数字的逻辑现在很容易被跟踪,通过证明数字的提取位置来省去所消耗的时间。信标现在使用 Power BI 通过系统计数仪表板可视化其整体资产态势。
由于所有数据现在都位于一个地方,因此跟踪数字来源的过程现在要简单得多。用户可以钻阅计数仪表板,查看数字来自何处。集中的数据位置还便于分析和比较哪些系统被计算在内,哪些系统被排除在外。由于在灯塔中使用了 Azure 和 Power BI,因此能够理解数字并简化计算成为现实。不过,Cerner 的资产和配置知识并没有以生成服务器计数而告终。
在信标之前,Cerner 无法信任其数据的质量。借用 Beacon,使用数据湖分析和数据砖创建快速计算这些分数的自动化过程,简化了以前复杂且手动计算其数据质量分数的流程。由于所有资产和配置管理数据现在都集中在数据湖存储中,因此分数可以从一个位置的数据进行计算,而不是通过多个来源进行筛选。这一个数据源消除了数据冗余,提高了数据的完整性,创造了更有价值的可靠分数。
自动化流程允许消费者随时检查系统中数据的质量。消费者可以继续深入每个字段,检查每个数据点,以及数据质量检查是否通过。这为消费者和 Cerner 的开发团队提供了差距的透明度,以及改进数据的机会。
如果收集数据并计算用于人工工作数天的数据质量分数,新过程会自动提供高效准确的计算。过去仅按季度提供的数据质量分数现在几乎可以按需提供。顶级管理层现在只需点击一个按钮即可检查数据质量分数计算。消费者可以深入到计算中,明智地决定将时间和精力集中到哪里,以提高数据质量。
信标的当前状态
Beacon 改变了 Cerner 的配置和资产管理,并成功地构建了一个解决方案,为其数据创建一个真实来源。在花了几个月的时间从 20 多个来源收集资产数据后,Cerner 现在拥有一个单一的权威资产和配置数据来源,所有消费者都始终使用这些数据用于安全、运营和财务使用案例。Cerner 正在使用数据湖分析和数据砖来实施逻辑来分析其不同的数据源,以确定哪些独特的资产在其环境中处于活动状态。
信标解决方案几乎完全建立在 Azure 服务之上,这使得信标团队能够利用设计用于协同工作的工具。当问题发生时,团队在与单个供应商合作时找到了价值,以帮助诊断管道问题的来源,而不是尝试与多家公司单独合作。Beacon 团队还为开发人员提供了创新、集思广益、提出解决方案的机会,而不仅仅是维护这些想法。
信标的下一步
为了扩展 Power BI 问答提供的交互性。消费者通常很难识别 Beacon 是一种解决方案,因为它主要是数据-没有 UI,也没有 URL,他们可以使用访问信标,就像他们与 Cerner 的其他大多数企业服务一样。如果没有正式的界面,消费者可能会感到害怕和担心,他们没有技能来分析数据来回答他们的问题。Cerner 正在研究提供一个引导式对话界面,用户可以在其中以自然语言询问有关数据的问题并获得答案。下图所描绘的概念当前证明表明,这一愿景是可以实现的。
(4)价值体现
Cerner 正在确定 2020 年的优先时间,以充分开发 Azure Bot 服务能力,并将服务运送到整个资产和配置管理团队中。Cerner 对利用这项技术提供一种交互式解决方案感到兴奋,该解决方案优于通过电子表格或过滤报告查找答案。