Menu
025-8556-1577

窥豹一斑:与众不同的工业大数据

发布日期:2020-07-20 浏览次数:3222

1.概念与背景

  工业数据是工业领域产品和服务全生命周期产生和应用的数据,包括但不限于工业企业在研发设计、生产制造、经营管理、运维服务等环节中生成和使用的数据。工业大数据是基于工业数据,运用先进大数据技术,贯穿于工业的设计、工艺、生产、管理、服务等各个环节,使工业系统具备描述、诊断、预测、决策、控制等智能化功能的模式和结果。

  在大数据时代,一个企业的竞争力将大大取决于该企业拥有数据的规模、活性及解释、运用数据的能力上。然而,与互联网、金融、轨道交通等领域相比,工业系统无论在复杂程度、数据特征、现有基础、应用机理上均有着显著的差异。近几年,随着信息化与工业化的融合发展,信息技术已渗透到了工业企业产业链的各个环节,工业企业所拥有的数据也日益丰富,越来越多的先进企业陆续着手规划或开展大数据建设,然而目前许多企业尚未建立清晰的工业大数据认知,大数据分析的作用被广泛宣传甚至神化,部分企业盲从地认为将传统商务大数据的应用场景或建设思路套在工业大数据上即可水到渠成。工业大数据到底能做什么?如何发挥价值?如何推进?我们带着这样的问题,来探究下工业大数据的庐山真面目。


2.工业大数据的特征

  谈起大数据,我们耳熟能详的往往是数据规模大(volume),处理速度快(velocity),数据类型多(variety)、价值密度低(value)、质量要求高(veracity)等典型特征,然而这些特征并不能准确表达工业大数据的特点。国睿信维结合对工业数据类型的分析发现,工业大数据与生俱来就有着区别与互联网、金融等传统的商务大数据的鲜明特征:多模态、强关联、物联化、强机理等。

工业大数据典型特征


  这些鲜明的数据特征,亦造成了工业大数据建设区别与传统大数据的建设要求:

  多模态,相对于互联网大数据的量,工业大数据更注重数据的全,这意味着对工业系统的定义需要完整,要能够面向应用要求尽可能全面的使用样本,以覆盖工业过程中的各类变化条件,保障从数据中能够提取以反映对象真实状态的信息全面性,从而支撑对不同模态下数据的定位、追溯与对比。(如:某一产品关键指标在设计、仿真、测试、验收、运行状态下的数值比对与追溯。)

  强关联,意味着工业大数据的应用不仅仅局限在传统商务大数据在数据属性相关性的分析挖掘,还更应关注数据所表征的各个业务对象(产品、人、设备、流程等)之间所富含的组成、装配、逻辑、时序、语义等关系的挖掘与利用。(如:基于产品特征、工序、设备、工装资源等相互依赖关系,实现基于产品特征的工艺路线的智能推荐。)

  物联化,来源于工控设备、智能产品的物联数据是工业大数据的重要来源,但在工业实际应用中往往面临的是设备标准众多,接口各异,协议繁多,互通性差,未联网设备部分老旧,数字化程度低等问题,这意味着如何满足企业高安全、高可靠、低延时的物联数据接入需求是实现工业大数据的关键之一。

  强机理,商业应用常遵循大数原则,概率性的分析就可以为运营提供很大的帮助,但是在工业大数据领域,一方面,由于工业系统的实时性高,动态性强,对分析结果的精度要求高,仅通过概率性预测无法满足工程实际需要;另一方面,由于对分析有直接意义的样本比例通常很小,往往也不具备相关性分析的基础。这意味着,工业大数据分析更应该抱着“小数据”的心态,敬畏机理模型和领域知识,通过机理模型、领域知识的积累优化,为数据分析缩小参数空间、提供有用的特征变量,把数据分析模型与机理模型充分融合。


3.工业大数据的建设思路

  通过对工业大数据的特征分析,工业数据无论从数据来源渠道、数据整合的复杂性以及应用模式方面,与传统的商务大数据均存在着较大的差异。因此,企业推进工业大数据必须结合自身的基础,制定切实可行的推进思路。如下图所示,我们建议企业可以从数据来源、数据应用以及数据质量三个方面对工业大数据的建设思路进行统筹规划。

工业大数据建设规划


(一)盘活数据资产

  盘活数据资产的核心在于两个方面:互联互通与数据资产定义。


1)互联互通

  通过IT(信息技术)与OT(运营技术)的紧密融合、虚拟世界与物理世界的映射与闭环驱动,是实现生产过程中的产品工艺→实物制造、厂房规划与设计→生产系统运行维护、生产计划→底层设备制造执行三条数字链路贯通,实现基于大数据的工业态势感知、工业系统优化的核心。而实现IT、OT的融合首先需要解决相关数据(即:企业信息化数据、工业物联网数据)接入的问题。其中,企业信息化数据目前已具有非常成熟的接入机制,因此,本文主要对工业物联网的数据接入思路进行探讨。

  如下图所示,针对支持传输网络协议且数据无需本地处理的资源可以直接联网通信;针对不支持“传输网络”协议的资源或需通过本地加工处理的资源,可以直接通过工业以太网关的方式进行数据连接。


2)数据整合

  上文我们已经提到工业大数据,不仅需要关注单一业务对象数据属性相关性的分析挖掘,还更应关注数据所表征的各个业务对象(产品、人、设备、流程等)之间所富含的关联关系的挖掘与利用。因此,在数据整合方面,企业需要形成一套面向企业工业系统各业务对象的数据建模与关系挖掘的方法,将以往“孤立、割裂”的业务对象数据,实现面向不同环节、不同状态的有序组织与广泛互联,为工业数据价值的充分挖掘,夯实基础。

  国睿信维认为工业大数据分析的核心对象可以概况为产品、人、企业、设备四类。因此,我们建议以这四类核心业务对象为主线,建立与之应用模式相匹配的数据资产体系,实现工业数据及工业系统各业务对象关联关系的有机整合。


·产品数据整合思路

  面向“产品”的数据整合,其核心是构建全生命周期的产品数据资产,支持全局数据的有效追溯和经验复用,其整合思路如下图所示:


  01基于流程方法,指导产品数据的有序梳理

  建立面向企业核心业务域端到端的流程体系,打通产品、流程、数据三者之间的关联关系,并基于业务过程对产品全生命周期数据进行查漏补缺、确保数据传递无断点。

  02 基于多视图BOM,构建产品数据的体系框架

  通过基于多视图的产品结构数据组织,其核心是以数字链拉通为主线,实现对各阶段数据的分视图组织、管理与流转,构建“物理分散、逻辑统一”的数据中枢,实现数据的全面关联、更改的全面影响、状态的全面可控。

  03 建立数据标准映射,实现产品数据的清洗整合

  针对产品特别是复杂装备产品的不同层级对象(系统、分系统、单机、部件等)分别建立相应的数据标准和数据模型,并实现不同来源数据的清洗整合。

  04 以场景为导向的数据资产持续完善

  随着应用场景的不断扩展与优化,以业务为导向持续优化企业的产品核心数据资产。


·“人”数据整合思路

  面向“人”的数据整合的核心是构建企业员工的360°画像,实现员工属性特征与行为特征数据的关联整合,以支撑基于员工特征的知识推荐与人力资源绩效分析。其整合思路如下图所示:


  01 构建企业员工的360°画像

  基于静态与动态两类特征建模,构建企业员工的360°画像,其中,

  用户的静态属性特征,通常包括专业背景、部门、职称等;

  用户的动态行为特征,通常包括知识互动行为信息(如检索、收藏、评价、贡献等)、业务行为信息(如计划执行、培训、专利发表等)。

  02 员工特征数据的动态捕获

  员工的特征数据通常可以考虑从相关信息系统的业务数据、日志数据以及为捕获相关业务行为特定配置的埋点数据中获取。

  03 机理模型的规划设计

  构建企业员工的360°画像,通常可以用于实现基于行为特征的知识推荐以及人力资源绩效分析两个方面。因此,在面向“人”的数据整合方面,可以构建面向这两类应用的机理模型。

  员工相似度模型:从员工属性、知识行为、业务行为等维度实现相似员工群体及其偏好的识别,并基于群体偏好,实现知识的动体推荐。

  能力绩效评价模型:结合企业自身特点,建立面向不同岗位员工的绩效能力评价模型,并结合不断捕捉的员工行为数据,用以支撑基于事实依据的任职资格评定、绩效激励、人员结构分析等应用。


·企业数据整合思路

  面向“企业”的数据整合,核心是建立面向企业经营管控的数据分析体系,从而支撑对企业经营过程透明化管控,其整合思路如下图所示:


  01指标体系框架设计

  按照企业的经营特点和决策者的思维逻辑,为系统设置专门的分析主题。决策者选择不同的主题切入,逐步梳理关键成功要素,并根据关键要素确定衡量指标体系。

  02 指标体系要素设计

  针对各指标体系的要素,明确各指标的名称,定义应用范围、计算公式和分析维度,并形成相应的数据词典。

  03 分析模型设计

  分析模型是根据管理方法和决策者分析的思维逻辑设计的特定算法,是决策者对企业经营信息进行分析的工具。绩效管理中常用的模型有预测分析、监测预警、穿透分析、专业分析等多种模型。

  04 数仓模型设计

  企业数据仓库是为了分析目的而构建的数据存储。数据仓库是决策支持管理的基础,为分析和决策提供数据支撑,并需要考虑相关的数据来源,包括系统集成和数据报送两个部分组成。


·设备数据整合思路

  面向“设备”的数据整合,其核心是在虚拟世界中能够实现物理设备相关特性的数字化表达,并打通虚拟世界与实物世界间的信息通路,以便于我们能够在这个数字化产品上看到实际物理设备可能或正在发生的情况,并反向对物理设备作出相应地决策与控制。其整合思路如下图所示:


  01 物模型设计

  物模型是指通过在大数据平台,构建该实体的数据模型用于反映真实世界物实例的产品功能。物模型将设备功能类型分为三类:属性、服务和事件。定义了这三类功能,即完成了物模型的定义。

  02 物映射

  构建物模型与物实例间的映射关系。物映射往往是双向的,一方面,不断从真实的设备中采集需要用于监控、分析的信息;另一方面,从虚拟的赛博空间中,不断基于机理模型运算的决策结果或直接的控制指令传输至真实设备中,实现相应的设备状态与行为的控制。


·万“物”互联思路

  万物互联是指将企业工业系统的各类业务对象实体建立广泛、全面的关联网络,从而帮助企业不断挖掘尚未发现的业务规律、经验知识以及潜藏风险,洞察未来业务轨迹。万物互联是企业信息化建设持续追求的目标。

  在实际推进过程中,企业可以以产品、人、企业、设备为主线,优先实现基于某些特定业务主题内部对象之间关联关系梳理,然后再实现跨业务主题间对象关联关系的打通。

  如下图所示,当企业结合业务需求需要,分别建立了支撑产品信息追溯、故障分析、设备运行分析、人员绩效分析以及技术谱系追溯的业务主题网络后,企业可进一步挖掘产品、人员、技术、故障、设备等跨主题间隐含关联关系的建立。(如:当某一产品发生故障时,可快速定位可能影响的关键工序、关键技术,并可进一步找到该工艺或关键技术的负责人进行咨询,或者查看当时相关工序设备的运行状态、人员的岗位资质、操作记录等。)

基于主题的对象关系网络


(二)挖掘应用场景

·大数据场景分析方法

  大数据是过程(生产制造、研发服务、采购销售)痕迹的数字化记录,目的是为“用数据说话”奠定基础,是对已有系统所产生的数据的二次利用。因此,企业需要结合型号研制特点及核心瓶颈,梳理工业大数据的典型应用场景及实现逻辑。国睿信维总结出一套“以业务场景为导向”的SLDT分析方法,以“业务成熟度”及“急用先行”为原则,来帮助企业实现潜在大数据应用需求的挖掘。


  1)场景分析:

  通过对企业核心愿景及当前型号研制过程核心瓶颈的分析,逐步挖掘潜在业务需求,并开展基于大数据服务的场景蓝图设计。

  2)业务逻辑分析:

  结合场景目标,分析在该场景中所包含的业务对象及相关的业务流程,并对业务过程中不合理或缺失环节进行优化,并最终对该场景的实现逻辑进行建模,明确数据源到数据应用场景各环节的实现思路。

  3)数据分析治理:

  结合逻辑分析结果,对该场景下涉及的业务对象的数据来源及数据有效范围进行梳理,通过对现状及实现目标的差距分析,制定数据治理策略。

  4)技术论证实现:

  结合该场景的实现目标及当前数据状况,对关键技术点进行识别与论证,并制定实现该场景的IT技术方案。


·典型案例

  下图是我们在航天某单位大数据场景挖掘的典型案例。我们都知道“保成功”是航天单位的首位目标,因此,以提升“产品保证能力”为核心,基于SLDT方法我们与客户单位共同围绕事前预防、事中掌控、事后追溯、全局感知四个维度,完成了六类大数据应用场景的顶层规划与设计。


某航天企业的大数据场景总体规划


(三)开展数据治理

  企业的数据治理是指企业专注于将数据作为企业的核心资产进行管理与应用的一套管理机制,目的是消除数据的不一致,建立规范的数据应用标准,提高组织的数据质量,实现数据的广泛共享,并能够将数据作为组织的宝贵资产应用于业务、管理、战略决策中,发挥数据资产的商业价值。

(注:面向工业企业的数据治理思路,请具体参考本期刊的《工业企业的数据治理模式探索研究》一文)


4.工业大数据的应用模式

  工业大数据在激发企业数据资源要素潜力,促进企业数字化转型,提升企业产品研发与创新能力,促进生产模式创新,控制产品质量,追溯产品状态等方面均具有至关重要的作用。在这些场景中,工业大数据的应用模式主要分为如下四类:


·商业智能

  商业智能是企业开展大数据建设最常应用的场景。传统商业智能的应用模式主要基于结构化数据,通过人为设定的绩效指标体系,帮助决策者落实决策意图,掌握宏观统计趋势。这种应用模式的效果依赖于指标体系设计的完整性与合理性。常见的商业智能的应用场景,如:财务经营管控、科研生产主题经营管控以及企业综合经营态势分析等。


·关联追溯

  关联追溯在工业大数据应用中往往是最为基本且迫切的应用模式,通过关联追溯可以实现工业系统不同维度、不同层级相关业务对象间的有效追溯,亦可实现同一对象不同状态的有效追溯。这种应用模式的效果依赖于工业系统中对象与对象、对象与数据间隐性关系的充分定义与挖掘。常见的关联追溯的应用场景,如:产品配套关系追溯、全局变更影响分析与追溯等。


·数据挖掘

  数据挖掘是指从大量的数据(包括结构化数据、半结构化数据以及结构化数据)中通过算法搜索隐藏于其中信息的过程。其核心是透过事件的表象发现隐藏在背后的蛛丝马迹,从而找到潜伏的规律以及看似无关事物之间背后的联系。但正如前文中所提到的工业数据“强机理”且数据样本通常较小的特点,基于数据挖掘的应用模式的建立通常需要依赖于领域专家经验、机理模型的有效固化。常见的数据挖掘应用场景,如:产品数据包络分析、共性问题挖掘分析等。

基于成功样本的产品数据包络分析


·智能决策

  智能决策(即认知智能)是指机器具有主动思考和理解的能力,不用人类事先编程就可以实现自我学习,有目的推理并与人类自然交互。智能决策倾向于刻画个体,更多的在于个性化的决策分析。基于智能决策的应用模式是工业大数据应用的更高形态,以知识图谱为核心的认知智能技术虽然目前得到了一定发展,但仍处于较为初级的阶段。因此,基于智能决策的应用模式在近几年可以优先考虑在数据样本相对规范、影响因素相对可知的应用场景。如:基于用户画像的知识推荐、故障归零辅助分析等。

基于用户画像的知识推荐


5.工业大数据从何做起?

  随着新一代信息技术与制造业的深度融合,工业企业的运营管理,将越来越依赖工业大数据,工业大数据的潜在价值也将日益呈现。但是工业大数据是一个高度个性化与行业深度结合的技术加业务的综合体,其在不同的行业中往往不具备可复制性。那么,究竟工业企业要实现大数据的应用价值,企业又应该从何做起?我们认为主要有两种模式可供参考:


模式1:全局治理,夯实基础

  工业大数据往往与行业及企业业务特点深度结合,因此其应用场景的挖掘,往往很难借助外部力量,需要企业自身建立相应的大数据分析团队,形成面向不同业务域的大数据场景分析方法。而这些条件在企业推进大数据建设初期往往很难具备。因此,目前业界不少企业大数据建设初期,往往是基于数据资产治理的角度逐步推进。通过对数据资产的治理,一方面夯实数据基础;另一方面,企业的业务人员和大数据厂商通过不断地磨合、碰撞,不断对数据背后的业务价值深入理解,并逐步挖掘典型的上层应用。

  优势:有利于企业尽早从全局对数据资产的组织模式、数据标准进行规范,夯实数据基础;同时,可以系统性地反向推进企业整个IT架构的重新整合。

  劣势:投入资源大,见效慢。


模式2:有点带线,由线带面

  适用于行业已经具有相对成熟的大数据应用案例,企业可以采用有点带线,由线带面的方式,逐步推进大数据的建设。首先,通过试点应用场景的探索与运用,逐步摸索一套适合本企业特点的大数据场景开发模式,并最终在企业全业务域进行有效推广。

  优势:投入资源小,见效快。企业可以快速感受到大数据的应用价值,从而增进企业进一步推进的决心。

  劣势:随着数据应用场景的开发,很可能前期面向该场景下的局部数据治理成果需要重新调整甚至全部推翻。


6.总结

  工业大数据的建设是一项庞大而复杂的系统工程,涉及到的企业组织架构调整、业务流程优化、IT架构治理、企业文化重塑等内容。通过对工业大数据趋势的跟踪解读,以及对国外机构理念和领先企业的实践总结,国睿信维可以帮助企业在数据治理、平台建设、大数据应用规划等方面提供整体的解决方案。


91免费亚洲精品文化有限公司链接三黑战斗刘玥链接链接链接