Menu
025-8556-1577

面向制造型企业的知识图谱研究与实践

发布日期:2021-03-01 浏览次数:5255

一、前言

  知识图谱是知识工程在互联网时代浪潮上的最新进展,其本质上是一种基于可视化技术构建的人机均可理解的知识语义网络。知识图谱利用可视化的图谱形式,能够形象地展示企业知识网络的核心框架与知识分布。利用知识图谱技术可以更好地实现机器对用户需求的理解与响应,突破传统基于文档的知识管理及应用模式,能够帮助企业建立面向不同应用主题的语义知识库,实现对企业内外部海量信息资源的知识挖掘,更为智能地理解员工的知识应用诉求,并提供个性化的知识应用服务,提高企业的运营效率和业务部门竞争力。



二、应用优势

  知识图谱强调以人为核心机器为辅助的知识自动化和半自动化,能够很好的借助专家经验实现知识获取、构建和分析应用。与传统知识管理手段相比,知识图谱的优势主要表现如下:

● 支持大规模复杂知识的自动化建库

  与传统知识梳理和知识库建设较为依赖人工干预不同,基于知识图谱能够基于已有的专家经验知识图谱,在采集、识别和融合大量知识对象后,能够通过自学习的方式实现大规模的自动知识获取。

● 更为高效地固化、复制和推广专家经验

  以往基于逻辑规则的专家系统大多是通过定制化的设计来实现,在业务规则发生变化或出现大量调整时,就需要开发人员和业务人员来重新进行规则设置和开发调整。而基于知识图谱的交互探索式分析,可以模拟专家的思考过程去发现、求证、推理,能够根据业务条件的变化,如数据源调整、业务对象更新、业务逻辑关系变化等,进行自适应调整。设计师自己可以模拟专家决策过程完成全部业务过程,不需要额外专业人员的协助。

● 有效提升已有系统或工具的智能水平

  利用知识图谱的交互式机器学习技术,支持根据推理、纠错、标注等交互动作的学习,不断沉淀知识逻辑和模型,提高企业系统智能性,将知识沉淀在企业内部,降低对经验的依赖。例如,利用知识图谱的推理和纠错能力,不断扩充和优化各个业务系统或工具中机器学习模型的先验知识,避免模型的过拟合,提高模型的预测精度。

● 满足企业复杂业务分析和即时决策需要

  传统数据库通常通过表格、字段等方式进行读取,而基于知识图谱的关系层级及表达方式多种多样,且基于图论和概率图模型,可以处理复杂多样的业务关联分析,满足企业不同角色对复杂业务对象的动态关系进行分析的需要。此外,图式的数据存储方式,相比传统存储方式,数据调取速度更快,图库可计算超过百万潜在的实体的属性分布,可实现秒级返回结果,真正实现人机互动的实时响应,让企业业务人员可以做到即时决策。



三、应用示例

  以装备保障业务为例,制造企业在研发、生产、保障以及过程管理等环节都或多或少涉及到一定的故障识别和处置业务。如在研制过程中开展故障定义与预防,装备保障过程中对故障问题的确认和处置,以及相关故障问题的分析和纠正等。

  基于故障的知识图谱可以打通和关联设计环节的通用质量分析、过程的质量管理以及售后的综合服务等过程中的原理、案例、预防措施以及应急处置类知识,以“故障”为主题,形成面向某具体型号装备的维修和保障知识档案。基于知识图谱的知识档案,可以辅助保障人员及时了解待维修或故障对象的基本实现机理,遇到故障问题时,可以参照相应的操作步骤及时解决业务问题。

  具体以某型雷达DAM发射通道基于知识图谱的故障辅助分析为例。

● 图谱构建:通过构建相应的知识本体,基于本体识别并定性关联故障案例/维修记录中的故障现象、故障原因和预防措施等维修保障知识。


某型雷达DAM发射通道故障知识图谱构建示例

● 基于知识图谱的应用:基于故障/维修记录数据,生成相应故障/维修知识图谱,基于知识图谱计算不同批次产品组件一定期间内的发生概率,辅助维修工程师作预防性维修决策。


基于知识图谱的预防性维修决策



四、建设方法

  目前,国内先进的复杂装备制造型企业在研发、设计、生产、管理等各个业务领域都具备了相对完整的信息化条件。这为企业开展知识图谱应用建设奠定了的良好基础。然而,由于起步时间早晚以及建设侧重点不一,各家单位信息化建设和实际应用情况良莠不齐,如何有效稳步推进知识图谱建设,对每一家制造型企业来说都是不小的挑战。下文简单分析了制造业知识图谱构建面临的主要挑战,罗列了制造型企业在推进知识图谱建设时可利用的基础条件,提出了“自上而下”基于SLDT的知识图谱建设方法,并简单介绍了国睿信维在知识图谱核心技术、工具体系等方面的积累和能力。

● 制造业知识图谱构建面临的挑战

  由于知识图谱诞生于较为开放的互联网行业,传统的开放式的知识图谱构建方法很难满足制造型企业知识图谱的建设需求。一些先行启动知识图谱建设的制造型企业也正面临相似的困扰。总的来说正面临如下挑战:

1)数据规模小、类型多,自动化解析的难度较大

  与互联网企业庞大而开放的数据量级相比,制造型企业的业务数据规模偏小,很难套用和借鉴互联网企业知识图谱的建设方法和成功案例。例如,互联网企业大多采用“由下向上”的知识图谱构建方式,利用大数据、人工智能方法,趋向于自动化构建知识图谱,能够在业务环境中“不断试验”,及时反馈和优化知识图谱的各种模型算法。但制造型企业可能就不具备如此良好的数据基础和开放的业务环境,对应的大数据及人工智能方法也无从谈起,即使在建设初期构建好适配的方法模型,但可能由于业务环境的反馈滞后、反馈量不够等弊端,无法得到持续优化。

  另一方面,由于制造型企业的业务数据来源多,类型多样,结构化、半结构化和非结构化数据并举,且后者占比较大,给数据处理和解析带来极大的挑战。例如在PDM系统中大量存储的非结构化的设计文档、QMS(质量管理系统)中的大量质量报告等等,非结构化的文档和图片居多。一方面可能需要建设单位投入大量的人力来进行人工梳理和数据标注,另一方面需要设计和不断优化专门的算法模型来对这些数据进行处理。无论是哪一项工作,都需要建设者投入不菲的人力物力,需要具备足够的耐力和信心。

2)数据往往存在很多噪声、冗余甚至歧义的情况

  数据抽取出来之后,往往存在很多的冗余和噪声,要去做实体的消歧和数据的整合。例如,“国睿信维”这四个字是中文名称,“Glaway”是他的英文名称,但其实这两个指的是同一个实体对象。由于文本的不一样,开始的时候导致这是两个实体。这就需要对它进行实体对齐,把它统一化。另外是大量的文本歧义情况。举例来说,“设计”是一种业务过程,但是在某些上下文里面,它可能指的是“设计人员”或“设计部门”。这就是一个实体歧义,需要根据上下文对它进行实体消歧,否则知识图谱可能就变成“大杂烩”。

3)数据的业务关系较为复杂,梳理难度较高

  随着制造业产品复杂度的不断提升,其业务过程也越来越精细化和专业化。以复杂装备为例,从方案设计到售后服务,涉及到多专业的协同和多学科的融合,而过程中产生的管理、技术等业务数据也是与业务场景紧密耦合。这对数据的业务关系梳理以及治理带来不小挑战,如果处理不当,会直接影响到知识图谱本体建模的准确性和全面性。

● 制造业知识图谱构建可利用的基础条件

  虽然在推进知识图谱建设时面临数据规模小、数据复杂度高等挑战,但不可忽视的是,制造型企业也具备一些可充分利用的基础有利条件。充分利用这些基础条件,能够弥补制造型企业的短板,发挥其建设优势,走出一条与互联网行业不同的知识图谱建设道路。

1)专业化的人才队伍

  随着产品复杂度的提升和越发严苛的服务质量要求,现代制造企业越来越重视多专业多学科的人才队伍体系建设。正如本文篇头所述,以军工装备研制单位为代表的制造型企业,由于其业务的复杂性和数据的封闭性,以及层次不齐的信息化条件,在推进专业知识图谱建设时,尤其是数据梳理、治理以及图谱模型的搭建和验证,仍然需要大量人的指导(特别是领域专家)。而现如今,在国家及地方财*的大力支持下,制造型企业,尤其是大量央企、地方国企,人才*策“虹吸”效果显著,专业化的人才队伍建设得天独厚,为企业搭建稳定的知识图谱“领域专家”队伍,打造专业化、个性化的知识图谱奠定深厚基础。

2)高度的数据权威性

  制造型企业高度依赖其产品数据的一致性、准确性和及时性,例如产品BOM、行业专业术语、技术体系、规范的业务表单以及严格的文档模板等,如果发生错误或失误,则可能会严重影响其产品的生产、上市、交付及后续服务。正因这一严苛要求,为制造型企业打造复杂而又准确的知识图谱提供了数据质量保障。

3)较低的业务不确定性

  在不考虑发生重大业务变革的情形下,制造型企业的业务主体、业务对象、业务逻辑关系等基本业务属性频繁变化的可能性较低。一方面数据关联关系不会随着业务数据的不断增多而发生大量的、频繁的变化,另一方面也方便领域专家在实例数据产生之前就开始业务逻辑、数据逻辑的关联设计,大为方便图谱的统一建模与优化。

● 制造型企业知识图谱的建设思路

  国睿信维公司认为,当前条件下的制造型企业知识图谱总体上是人类指导下的认知智能,与其它行业相比,仍属于初步阶段,知识图谱在以下几方面需要领域专家的指导。

领域专家在知识图谱工程中的作用

  知识图谱需要领域专家赋予其认知世界、认识特定领域的基本概念框架,比如,对雷达故障领域本体或领域模式的定义。其次,需要领域专家标注样本、反馈结果。一个词是否是合适的领域词汇,一张装备故障图片是否指针装备相应的功能特征等,这些都需要具有较深业务知识才能完成。

  制造型企业数据规模小,数据与业务耦合度高。因此在建设时,需要考虑结合企业具体问题来进行分析和需求的挖掘,侧重业务应用场景的设计和验证。可以说,制造型企业知识图谱的建设是与互联网等通用行业知识图谱建设完全相反的路径,注重以业务场景为导向,是“自上而下”的建设模式。

1)“自上而下”场景驱动的知识图谱建设方法论

  结合制造企业数字化转型的实践经验,特别是制造型企业知识工程项目的建设经验,国睿信维总结出一套以业务场景为导向“SLDT”知识图谱建设方法,以业务成熟度和急用先行为原则,结合建设单位现有业务领域的知识需求度、数据成熟度以及业务开展的成熟度逐步开展知识图谱工程项目的建设。


“SLDT”知识图谱构建方法

注: Scenario (S), Logic (L), Data (D), Technology (T)

a)知识图谱应用场景分析

  场景分析的核心是通过综合评估分析,为企业选择需求较为迫切、知识基础良好、业务逻辑较为明确的场景,规避基础较差、治理工作量较大、非结构化数据众多的业务场景,从企业整体角度,确定知识图谱构建优先级和最终应用的建设路标。

  具体以故障知识图谱为例,首先,我们结合一线业务人员,如外场维修人员、质量管理人员、设计人员等对故障知识的诉求进行总体设计和规划,而后对企业现有故障知识相关业务的现状进行分析,找出限制企业故障知识管理和利用的最大业务和技术瓶颈,如故障归零单尚未在线规范管理、质量报告等以非结构化文档居多,阻碍了故障知识的识别和分享。项目建设时就需要优先考虑这些瓶颈问题。随后建设主体(供应商与建设单位)找出满足用户故障知识需求的建设优先级和建设路标。最后根据用户需求以及企业业务开展方式对故障知识图谱的TO-BE场景进行设计,如在质量系统中借助知识图谱来提升故障归零效率,使得知识图谱的最终应用场景符合业务人员的工作方法和业务习惯。

b)应用场景业务逻辑分析

  在应用场景逻辑分析时,要充分利用制造型企业的专业人才队伍,结合场景目标,详细分析在该场景中所包含的业务对象及相关的业务流程,对业务过程中不合理或缺失环节进行优化,并最终对该场景的实现逻辑进行本体建模,明确知识图谱应用场景各环节的实现思路。

  知识图谱建设过程中,业务逻辑的分析首先要结合设计的应用场景对知识图谱应用时所涉及人、组织等对象进行梳理和抽象,为系统建设做好资源储备。针对现阶段企业知识场景涉及到的业务流程中不合理的地方进行优化,利用信息化的手段提高企业知识资源的管理效率,最大程度地发挥企业知识的价值。最后将梳理优化过的对象和业务进行逻辑建模,以规范统一的数据模型和对象模型描述知识场景中的人和业务(本体建模),将知识的关联和组织规范化。

c)数据分析治理

  如前文所述,知识图谱构建的原始数据往往存在很多的冗余和噪声,需要做实体的消歧和数据的整合。具体来说,需要对满足场景业务逻辑的各类数据源进行梳理,确定接入的数据范围,以满足知识图谱实际应用场景为导向,制定数据清洗、治理的目标策略和实现思路,提升数据基础质量。归根结底,知识的承载和传播还是以数据的方式进行流转。对知识的优化管理其实就是对承载知识的数据进行治理。数据分析治理的过程需要结合逻辑分析结果,对知识来源及知识覆盖范围进行梳理,通过对现状及实现应用目标的差距分析,制定数据治理策略。

d)平台技术论证实现

  平台技术论证实质上就是知识图谱实施方案的规划和设计。具体来说,需要结合场景的实现目标及当前知识应用状况,对涉及到的本体建模、知识挖掘、知识融合等关键技术需求进行个性化识别,并制定实现该场景的IT技术方案。知识图谱的最终落地往往归结于关键的几个技术能否满足应用需求,在知识图谱建设过程中需将这些关键技术点识别出来,例如故障业务命名实体识别、故障描述句法分析、故障本体构建等,需要对这些技术点进行重点开发、调整和把控,保证项目建设过程不出现技术风险。随后集中企业和供应商的优势资源,从技术和业务方面对关键技术点的可行性进行论证,以降低项目的技术风险。最后根据设计场景以及论证结果给出项目的整体解决方案。

2)国睿信维知识图谱构建技术

  制造型企业知识图谱建设是一类高度个性化、行业特色明显、技术依赖性较高的综合建设项目。近年来国睿信维一直注重知识图谱相关方面的技术积累和工具体系的打造,在知识图谱的本体建模、知识挖掘、知识融合以及知识图谱配套软件体系打造等方面具备相关的解决方案和技术能力。

a)本体建模

  本体建模是“万里长征第一步”,其目的是从业务逻辑角度和概念层面,基于领域专家的经验,初始化不同的概念主题、主题包含的概念要素,以及概念要素之间的逻辑关系等内容。通常本体建模需要业务专家手工进行搭建,但在制造型企业中,可以充分借鉴现有各个专业化业务系统的业务逻辑,结合系统中的基础数据库(如产品库、数据分级分类体系、主数据库、元数据、专业术语库等),再根据场景需要进行本体、本体关系的定义或调整。

  国睿信维知识图谱解决方案能够提供可视化的本体建模环境,支持用户通过拖拽的方式灵活建立本体中的各类概念及其语义关系。能够基于标准OWL的形式化建模语言,支持目前主流的7种语义关系的推理模式(如:函数性、对称性、传递性、不可逆性等),并能够基于推理逻辑,同时支持对不同对象间语义关系的逻辑性校验。


可视化本体建模能力

b)知识挖掘

  在本体建模工作完成后,需要通过半自动或自动化的手段来识别和挖掘企业知识库中的知识对象及其关系,核心目的是将相关的知识对象及其关系关联到已经构建好的相关知识本体以及本体关系上。目前制造型企业大多关注文本类、模型和网页类三大类知识。基于此,国睿信维知识图谱解决方案,能够提供基于语义的文本知识自动挖掘、基于网络爬虫的结构化知识挖掘和基于几何特征的模型知识自动挖掘手段,来帮助制造型企业基于本体模型实现海量知识的自动挖掘。


知识挖掘实现逻辑示意

1.基于语义的文本知识挖掘

  基于对企业用户常见问题类型的提炼总结,通过内容滤镜算法,基于多达70多种语义关系将知识库中的各类知识资源进行语义类型与语义关系的解析(常见语义关系包括定义、组成、功能、参数、原因、结果、角色等),从而构建全面、统一的语义索引库,并以此为基础,引擎对用户的查询表达进行语义处理与语义推理,从而更加正确、全面地识别用户检索意图,并实现知识精确挖掘。

基于语义的文本知识挖掘示例

2.基于几何特征的模型知识挖掘

  基于模型特征提取技术,将三维模型中的特征信息进行有效抽取与挖掘,并结合相似度算法,实现基于模型特征相似性的三维模型的有效归类与挖掘。

基于几何特征的模型挖掘

c)知识融合

  对基于本体模型识别和挖掘出的知识对象和知识对象关系往往需要进行对齐、消歧和描述标准统一。为此,国睿信维知识图谱解决方案,提供通过基于本体库匹配、自定义实体知识字典、自定义语义关系字典、自定义融合规则配置等多种方式,实现各类概念知识、实体知识、关系知识的有效融合。

  对制造型企业来说,如果能够构建统一的主数据和元数据标准,基于统一的主数据和元模型,能够有效降低事后进行知识融合的复杂性。

图 9知识聚类实现过程示例



五、建设案例

● 建设背景

  中电某所经过“十二五”期间的信息化能力提升建设,装备设计、试制、测试、验证以及售后服务等阶段的故障数据已得到完整存储,针对全所的各类各层级产品的故障模式,在业务层面也进行了标准化,并专门建设了一套统一的故障模式库。在开展故障知识图谱建设之前,该所业务人员能够基于某一层级产品的故障模式,通过检索定位查找到相关的售后服务记录、问题闭环措施等内容,一些对优化设计有价值的故障相关知识也能通过流程系统推送到装备设计过程中,以此作为设计参考依据。但无论是检索还是推送,整个过程的相关对象都只是一份份文档,业务人员仍需要花费不少的时间对文档进行浏览和理解,该所虽然初步建立了故障知识的应用模式,但实质上并未挖掘和实现故障知识的完整价值。

中电某所知识图谱建设背景

● 核心内容

  通过对研发设计过程的FMECA过程、质量问题FRACAS闭环过程以及售后现场问题排故等过程进行业务梳理,识别了过程中的主要业务对象和数据对象,并借助可视化本体建模工具进行了故障本体关联构建,形成具备某类军工电子装备特色的故障本体框架,如下图所示。

某研究所故障知识本体

  同时,为满足未来故障知识挖掘的准确性,也对在业务过程梳理中发现的一些数据问题进行了治理。在基于故障本体构建的基础之上,通过整合关联和挖掘产品故障记录、故障件信息、故障原因、故障现象、故障密级、故障案例以及排故措施等故障资源,借助故障本体的语义关联和逻辑表达能力,实现了故障知识图谱的自动构建。

● 应用场景

  故障知识自动建库:基于已有的故障库,通过知识本体建模,在逻辑层面,从产品、问题、人员、方法等对象视角,将设计、试制、测试、验证以及售后服务等过程的故障知识进行抽象关联,通过自动化的识别和挖掘手段,将分散的故障知识实体抽取到知识图谱实例数据库中。


某研究所故障知识自动建库

  故障知识语义检索:基于故障图谱,一方面能够支持设计师、质量师、装备维保人员对故障相关知识进行语义查找。


某研究所故障知识图谱检索

  故障知识导航与产品故障辅助定位:借助故障知识图谱的语义关联和逻辑推理,形成故障知识的语义导航和故障原因推理分析能力,促进故障问题逻辑分析和问题闭环解决的效率,让故障知识真正能够反馈到设计过程,提升设计质量。

某研究所故障知识导航和故障辅助定位场景

  此外,在LSA(综合保障分析)系统中进行潜在失效模式分析时,能够基于历史的问题记录,基于图谱语义关联推送相关的质量闭环信息、相关的评审决议要求等内容,辅助设计师进行可靠性分析。在MRO(售后服务)系统中,向装备维保人员推送相关型号的故障隔离措施、维修步骤等细节知识内容。

● 应用价值

  故障知识收集与规范管理:在知识图谱的帮助下,该所IT管理部门能够通过对故障数据进行抽取和清洗,实现过往故障知识的统一收集和规范管理。

故障业务协同处理能力提升:借助故障知识图谱的语义关联和逻辑推理,形成故障知识的语义导航和故障原因推理分析能力,将原本局限在少部分人的“专家经验”进行有效固化、存储和表达,提高故障问题逻辑分析和问题闭环解决的效率,让故障知识真正能够反馈到设计过程,提升设计质量。

亚洲中文链接嫩草 小草精品中文字幕永久人人视频链接链接链接链接