标准搜索结果: 'GB/T 38666-2020'
标准编号 | GB/T 38666-2020 (GB/T38666-2020) | 中文名称 | 信息技术 大数据 工业应用参考架构 | 英文名称 | Information technology -- Big data -- Industrial application reference architecture | 行业 | 国家标准 (推荐) | 中标分类 | L67 | 国际标准分类 | 35.240.50 | 字数估计 | 14,146 | 发布日期 | 2020-04-28 | 实施日期 | 2020-11-01 | 引用标准 | GB/T 35295-2017; GB/T 35589-2017 | 起草单位 | 北京数码大方科技股份有限公司、中国电子技术标准化研究院、清华大学、中国人民大学、上海计算机软件技术开发中心、北京软通智城科技有限公司、九次方大数据信息集团有限公司、勤智数码科技股份有限公司、中兴通讯股份有限公司、北京卡达克数据有限公司、四川久远银海软件股份有限公司、湖北省标准化与质量研究院、北京软件和信息服务交易所有限公司 | 归口单位 | 全国信息技术标准化技术委员会(SAC/TC 28) | 提出机构 | 全国信息技术标准化技术委员会(SAC/TC 28) | 发布机构 | 国家市场监督管理总局、国家标准化管理委员会 | 范围 | 本标准给出大数据在工业领域的参考架构,规定了各组成部分(构件)的基本功能。本标准适用于工业大数据开发、管理和应用。 |
GB/T 38666-2020: 信息技术 大数据 工业应用参考架构
GB/T 38666-2020 英文名称: Information technology -- Big data -- Industrial application reference architecture
1 范围
本标准给出大数据在工业领域的参考架构,规定了各组成部分(构件)的基本功能。
本标准适用于工业大数据开发、管理和应用。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 35295-2017 信息技术 大数据 术语
GB/T 35589-2017 信息技术 大数据 技术参考模型
3 术语和定义
GB/T 35295-2017界定的以及下列术语和定义适用于本文件。
3.1
工业大数据
大数据理论及技术在工业领域中的应用。
3.2
大数据工业应用参考架构
对工业大数据内在要求、设计结构和运行进行开放性探讨的高层概念模型。
注:一般包含系统协调者、数据提供者、应用提供者、框架提供者和数据消费者5个逻辑功能构件。
3.3
系统协调者
IBDRA中的一种逻辑功能构件,定义所需的数据应用活动并将它们整合到可运行的垂直系统中。
3.4
数据提供者
IBDRA中的一种逻辑功能构件,将新的数据或信息引入大数据系统。
3.5
应用提供者
IBDRA中的一种逻辑功能构件,执行数据生命周期操作,以满足系统协调者定义的需求以及安全
和隐私保护需求。
3.6
框架提供者
IBDRA中的一种逻辑功能构件,即一种计算框架,在此框架中执行应用转换,同时保护数据完整性
和隐私。
3.7
数据消费者
IBDRA中的一种逻辑功能构件,是使用大数据应用提供者提供的应用的末端用户或其他系统。
4 缩略语
下列缩略语适用于本文件。
BOM:物料清单
CAD:计算机辅助设计
CAE:计算机辅助工程
CAM:计算机辅助制造
CAPP:计算机辅助工艺规划
CAX:计算机辅助技术/系统
CRM:客户关系管理
DNC:分布式数控设备联网
ERP:企业资源计划
IBDRA:大数据工业应用参考架构
MES:制造执行系统
NC:数字控制
PLM:产品生命周期管理
POSIX:可移植操作系统接口
SCADA:数据采集与监视控制
SCM:供应链管理
5 参考架构
本标准在GB/T 35589-2017定义的大数据参考架构的基础上,针对工业领域应用,进一步细化了
数据提供者和数据消费者,明确了“工业”领域的应用提供者。本标准定义的IBDRA见图1。
图1 大数据工业应用参考架构
6 参考架构构件功能
6.1 系统协调者
系统协调者的主要功能是规范和集成数据应用活动,具体功能包括四个方面:
a) 配置和管理IBDRA中其他构件执行一个或多个工作负载,以确保各工作项能正常运行;
b) 为其他组件分配对应的物理或虚拟节点;
c) 对各组件的运行情况进行监控;
d) 通过动态调配资源等方式来确保各组件的服务质量水平达到所需要求。
系统协调者的功能可由管理员、软件或二者的组合以集中式或分布式的形式实现。
6.2 数据提供者
6.2.1 概述
数据提供者的主要功能是将原始数据收集起来,经过预处理提供给工业大数据应用提供者。
此构件主要包括数据源和系统两部分。数据源产生原始数据,之后通过各种信息系统的收集、分析和分类,提供给工业大数据应用提供者。
6.2.2 数据源
主要功能是提供原始数据。任何实体以及实体的活动都可能是数据源,例如,各类人员、工业软件、生产设备装备、产品、物联网、互联网、其他软件等各类实体,以及企业活动、人员行为、装备设备运行、环境检测、物联网和互联网运行等各类活动都可能产生数据。图1以示例形式列出了以下三大类数据源:
a) 产品:是工业应用数据的核心数据源。
以产品的整个生命周期过程为主线,从时间上覆盖产品市场调研、概念设计、详细设计、工艺设计、生产准备、产品试制、产品定型、产品销售、运行维护、产品报废和回收利用等过程,从空间上覆盖企业内部、供应链上的企业及最终用户,都在产生产品相关数据。这些数据影响许多与产品相关的其他数据源所产生的数据,支持不同的工业应用。
产品相关数据,其表现形式有很多,例如,产品结构和配置、零件定义及设计数据、CAD三维模型和二维图纸文件、工程分析及验证数据、制造计划及规范、CAD/CAM 编程文件、图像文件(照片、造型图、扫描图等)、产品说明书、软件产品(程序、库、函数等“零部件”)等结构化和非结构数据。具体描述形式取决于设计者设计时的考虑。
b) 工业物联设备:是工业大数据新的、增长最快的来源。
工业生产设备在物联网运行模式下,产生、收集涵盖操作和运行情况、工况状态、环境参数等数据。
工业物联设备产生的数据,其表现形式有很多,例如:设备接口、智能传感器产生收集的涵盖设备运行参数、工况状态参数、运行环境参数等评估生产设备运行状态、产品运行状态的数据。具体表现形式取决于设备的功能和使用者的需求。
c) 生产经营及外部互联网:是与工业企业生产活动和产品相关的企业外部互联网,是保障工业应
用的支撑数据源。
生产经营及外部互联网数据主要来自传统企业信息化范围,被收集存储在企业信息系统内部。
生产经营及外部互联网数据,其表现形式有很多,例如:企业信息系统累计的产品生产研发数据、试验数据、生产数据、客户信息数据、物流供应数据、环境数据;用户通过互联网发表的与企业产品相关的评论数据、第三方机构提供的用户调查数据、评价企业环境绩效的环境法规、预测产品市场的宏观社会经济数据等。具体表现形式取决于生产经营活动的需求。
6.2.3 系统
主要功能是对数据源产生的数据进行收集、分析与分类,然后提供给工业大数据应用提供者。此类系统有很多,主要包括CAD、CAM、CAE、CAPP、PLM、MES、SCADA、DNC、ERP、SCM、CRM 等。具体如下:
a) CAD用于生成产品的图形化数据,是所有产品数据的源头,包括非结构化数据(文件)和结构
化数据(从文件中提取出的产品属性、BOM结构和物料清单数据等)。产生的数据可为设计、
绘图、工程分析与文档控制等设计活动提供支持。
b) CAM一般具有数据转换和过程自动化两方面的功能。CAM 在CAD模型基础上,生成和仿
真优化数控加工用的指令代码数据。产生的NC代码可驱动机床设备运行,进行生产设备管
理、控制和操作。
c) CAE一般采用CAD系统来建立CAE的几何模型和物理模型,完成分析数据的输入,主要处
理、分析和优化复杂工程和产品的力学性能等数据。系统产生的结果数据可生成形象的图形
输出,为设计活动提供支持。
d) CAPP通过向计算机输入被加工零件的几何信息(形状、尺寸等)和工艺信息(材料、热处理、批
量等),来生成产品和零件的工艺路线、工序内容等加工工艺过程文件。
e) PLM用于收集和分类管理产品相关结构化和非结构化文件数据,并记录相关角色、环节间的
协同过程数据。
f) MES用于收集、管理和优化车间层的制造过程数据。MES在接收订单开始到制成最终产品
的全部时间范围内,采集来自产品、工业物联设备以及生产经营相关的各种数据信息和状态信
息,与上层业务计划层和底层过程控制层进行信息交互。
g) SCADA用于收集和管理自动化设备的运行参数、控制、测量及各类信号报警等数据,并向现
场连接的设备发送控制命令。
h) DNC用于收集、管理和控制数控机床设备的输入、输出数据。其中涉及的数据实体包含四类:
1) 与制造设备硬件相关的数据实体(如机床等);
2) 与人机通信相关的数据实体(如通信协议实体和串口通信实体);
3) 数控数据实体(如NC程序号、刀具号、工序号);
4) 输入操作指令或派工单实体。
i) ERP围绕企业的业务流程,用于收集和管理企业的物质资源、人力资源、财务资源等数据。
j) SCM围绕企业业务协作过程,收集和管理企业与上下游合作伙伴间的协作数据。
k) CRM用于收集和管理企业与客户间的交易和服务数据。
6.3 应用提供者
6.3.1 概述
应用提供者主要功能是围绕数据消费者需求,将来自数据提供者的数据进行处理和提取,提供给数
据消费者。
主要包括收集、预处理、分析、可视化和访问五个活动。
6.3.2 收集
负责处理与数据提供者的接口和数据引入。
由于工业数据的种类、格式很多,且开放程度差异很大,缺少统一标准,需要根据数据格式、类型,通过引用对应的工业应用或构件,完成数据的识别和导入。
6.3.3 预处理
包括数据清洗、数据归约、标准化、格式化和存储。
数据清洗和数据规约是为避免噪声或干扰项给后期分析带来困难,针对首次采集获得的多维异构
数据执行的同构化预处理。
数据标准化、格式化处理如:元数据处理和标识管理。具体如下:
a) 元数据处理包括对订单元数据、产品元数据、供应商能力等进行定义和规范;
b) 标识管理包括分配与注册、编码分发与测试管理、存储与编码规范、解析机制等。
数据存储主要采用大数据分布式云存储的技术,将预处理后的数据有效存储在性能和容量都能线
性扩展的分布式数据库中。
6.3.4 分析
基于数据科学家的需求或垂直应用的需求,利用数据建模、处理数据的算法,以及工业领域专用算
法,实现从数据中提取知识的技术。
例如,对无法基于传统建模方法建立生产优化模型的相关工序建立特征模型,基于订单、机器、工
艺、计划等生产历史数据、实时数据及相关生产优化仿真数据,采用聚类、分类、规则挖掘等数据挖掘方法及预测机制建立多类基于数据的工业过程优化特征模型。
6.3.5 可视化
对经处理、分析运算后的数据,通过合适的显示技术,如大数据可视化技术、工业2D或3D场景可
视化技术等,呈现给最终的数据消费者。
6......
|