中国铁路呼和浩特局集团公司 内蒙古呼和浩特市 010050
摘要:大数据标准体系是为实现大数据领域标准化而形成的体系。目前,面向各行各业的各类大数据存储商品和大数据应用不断涌现。要通过标准化渠道规范认知,整合资源,促进各方共识,为大数据产业健康发展奠定基础,为数据安全应用提供无障碍,同时推动大数据交易等新兴服务模式的规范发展。在铁路运输生产经营中,产生和积累了大量的旅客出行、货运物流、安全监控、工程建设等数据。这些数据的应用,对于促进国家综合交通运输体系的规划和发展,满足人民群众和行业企业日益增长的交通运输信息需求,服务国家“走出去”战略和“一带一路”倡议的实施,具有重要价值。
关键词:信息技术;大数据;铁路信息化标准;
作为现代化建设关键要点,信息化建设是保证铁路现代化建设模式落实质量的关键与核心。铁路信息化加大了对各种现代通讯技术以及信息技术的利用力度,构建起了极具中国特色的铁路信息系统,为现代经营管理以及客户营销等工作开展都带来了极大的便利,资源配置更加合理,运输能力也得到了切实提升,都为我国铁路高质量服务输出创造出了更多的有利条件。
一、铁路信息化对大数据标准的需求
1.技术和工具。技术和工具类标准主要是对大数据相关的技术、数据使用过程中的过程性工具和终端应用类工具进行标准化规范,主要包括基础设施和平台、铁路数据采集、铁路数据存储、铁路数据共享、铁路数据挖掘等方面。基础设施和平台类标准,主要是对总体规划中铁路数据服务平台及部署的软硬件要求、功能和性能要求等进行规范;铁路数据采集、存储、共享标准,主要是针对数据从收集到使用过程中的关键技术、工具等进行规范;数据挖掘类标准,主要是针对数据挖掘过程中的通用方法、工具和关键技术等进行规范。
2.数据。数据标准主要是对铁路相关数据及其质量等进行规范,主要包括铁路主数据、铁路元数据、铁路地理信息数据、铁路数据目录、铁路数据分类分级等。铁路主数据、元数据和地理信息数据是铁路数据服务平台中存储的基础数据,对这些数据进行标准规范是提升数据质量的重要支撑。这些数据的质量标准可适当参考ISO 8000数据质量系列标准,该系列标准主要是对数据质量的把控,并根据铁路大数据应用和发展的需求,进行适当增补。数据本身的模型、风险等方面,同样具有较高要求,因此要对数据目录、分类分级等进行规范。
3.应用。应用类标准从发挥数据价值的角度出发,将应用分为数据访问、开放、共享、交易及行业应用等环节,主要包括与平台数据接口、各业务领域应用等标准。数据接口标准是描述数据服务平台与各外部系统间的数据接入规范和技术文件,由于外部系统众多,因此需针对不同系统分别制定相应规范。同时,已有铁路相关系统间的接口和共享标准可作为本部分内容的参照文件。各业务领域应用类标准主要针对应用过程中的数据使用、数据分析(专业数据模型、方法)、应用分析工具、可视化工具等进行规范。
4.安全。安全类标准是针对通用的安全和大数据环境下隐私数据的保护,主要包括数据安全、隐私保护等。其中数据安全是基于信息安全技术的系列标准,为数据提供软硬件等多方面的安全保护;隐私保护则重点针对铁路数据中信息主体利益密切相关的数据进行更严格的安全保护。
5.管理。管理类标准是铁路大数据标准的重要支撑,贯穿于数据生命周期的各阶段,主要包括铁路数据运维、业务数据治理、铁路数据共享。其中数据运维包括数据库维护、运行维护、运行安全维护、大数据系统及相关工具等方面的运维及服务标准;数据治理包括数据资产管理、大数据解决方案设计、数据管理能力成熟度评价等。
二、大数据在铁路信息化中的应用措施
1.构建数据服务平台以及信息管理平台。为妥善解决异构性数据问题以及数据交换等各项问题,在进行大数据使用过程中,需要按照铁路自身情况以及大数据技术特点,展开管理平台建设,实施数据服务平台以及信息化平台管控模式,确保数据交互共享能够达到预期要求。数据服务平台建设需要以为公司提供大数据分析服务、基础数据以及共享数据为核心,应按照整体工作流程以及规划情况,对数据组成以及各模块功能等详细内容展开设置。一般数据服务平台主要包括基础数据管理、数据集成以及数据共享和大数据储存几部分内容。其中,数据集成模块,具有非结构化数据集成、结构化数据集成以及实时流数据集成等能力,主要用于数据采集;而数据共享模块,是以满足全类型数据查询以及存储等需求为主的,可对非结构化以及结构化数据展开计算与存储,且能够展开数据申请以及授权等一系列管理,能够按照不同用户具体情况完成对应数据共享策略设置,实现字段级粒度控制;大数据分析与存储模块,具备可视化服务、统计分析以及数据挖掘等功能,会通过对数据集势以及数据仓库的运用,完成统计分析功能组件构建工作;基础数据模块管理主要以元数据信息管理、主数据信息管理以及地理信息管理为主,是针对铁路主数据进行对外服务以及管理的平台。由于主数据具有低变动频率以及高共享性等特征,在进行管理过程中,平台会对数据展开集中清洗以及维护等一系列处理,可实现大规模数据汇总以及分类管控,能够有效提高数据管理关联性以及完整性,会为后续数据信息挖掘奠定良好基础。
2.加大优势技术应用力度。由于各项优势技术应用是保证大数据技术应用质量的关键,所以铁路部门还需要加大对各项优势技术的研究与运用分析,要对各项技术展开深入性学习,并按照各铁路段实际需要将其应用到其中,保证数据应用效果。以知识图谱数据建模技术为例。该项技术会通过对知识图谱的运用,利用数据之间的密切关联,展开主数据图谱分析与编制,确保数据价值能够最大化发挥出来,保证大数据技术应用水平。在进行技术应用过程中,需要展开知识获取,应通过对模糊层次分析技术的运用,对主数据展开识别,做好归属字段以及类别归属分析,按照人员机构以及固定设施等项目,对数据展开分类,并通过知识融合的方式,对数据归属部门进行划分,实现数据统一化处理,消除不必要的分歧。
3.做好客户管理与分析。由于大数据应用主要以服务为主,所以在进行平台建设以及技术应用过程中,均需要加大对客户管理以及分析工作的关注力度。应以保护数据安全以及保障客户隐私为核心,通过对大数据技术的运用,对客户群体消费特征展开分析,明确各群体客户需求特点,并制定出配套服务策略,以便为用户带来更加优质的服务。同时,因为大数据分析系统自身存在着一定安全风险,可能会对用户隐私形成威胁,所以为最大限度保护用户合法权益,需要对用户数据存储机制以及访问规则等展开严格限制,防止出现用户隐私泄露问题。
4.加强数据安全管理。由于数据泄露或其他方面安全问题,会对铁路公司形象以及正常工作开展产生直接影响,所以必须要做好数据安全管理工作。一方面,需要对数据进行加密保护,并要定期对数据进行备份,防止出现丢失问题,要通过对操作人员用户等级以及相关权限进行严格设置的方式,保证关键数据能够得到最大限度保护,进而降低数据被篡改或泄露等问题发生概率;另一方面,通过对主数据字段粒度权限展开控制的方式,有效提高数据维护安全性以及访问安全性。
总之,我国铁路大数据进入关键时期,要理清思路,把准方向,总结经验与不足,优化和推动铁路信息化发展和创新,为建设智能型铁路提供各种保障。
参考文献:
[1]郑华.大数据助推铁路创新发展的思考.2019.
[2]张雅琦.关于大数据标准在铁路信息化中的需求及应用.2021.