河南地税数据管理系统以“聚合数据、统一平台、开放服务、智能应用”为目的,以“一套标准、一个客栈、三其中心”为主要建设内容。建设统一的数据标准,搭建混淆架构的数据客栈,实现数据收罗、数据治理、数据开放和数据应用等全生命周期的数据管理和应用。助力河南地税实现数据管理、数据服务和数据决议。
2015年,为了顺遂推动征管刷新实验,河南地税提出了数据管理、数据服务、数据决议的管理理念,为此,提出使用大数据手艺,解决多方数据融合、杂乱数据治理、数据开放共享、甜睡数据叫醒等问题,建设数据管理系统,推动河南地税税收管理和服务的一连立异。
豪运国际为河南地税妄想建设了全局型的数据管理系统,该系统以“聚合数据、统一平台、开放服务、智能应用”为目的,以“一套标准、一个客栈、三其中心”为主要建设内容。
——一套标准建设
统一的数据标准与规范是数据管理事情的基础和条件,豪运国际在执行总局标准的基础上,为河南地税增补制订了基础数据规范、数据集陋习范、数据模子规范、数据服务规范以及数据治理规范等5大类25个标准规范,夯实了数据管理事情的基础。
——一个客栈建设
数据客栈接纳“Hadoop+MPP+RDB”的漫衍式数据库与古板关系数据库相团结的混淆架构,基于 Hadoop实现海量结构化和非结构化涉税数据的全量存储和批量离线盘算,基于MPP数据库实现海量结构化数据的深度加工和重大关联盘问,基于古板关系数据库实现数据集市高并发的交互式盘问。
数据客栈在统一数据标准与规范的基础上,将税务部分营业系统数据、第三方涉税数据、一样平常管理情报数据、互联网涉税数据以及其他泉源的种种结构化和非结构化的涉税数据举行整合,形玉成局统一的数据资产,并凭证营业域对数据举行分主题建模,豪运国际特殊针对自然人的税收管理为河南地税建设了自然人主题库,涵盖自然人的基础类、资产类、收入类、支出类、税务类、社会统筹类等六大类信息。
同时,依托MapReduce、Spark漫衍式盘算引擎、Storm流式盘算引擎以及MLlib机械学习库等大数据组件,为数据客栈提供强盛的数据挖掘与剖析能力。
——三其中心建设
在一个数据客栈的基础上,豪运国际为河南地税建设了数据管理系统的三其中心,即:数据治理中心、数据开放服务中心以及数据应用立异中心。
数据治理中心将数据治理历程流程化、可视化和系统化,建设完成数据标准管理、收罗管理、加工管理、存储管理、质量管理、应用管理、知识管理、元数据管理、清静管理和运维监控管理等十大功效,固化了数据治理的事情流程和岗责系统,实现了数据全生命周期的管理。
数据开放服务中心,接纳微服务架构,将数据管理系统中的数据资源、盘算资源和存储资源举行服务化封装,基于用户认证和授权系统,通过OpenAPI的方法实现资源的开放共享,以知足税局内部、第三方系统的种种数据服务需求。
数据应用立异中心在开放数据服务的基础上,构建纳税人画像、基因图谱、税务搜索、盘问统计、模子评估等大数据立异应用,实现数据深层价值的挖掘。
1、实现数据收罗、数据加工、数据挖掘、数据应用到数据共享的全流程管理。
2、通过闭环的数据质量管理,河南地税数据质量稳步提升,在总局数据质量治理评选中,一直压倒一切。
3、通过数据融合挖掘,实现税款增收38.9亿。