论工控生产系统的数据备份及系统灾难恢复方法

释放双眼,带上耳机,听听看~!

小心,一大波病毒来袭!!

前天(1月16日),几个不同的合作伙伴联系到我和同事,说郑州某医院网络出现大面积故障,业务停顿,怀疑被病毒攻击,希望我们能进行技术支持。 收到报告,我紧急抽调了两名工程师开车直奔客户现场。 晚上九点,到达客户现场,和客户的工程师一起分析情况,并

论工控生产系统的数据备份及系统灾难恢复方法

目   录

一、 初识工控生产系统

1. 应用架构与部署方式

2. 硬件组成

3. 操作系统

4. 应用程序

二、 工控机数据与系统保护方面的问题

1. 数据重要  VS  系统重要

2. 硬件容易损坏

3. 工控机应用程序复杂

4. 昂贵的费用

三、 对工控机的保护方案有哪些

1. 冷备机

2. Ghost方案

3. 磁盘克隆

四、 理想的工控机保护方案

1. 工控机需要备份什么

2. 在线热备份

3. 多种备份机制

4. 灾难发生后的系统快速恢复

5. 异机还原与系统迁移

五、   方案选型

一、 初识工控生产系统

工控机(Industrial Personal Computer,IPC)即工业控制计算机,与传统的办公用计算机不同,工控机采用专用的硬件设备,使用特殊的制造工艺而成。在控制现场、路桥控制收费系统、医疗仪器、环境保护监测、通讯保障、智能交通管控系统、楼宇监控安防、语音呼叫中心、排队机、POS柜台收银机、数控机床、加油机、金融信息处理、石化数据采集处理、物探、野外便携作业、环保、军工、电力、铁路、高速公路、航天、地铁、智能楼宇、户外广告等诸多领域得到广泛的应用。我们将从多个方面来认识工控机,以下将进行基础知识的介绍。

1. 应用架构与部署方式

工控机从应用架构与部署方式来分,可分为单节点工控设备、集中管控型工控系统、混合型工控系统。

单节点工控设备只负责对单个生产环节进行控制,不与其它生产设备产生必然的数据联系。例如,某机械生产机床设备配置一台工控机,并在前端配置LED按键式控制面板,生产工人通过前端LED面板的操作对生产设备进行参数的配置与调整,最后生产出预期的产品。如下图所示(本文中图片或来自网络,以达到读者对所讲述内容深入理解,仅供参考):

 

如上图所示,这类工控机主要体现为数控机床等单节点设备。

集中管控型工控系统由一个主控端和多个子生产系统组成,主控端对子端工控机达到完全控制的目的。由主控端下发指令到子端,子端严格按主控端下发的指令进行操作,操作完成后产生的数据再反馈到主控端以达成数据的收集等目标。参考以下实际生产环境和拓扑示意图:

 

如上图所示,有两条生产线。每条生产线都有一个主控端服务器对本产线的其它五个子节点进行完全控制。这类工控系统的应用非常广泛,例如生产型企业、气象采集与预报系统、银行ATM系统、交通调度系统等多节点联合工作的环境。

混合型工控系统既可以完全集中式管控,同时每个子节点又可以独立操作。

2. 硬件组成

工控系统与日常办公系统的硬件组成几乎相同,但是制造工艺不同。工控机的制造在对温度、湿度、防辐射、防粉尘、散热、防震动、防腐蚀等方面有严格的生产规格和工艺。因此,工控机的使用寿命相对于日常办公计算机会更长,更适合在恶劣的环境中运行。下列图片所列出的工控机硬件实物图,仅供参考:

     

通常工控机的硬件组成包括:

主板:工控机的主板与普通的计算机的主板从基础技术概念来看,几乎是相同的。同样为了更稳定的运行,所采用的是工业级的标准来生产制造。所以在稳定性方面有着很高的标准,同时定制化程度高。

CPU:随着技术的发展与更新,目前大多数工控机采用的CPU与传统计算机的CPU的技术参数几乎相同。但是从工作环境来讲,工控机的CPU需要更好的散热,所以大部分的工控机会将常见的CPU散热风扇改成金属散热型设备。以占用更小的空间、更好的散热性、更稳定的运行。

内存:与常见的内存没有本质的区别,但是在物理硬件的尺寸上设计更小化。

外存设备:包括常见的模式硬盘、SSD硬盘、TF卡等。

输入、输出设备:新型的输入、输出接口都采用USB接口,可连接常见的鼠标、键盘、USB存储设备、打印机等。

网络接口卡:简称网卡,用于连接至网络。目前大部分的工控机所配置的网卡还是RJ45接口的网卡,很少有配置光纤接口的网卡。工控机不需要大量的数据传输,一般只配置RJ45接口的网卡。

3. 操作系统

工控机的操作系统从产品提供商来分,分为Linux、Windows、Unix等三大类,目前主流的操作系统是Windows。从类型来分,可分为常规嵌入式两类。两种类型的操作系统均有应用。从版本来分,又分为服务器类操作系统和工作站类操作系统。大概整理如下:

好消息,新勒索病毒不用支付比特币了……

自从勒索大范围感染以来。全球范围内很多用户中招,也有一些用户尝试向黑客支付赎金,但对于国内用户而言,这又是一件非常困难的事。 很多用户不知道如何兑换比特币、如何进行交易?尤其是9月4日下午,随着央行等七部门联合发布《关于防范代币发行融资风险的

Windows XP

Windows XP Embedded

Windows 7

Windows 7 Embedded

Windows server 2003

Windows server 2008

Windows server Embedded

4. 应用程序

各类工控机的不同,所研发和采用的应用程序也不尽相同。此处对应用程序不做过多的讲述。

二、 工控机数据与系统保护方面的问题

1. 数据重要性  VS  系统重要性

从这个角度来看,系统一定会比数据(此处所讲述的数据是指由操作系统或者应用程序所产生的数据,例如日志文件、生产过程中所产生的其它历史数据等)重要。因为从数据的组成来看,数据其实对工控机的影响很小,数据的丢失可能会影响到历史数据的二次使用等问题。但是如果操作系统或者应用程序出现问题导致生产受到影响,问题就非常严重了。试想,一个生产节点或者一条生产线,因为工控机的宕机而导致不能继续生产,那就会影响到整体公司或者项目的运营。例如生产型企业不能继续生产产品、银行ATM不能继续提供现金交易、监控系统不能及时获取影像资料、气象监控系统不能及时获取气象数据等。

2. 硬件容易损坏

工控机的运行环境往往相对恶劣,对于硬件的损耗很严重。特别是对于外置存储设备,例如磁盘、FT卡等。如果这类存储设备损坏,将直接影响生产生活。例如磁盘损坏,生产系统宕机。需要产线维护工程师重新置换新的磁盘后,再部署操作系统、安装应用程序、配置应用程序等一系列复杂的操作。整个RTO周期非常长,严重影响生产生活。

3. 工控机应用程序复杂

工控机所携带的应用程序往往由工控机的产品提供商提供,应用程序不常见,切极为复杂。一旦出现由软、硬件问题所引起的宕机出现后,用户方并不熟悉应用程序的再次部署。这将会导致生产中断。

4. 昂贵的费用

首先是工控机,这类设备往往价格昂贵。用户大都不会置备一台冷备机作为灾难接管的策略。其次是产品提供方的上门服务费用,如果需要原厂技术人员上门提供技术支持服务,需要与厂商协调时间、协调人员等一系列流程,这一定对生产生活有严重的滞后,而且用户需要更多的时间成本和金钱成本。例如,需要某些产品提供商提供上门服务时,厂商的工程师从出家门的那一时刻起就会收取售后费用了。

三、 对工控机的保护方案有哪些

1. 冷备机

冷备机是最有效的解决方案之一,能够在线上工控机宕机后,快速更换后达到生产中断最小化的目标。但是此方案也有不足:

首先是代价高,用户需要单独购买冷备机,这对于用户来说可能是一笔不小的投资。

其次是灵活性差,冷备机的应用程序的配置可能与宕机的工控机参数不匹配。需要时间来调整工控机的工作参数以达到与生产相匹配。另外还有存在风险,例如参数配置错误导致生产的产品不合格。

2. Ghost方案

此方案在很多用户中得到应用,但是这种方案有先天的不足。

Ghost方案有产品的兼容列表,超出列表的操作系统是不支持的。换句话,不兼容的操作系统就没办法去做保护。

Ghost需要关机制作镜像,在制作操作系统镜像时,需要将目标工控机关机后操作,这会影响到生产。

Ghost在异构硬件平台,无法恢复镜像。

3. 磁盘克隆

所谓磁盘克隆就是将现工控机的磁盘使用工具软件克隆到另一个磁盘上,当出现磁盘损坏时快速更换磁盘以达到将RTO时间尽量缩短的目标。

磁盘克隆虽然可减小RTO值,但是需要对源工控机关机才可以进行克隆,同样会影响生产。

同样,磁盘克隆技术不能异构环境中使用。例如将现在磁盘在其它硬件平台上使用。

四、 理想的工控机保护方案

1. 工控机需要备份什么

关于这个话题,理想的解决方案是所有的数据尽在备份中。如果一定要区分,那么一定是可用的系统优于实体数据。就像我们前面提到的,可用的系统才是工控机最重要的。

所以,在对工控机的备份方案中,要将整个磁盘都置于备份计划中。所谓整个磁盘,除我们日常所见的类似C盘、D盘等卷外,还应该包含系统的MBR。所以磁盘镜像技术是最适合工控机的备份方案。以下所有话题均在使用磁盘镜像备份的基础上进行。

2. 在线热备份

为了保障生产不中断,所提供的备份方案应该使用在线备份方式,既不停机在线备份。这种备份方式最大化的降低工控机的停机时间,不影响现在生产任务。

3. 多种备份机制

可提供热备份、冷备份两种备份机制,在不可预期的环境中,可备份所有的兼容或不兼容的所有业务系统。包含Windows、Linux、Unix等。

4. 灾难发生后的系统快速恢复

当系统出现宕机事件后,需要快速的恢复系统到可工作状态,无论是操作系统、应用程序、或者是硬件所引起的宕机。

操作系统或者应用程序引起的宕机时,快速使用可引导媒体进入工控机,然后将已存在的备份存档恢复至当前工控机。这样的恢复可将业务连续性保持最高状态,有效降低RTO时间。

由硬件引发的宕机,分两种情况。一种情况是非存储设备,例如内存、主板等硬件损坏。这种情况下只需要更换新的硬件既可,但这需要用户的足够可用的备件。另一种情况是存储设备损坏,例如磁盘损坏。此类情况只需要更换新的磁盘后,使用可引导媒体将原备份存档恢复至新的磁盘。

5. 异机还原与系统迁移

工控机的软、硬件也是有生命周期的,在生命周期结束后有能力将现有工控机的系统整体迁移至新的硬件平台。降低迁移的时间、资金成本。同时,对于损坏的工控机,有能力将现有系统通过异机还原能力,迁移至新的硬件平台,保障业务连续性最大化,RTO参数最小化。

五、方案选型

        (此处删除XXXX字)。有兴趣的与我联系吧。

(注:感谢作者武永民授权本公众号发布)

感谢关注:大兵说安全

本文源自微信公众号:大兵说安全

号称完美破解GandCrab勒索病毒的某厂商,你真的不会脸红吗?

首先,我声明一下为什么要写这篇文章,有两个原因,一是有同学问我:你不是说勒索病毒基本上无解吗?为什么这次这么快就公布出来密钥了呢?二是我今天看到某数字公司公众号发的一篇文章《席卷全球的勒索病毒GandCrab,已被XXX安全大脑完美攻克解密!》,顿时

人已赞赏
安全工具

走近卡巴斯基(八)

2019-10-14 17:33:32

安全工具

小心,一大波病毒来袭!!

2019-10-14 17:33:38

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索