热门搜索 :
考研考公
您的当前位置:首页正文

运维维护管理制度

来源:伴沃教育


运维维护管理制度

彩生活研究院

系统运维培训手册

版权 归属 作 者 状 草稿 ☑ 态 发布 修订 密 内部级 本 时 2016.间 标识 09.21 文件无 公开 版 V1.0 日

修改IT系统运维流程和详细步骤 内容 彩生活研究院

期: 2016年09月21日

彩生活研究院

目 录

一、 导言 ................................................................................................................................................ 6 1.1目的 ................................................................................................................................................ 6 1.2范围 ................................................................................................................................................ 6 1.3版本信息 ........................................................................................................................................ 6 1.4系统概述 ........................................................................................................................................ 7 二、 系统运维体系框架 ........................................................................................................................ 7 2.1运维团队人员划分 ........................................................................................................................ 7 2.2岗位人员分配 .............................................................................................................................. 11 三、 基础建设管理 .............................................................................................................................. 12 3.1系统架构 ...................................................................................................................................... 12 3.2服务器资产管理 .......................................................................................................................... 12 3.3信息统计管理 .............................................................................................................................. 16 3.3.1信息资产记录 ....................................................................................................................... 16 3.3.2帐号密码管理 ....................................................................................................................... 16 四、 部署 .............................................................................................................................................. 17 4.1基本原则 ...................................................................................................................................... 17 4.1存储设备 ...................................................................................................................................... 18 4.2数据库部署 .................................................................................................................................. 19 4.3操作系统 ...................................................................................................................................... 20 4.4公司软件 ...................................................................................................................................... 20 五、 监控 .............................................................................................................................................. 21 5.1基础监控 ...................................................................................................................................... 21 5.2DOCKER监控 ................................................................................................................................ 21 5.3听云监控 ...................................................................................................................................... 21 六、 故障与排障 .................................................................................................................................. 23 6.1故障等级 ...................................................................................................................................... 23 6.2报障流程 ...................................................................................................................................... 24 6.3排障流程 ...................................................................................................................................... 25

彩生活研究院

6.3.1突发事件应急策略 ............................................................................................................... 25 6.3.2行为规范 ............................................................................................................................... 26 七、 升级 .............................................................................................................................................. 27 7.1硬件升级 ...................................................................................................................................... 27 7.1.1硬件升级规范 ....................................................................................................................... 27 7.2软件升级 ...................................................................................................................................... 28

软件采购申请规定 ........................................................................................................................ 28 软件验收........................................................................................................................................ 29 软件使用........................................................................................................................................ 29

八、 经费管理 ...................................................................................................................................... 30 8.1新增项目流程 .............................................................................................................................. 30 8.2新增人员流程 .............................................................................................................................. 30

彩生活研究院

一、导言

1.1目的

该文档的目的是描述彩生活IT系统用户使用说明,其主要内容包括:  运行环境  安装与配置  操作说明

本文档的预期的读者是:

 运营人员、测试人员、研发人员等

1.2范围

该文档定义了系统提交产品的使用说明,主要描述了产品的操作流程,以及配置说明。

1.3版本信息

下表展示【系统运维培训手册】版本更新记录 修改编号 01

修改日期 2016.09.21 修改后版本 V1.0 修改内容 基础框架说明 彩生活研究院

1.4系统概述

《系统运维培训手册》旨在服务于彩生活IT运维部门,有效管理IT系统、满足集团IT设备管控需求,提高集团IT运维智能化。

二、系统运维体系框架

2.1运维团队人员划分

岗位名称 岗位职责 拟订部门阶段工作计划, 协调部门内部工作, 实施部门员工管理与业绩考核, 提出部门员工配置与奖罚意见,指导并产品督促部门员工工作,保证正常工作进经理 度。 根据工作量合理安排部门人员分工,并进行督促指导、检查与考核。 协调运维工作中公司与业主之间的良好关系,提高服务满意度。 彩生活研究院

加强工作质量的管理力度,组织人员对负责路线进行事前控制和实时检查, 对检查中发现的问题及时采取措施。 协调处理系统运行中出现的系统、技术问题,采取有效负责处理方法,防止不良事故的发生。 定期组织部门人员进行培训、会议及学习,提高业务水平。 完成公司领导交办的其他工作任务。 1.负责服务器的搭建、维护等工作。 2.各项服务器的日常管理、维护、保养、检查及日志的监控与分析。 系统工程师 3.负责集团各项应用系统运行部署、网络设备调试、服务器管理等工作。 4.负责各类应用系统的故障分析及错误排除。 5.负责集团信息化硬件项目建设,包括需求调研、产品选型、实施、培训和技术支持工作。 网络1.负责中心机房网络设备、环境、运作工程状况的维护、保养、检查;视频、电话师 会议系统管理与维护。 彩生活研究院

2.视频监控系统管理与维护。 3.防火墙、路由器、数据交换机、光端机、UPS的状态监控,以及性能优化,配置修改,保证外网对公司官网的访问以及公司内部网络的正常;维护公司VPN线路,保证邮件等系统的正常访问;sdh专线、光连路的监控、测试、故障申报与解决。 4.公司Internet域名、二级邮件域名、DNS指向等互联网业务申请、分理和维护。 5.负责集团网络工程的规划、督导、项目实施及技术支持。 1.负责协助部门领导完成IT相关项目计划和实施。 2.负责项目实施过程中岗位培训、应用技术支持 指导、项目日常管理。 3.负责跟踪项目进度,协调各部门成员之间的合作。 4.及时向项目主管汇报项目的进展情况和实施、应用过程中出现的问题。 5.客观公正地对项目成员、操作人员的彩生活研究院

工作进行组织、监督和管理。 6.项目总结以及项目文档的编写,为项目提供有针对性的解决方案,并采取各种实际措施,推动解决方案的落实。 7.协助本地网络、相关办公设备维护及视频、电话会议开通。 8.完成部门领导安排的其他工作。 1.邮件、RTX、OA等信息化系统技术支持工作。 2.记录集团内部申报的IT故障,并转交相关责任人进行处理,对故障处理结果进行跟踪及反馈。 运维3.负责邮件、RTX、OA应用系统后台维客服 护管理工作,根据各单位需要进行办公系统的开通、撤销、组织架构调整等相关工作,并实时进行记录。 4.对邮件密保使用情况进行管理,对涉密人员进行密保绑定及特殊情况的处理,保障邮件系统安全运行。

彩生活研究院

2.2岗位人员分配

彩生活研究院

三、基础建设管理

3.1系统架构

3.2服务器资产管理

3.2.1 服务器资产定义

1.服务器资产资产主要包括员工正常应用所配备的服务器及配套软件,为服务器环境所购置的网络设备、配件,包括资产性支出固定资产部分及费用支出非固定资产部分。 3.2.2 服务器资产分类

资产类别 类别细分 终端设备 硬件类 网络设备 服务器 耗材类 配件 主机、显示器、 路由器、交换机、防火墙、HUB、机柜等 邮件、DM服务器,应用系统服务器等 硬盘、内存、网卡、显卡,主板、CPU等 说 明 主管部门 研究院 研究院 研究院 研究院 彩生活研究院

耗材 终端使用 软件类 服务器使用 综合使用 键盘、鼠标、U盘、光驱、网线、电源线、插线板等 操作系统、办公软件、辅助软件、云服务器及相应部专用软件 操作系统软件与服务器应用软件等 网络管理软件与财务应用软件等办公辅助软件 研究院 研究院 研究院 研究院

3.2.3 硬件类资产管理

IT资产硬件类属于资产性支出的固定资产部分。在IT资产硬件类管理过程中,不同阶段会出现资产的入库验收、管理、使用申请、借用、转移、报废等操作。以上所有操作都必须严格遵守相关操作规程方可执行。

1.硬件类入库验收规定

硬件类入库验收是指运维部门接收到采购申请单采购的服务器等IT硬件类资产后,办理资产入库前对相关资产进行的资产清点、外观检查等查点和核实的过程。

在资产入库验收时如发现所验货物与装箱单等不符或设备外形出现严重变形,主管部门负责人有责任将验收结果反馈给采购部门,由采购部门负责处理退货或更换等事宜。 主管部门在取得相关IT资产并验收完之后使用之前依其类别和科目予以分类粘贴资

彩生活研究院

产编号标签。

所有经过验收后入库的资产均由运维部门负责保管,如出现由于保管不利而造成的资产遗失、人为损坏等情况,运维部门将承担主要责任。

运维部门在办理完入库验收工作后,必须对所有入库资产进行登记,填写验收、使用、更换、报废登记表。

2. 硬件类资产使用申请规定

根据业务需要,在oa上填写资产申请表申请。

3.硬件类资产的借用规定

除主管部门外,任何人都无权出借硬件类资产或安排出借硬件类资产事宜。

主管部门的硬件类资产登记台帐应反映出借用部分,保证使用权和其它权限的清晰明确。

4.闲置硬件类资产的回收与发放规定 闲置类硬件资产回收后,主管部门将根据评估其性能等,并记录闲置类资产台帐中,根据以后的需求情况进行再次发放和调控,投入再使用。

彩生活研究院

5.硬件类资产报废规范

本制度规定办公IT硬件资产的报废采用两种方式,即主动报废方式和被动报废方式。 被动报废方式是指当硬件类资产受到严重损伤且简单维修无法恢复使用时,其价值明显减少的情况下应提交申请报废。此外这种报废还包括已经满折旧年限且无法维持正常工作的硬件类资产部分。被动报废方式是通常意义上的报废方式,相关报废规定如下:

1) 主管部门按照规定提交相关报废申请,由财务部安排报废,并由财务作相应的会计处理。

2) 报废的发起人为主管部门,员工无权申请报废。

3) 报废时主管部门必须填写报废申请单,同时在报废登记表中进行登记,反映已经报废的那部分资产。 4) 报废的编号不重新使用。

主动报废方式是指硬件类资产由于使用时间的增长,作为办公平台所能提供的性能、效率、可靠性和稳定等已经很难满足事务所办公的最低端业务的需要时,由主管部门根据资

彩生活研究院

产本身的性能指标分析并结合受益人的意见,提请对硬件类资产的报废。

主动报废方式是从办公效率和新业务需求等角度去主动地做适当的淘汰。主要操作规范参照被动报废方式的相关规范。

3.3信息统计管理

3.3.1信息资产记录

(一)硬件设备型号、数量、版本等信息统计记录

(二)软件产品型号、版本和补丁等信息统计记录

(三)网络结构、网络路由、网络IP地址统计记录

(四)综合布线系统结构图的绘制 (五)其它附属设备的统计记录 3.3.2帐号密码管理

(一)服务器和数据库的管理账号密码,由系统管理员和数据库管理员设定并持有,实行定期修改制度,最长有效期不超过90天。

彩生活研究院

(二)更换服务器与数据库密码时必须报行政封存,以防遗失密码。 如发现密码及口令有泄密迹象,管理员要立刻报告主管领导,严查泄露源头,同时更换密码。

(三)密码需要按照以下规则设定,即由大写字母,小写字母,数字,和字符组成;最低位数为10位;不能与以往的密码重复。

(四)建议借助密码生成器按照密码设定规则,生成密码。

四、部署

4.1基本原则

利用虚拟容器技术的“一次装载到处部署”的特性,实现统一特性的服务节点规模部署,而节点间彼此独立。

彩生活研究院

4.1存储设备

例如raid磁盘阵列,san存储系统、磁盘阵列、等存储设备。存储设备部署,主要由系统运维工程师负责。 基本步骤如下 1.现场备件安装

配合厂商(供应商)进行现场备件安装。 2.补丁服务

消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。 3.升级服务

对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。 4.问题管理系统

彩生活研究院

对遇到的问题进行汇总和发布。形成技术文档。

5.系统优化监控管理

对设备进行系统的优化监控,对存储交换机设备状态、端口状态、传输速度监控、 对监控备份服务进程、备份情况(起止时间、是否成功、出错告警)监控、

对监控记录磁盘阵列、磁带库等存储硬件故障提示和告警等监控,对存储的性能(如高速 缓存、光纤通道等)进行监控。并及时解决故障问题、

4.2数据库部署

1.数据库选型

对系统的配置及运作框架提出建议,以帮助您得到一个更坚强可靠的运作环境,降低系统潜在的风险,包括数据丢失、安全漏洞、系统崩溃、性能降低及资源紧张 2.数据库软件安装。

进行数据库环境部署,数据库空间的规划管理,设定自动备份机制等。完成部署文档。

彩生活研究院

3.检查数据库系统是否需要应用最新的补丁集 进行数据库补丁升级,完成服务器运行文档。

4.数据库系统优化

分析用户的应用类型和用户行为、监控数据库性能、评价并修改数据库的参数设置

、评价并调整数据库的数据分布、评价应用对硬件和系统的使用情况,并提出建议。 提供完整的性能调整报告和解决方法

4.3操作系统

1.操作系统选型

根据应用的运行环境,进行最优的系统选型。 2.部署操作系统,并连通网络。完成部署文档 3.检查操作系统是否需要应用最新的补丁集, 4.登记操作记录表

4.4公司软件

彩生活研究院

五、监控

5.1基础监控

从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维监控。

1. 设备基础性能检测:cpu、内存使用情况监测; 2. 设备日志查看; 3. 设备snmp状态;

4. 测试Ping,tracert等工具的连通性; 5. 网络安全策略应用是否正常; 6. Internet带宽流量的实时监测; 7. 网络拓扑链路状态监测; 8. 异常网络数据包流量;

9. Dos、ddos等网络攻击情况监测; 10. Internet线路的误码率、丢包率监测;

5.2docker监控 5.3听云监控

听云Server是服务端应用性能解决方案。通过在服务端应用中植入探针,可以对应用代码、关系型数据库、NoSQL、

彩生活研究院

外部服务、服务器进行监控,帮助用户即时获取相关性能数据并进行智能分析,在代码层面上定位错误发生、性能下降的原因。

听云运行架构图

听云监控流程

1.向研究院领导提出申请 需将应用部署上听云监测问题的专业公司,首先需向研究院领导提出申请,申请之前请准备好应用项目的相关信息,包括:应用名称、开发语言、部署的 机房名称或者服务器资产托管供应商、部署服务器、服务器相关配置、申请使用时间(期限)、应用类型

彩生活研究院

等信息,形成.txt文档上传到附件。(使用case:42645)记录

2.领导审批 研究院领导会根据专业公司提供的应用项目信息进行审核。

3.落实三部署工作 如果领导审批同意部署将进入部署工作。

4.登录应用,使用应用、产生数据。 5.测试成功产生数据后反馈给项目。

6.运维人员监看数据变化,出报告,协助解决问题。

六、故障与排障

6.1故障等级

故障级别 响应时间 故障解决时间 I级:属于紧急问题;10分钟,其具体现象为:系统崩30分钟内3小时以溃导致业务停止、数据提交故障内 丢失。 处理方案 彩生活研究院

II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。 III级:属于较严重问题;其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。 IV级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。

6.2报障流程

10分钟,30分钟内6小时以提交故障内 处理方案 10分钟,30分钟内12小时提交故障以内 处理方案 10分钟,2小时内提24小时交故障处以内 理方案 报障基本流程

彩生活研究院

6.3排障流程

6.3.1突发事件应急策略

1、值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪该事件直至其结束。对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导。

彩生活研究院

2、正常情况下,要求值班人员在10分钟内进行事件确认。如果属于一般事件则按照事件流程进行分派处理,否则应迅速启动《应急预案》,并严格按照《应急预案》所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时处理情况。

3、在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部门汇报,协调沟通,尽快联系技术工程师或厂家技术支持赶赴现场援助处理。

6.3.2行为规范

1、遵守用户的各项规章制度,严格按照用户相应的规章制度办事。

2、与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。 3、出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。

彩生活研究院

4、现场技术支持时要精神饱满,接听电话时要文明礼貌,语言清晰明了,语气和善。 5、遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。

七、升级

7.1硬件升级

7.1.1硬件升级规范

硬件类资产的改造升级可分为两种:主动升级和被动升级。

被动升级规定:

适应于涉及面和代价较小的改造升级部分

1) 当硬件类资产原有的配置经主管部门确定确实不能满足现有的需求,但仅作少量投入就可以达到需求标准时,则受益人可以申请对相关的硬件类资产进行改造升级。

2) 在进行硬件类资产改造升级过程中,增强其能力和延长其使用年限的部分

彩生活研究院

应计入该硬件类资产的价值中。对于替换式升级则应计算其差价部分,如做增加式升级则直接计算增加部分的价值。如仅做维修以维持使用效果的费用应计为一般性费用支出。 主动升级规范:

从公司服务器资产管理的整体角度出发,全面调节和配置公司服务器资产,达到改造升级和节省在投入的目的.

1) 在主动升级过程中,运维部门的职责是提出主动改造升级的可行性方案,并提交相关申请,经必要的审批和确认后执行。

7.2软件升级

软件采购申请规定

软件采购申请由运维部门需求汇总后,统一提交采购申请审批流程。

彩生活研究院

软件验收

软件到货后,由运维部门进行验收,并做好验收记录,验收完成后由主管部门做好软件库存管理登记。 软件使用

统一由运维部门人员进入安排安装,维护。

彩生活研究院

八、经费管理

8.1新增项目流程

8.2新增人员流程

彩生活研究院

因篇幅问题不能全部显示,请点此查看更多更全内容

Top