第一篇:系统运维管理-资产管理规范
系统运维管理资产管理规范 版本历史 编制人: 审批人: 目录
目录..........................................................................................................2 一、要求内容............................................................................................3 二、实施建议............................................................................................3 三、常见问题............................................................................................3 四、实施难点............................................................................................3 五、测评方法............................................................................................4 六、参考资料............................................................................................5 一、要求内容
a)应编制并保存与信息系统相关的资产清单,包括资产责任部门、重要程度和所处位置等内容;
b)应建立资产安全管理制度,规定信息系统资产管理的责任人员或责任部门,并规范资产管理和使用的行为;
c)应根据资产的重要程度对资产进行标识管理,根据资产的价值选择相应的管理措施;
d)应对信息分类与标识方法作出规定,并对信息的使用、传输和存储等进行规范化管理。
二、实施建议
编制各部门的信息资产清单可以了解各部门信息资产的管理情况,同时也是信息资产风险评估的基础,资产清单记录的内容越详细对资产的管理越有帮助;对于信息资产的管理同样需要建立管理制度,内容应包括资产的分类、分级、标识、使用、保管等内容。
三、常见问题
多数企业没有信息资产的清单,没有单独针对信息资产管理的要求。
四、实施难点
在信息资产管理初期需要对员工进行适当的培训使之了解哪些资产属于信
息资产,对信息资产的安全管理有哪些好处。 五、测评方法
形式访谈,检查。对象安全主管,资产管理员,信息资产清单,信息分类分级文档,资产安全管理制度。
实施
a)应访谈安全主管,询问是否指定信息资产管理的责任人员或部门,由何部门/何人负责;
b)应访谈资产管理员,询问是否根据信息资产清单定期对资产进行一致性清查,并对信息资产清单进行维护更新;是否对信息资产进行分类、分级和标识管理,不同类别、不同安全级别的信息资产是否采取不同的管理措施;
c)应访谈资产管理员,询问对信息的操作(包括信息使用、存储和传输等方面)是否要求进行标识;
d)应访谈系统运维负责人,询问目前信息系统是否由机构自身负责运行维护,如果是,系统运行所产生的文档如何进行管理(责任书、授权书、许可证、各类策略文档、事故报告处理文档、安全配置文档、系统各类日志等),是否由专人管理;
e)应检查信息资产清单,查看其内容是否覆盖资产责任人、所属级别、所处位置和所属部门等方面,清单内容是否因资产所属发生变化或资产增减而进行过改变;
f)应检查资产安全管理制度,查看其内容是否覆盖了资产使用、借用、维护等方面;
g)应检查信息分类分级文档,查看其是否规定了分类标识的原则和方法(如
根据数据的重要程度、敏感程度或用途不同进行分类分级),是否根据分类分级文档所描述的信息的安全级别规定不同信息的使用、传输、存储等方面内容。
六、参考资料
《信息安全等级保护信息系统安全管理要求》中对资产清单管理的要求: 资产清单管理对资产清单的管理,不同安全等级应有选择地满足以下要求的一项:
a)一般资产清单:应编制并维护与信息系统相关的资产清单,至少包括以下内容:
——信息资产:数据库和数据文档、系统文件、用户手册、培训资料、操作和支持程序、持续性计划、备用系统安排、存档信息;
——软件资产:应用软件、系统软件、开发工具和实用程序; ——有形资产:计算机设备(处理器、监视器、膝上形电脑、调制解调器),通信设备(路由器、数字程控交换机、传真机、应答机),磁媒体(磁带和软盘),其他技术装备(电源,空调设备),家具和机房;
——相关资产:由信息系统控制的或与信息系统密切相关的各类资产。由于信息系统或信息的泄露或破坏,这些资产会受到相应的损坏。
——服务:计算和通信服务,通用设备如供暖、照明、供电和空调等。b)详细的资产清单:在a)的基础上,应清晰识别每项资产的拥有权、责任人、安全分类以及资产所在的位置等。
c)业务应用系统清单:在b)的基础上,作为信息系统组成部分的业务应用系统的资产应在资产清单中体现。应清晰识别业务应用系统资产的拥有权、责任人、安全分类以及资产所在的位置等。
资产分类与标识的要求对资产的分类与标识,不同安全等级应有选择地满足以下要求的一项:
a)资产重要性标识:应根据资产的重要程度对资产进行标识,以便可以基于资产的价值选择保护措施和进行资产管理等相关工作。
b)资产分类管理:在a)的基础上,应对信息资产进行分类管理,对信息系统内分属不同业务范围的各类信息,按其对安全性的不同要求分类加以标识。对于信息资产,通常信息系统数据可以分为系统数据和用户数据两类,其重要性一般与其所在的系统或子系统的安全保
护等级相关;用户数据的重要性还应考虑自身保密性分类,如:
——国家秘密信息:秘密、机密、绝密信息;
——其他秘密信息:受国家法律保护的商业秘密和个人隐私信息; ——专有信息:国家或组织机构内部共享、内部受限、内部专控信息,以及公民个人专有信息;
——公开信息:国家公开共享的信息、组织机构公开共享的信息、公民个人可公开共享的信息。组织机构应根据业务应用的具体情况进行分类分级和标识,纳入规范化管理;不同安全等级的信息应当本着“知所必需、用所必需、共享必需、公开必需、互联通信必需”的策略进行访问控制和信息交换管理。
c)资产体系架构:在b)的基础上,以业务应用为主线,用体系架构的方法描述信息资产;资产体系架构不是简单的资产清单,而是通过对各个资产之间有机的联系和关系的结构性描述。 第二篇:系统运维管理-IT基础设施运维管理规范
IT 基础设施运维管理规范 文件编号:运维-002-V1.0 目录
运维管理规范--------------4 1.目的------------------------4 2.适用范围------------------4 3.规范性引用及参考-----4 4.本文术语,定义和缩略语---------------------------5 5.基本要求------------------6
5.1运维管理原则-----6 5.2制度和流程管理6 5.5供应商管理--------7 5.6督促检查-----------7 6.运行维护------------------8
6.1日常操作及监控分析--------------------------8 6.2 数据与介质管理-8 6.3机房管理-----------9 6.4 网络管理----------9 6.5 弱电管理---------10 6.6桌面维护----------10 6.7服务器及系统变更----------------------------11
6.8 配置管理---------12 6.9 事件与问题管理 12 7.应急管理-----------------12
7.1应急准备----------12 7.2应急处置----------13 运维管理规范 1.目的
为规范公司运维工作,使相关工作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修工作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在一起,根据公司管理要求及计算机应用的需要,由运维部制定。
2.适用范围
本规范规定了运维管理工作的要求。
本规范适用于维信理财集团(中国)总部,包括全国各分部及门店。 3.规范性引用及参考
◆ IT 服务管理国际标准ISO/IEC 20000 ◆ 企业获得ISO/IEC 20000认证的权威指南 ◆ 全球著名IT 服务管理书库(ITSM Library)◆ IT 服务质量管理原则
◆ 理解ISO/IEC 20000在IT 服务中的地位 ◆ ISO/IEC 20000规范和实践准则 ◆ IT 服务管理国际标准ISO/IEC 20000 ◆ GB/T 20269—2006 信息安全技术 信息系统安全管理要求
◆ ISO 31000:2009 风险管理 原则和指南(Risk management--Principles and guidelines)
◆ JR-T 0060—2010 金融信息系统安全等级保护基本要求 ◆ JR/T 0074-2012 金融IT 服务管理基本规范 ◆ 中国金融标准化报告(2011)
4.本文术语,定义和缩略语
1、IT: Information Technology 信息技术 2、DNS: Domain Name Service 域名服务
3、DHCP: Dynamic Host Configuration Protocol 动态主机配置协议
4、VPN: Virtual Private Network 虚拟专用网 5、OA: Office Automation 办公自动化系统
6、ISO: International Organization for Standardization 国际标准化组织 编订日期:30.7.2014 批准日期: 生效日期:
7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运行造成潜在威胁。
8、异常: IT设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。
9、资料: IT设备或系统的运行记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。
10、运行维护:本规范中的运行维护包括IT 基础设施维护、IT 应用系统运维维护、安全管理、网络接入、内容信息以及综合管理等。
5.基本要求 5.1运维管理原则
公司按集中与分散相结合的原则,设立机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的方式实施建立。
计算机系统建设应综合考虑成本、费用、效率、效果、先进性及适用性,选择最优技术、经济方案。
5.2制度和流程管理
运维管理制度应包括但不限于机房管理、网络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、文档管理、设备和软件管理、供应商管理等制度。
运维操作流程应包括但不限于日常操作、事件处理、问题处理、系统变更、应急处置等流程。
5.3 文档管理
对运维过程中涉及的各类文档进行管理,可按照制度文档、技术文档、合同文档、审批记录、日志记录等进行分类,并妥善保存。5.3.2 对文档的版本应当进行控制。
文档在使用时应能读取、使用较新版本,防止作废文件的逾期使用。
5.4设备和软件管理
建立计算机相关设备和软件管理制度,对设备和软件的使用、安装、维修(升级)等进行规范。明确设备和软件管理责任人。对设备进行标识,标识应放在设备明显位置。
规定设备和软件的使用年限,定期进行盘点,并对设备状态进行
评估和更新。
对外送设备的维修进行严格管理,防止数据泄露。
对拟下线和拟报废设备的存储介质中的全部信息进行清除或销毁。对正式下线设备和软件交指定部门统一管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现行资产管理规定。
5.5供应商管理
对供应商支持运维服务的相关活动进行统一管理。
在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。
应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、人员工作情况等内容进行评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:
a)明确外包公司应当承担的责任及追究方式;
b)明确界定外包人员的工作职责、活动范围、操作权限; c)对外包人员工作情况进行监督和检查,并留存相应记录; d)对驻场外包人员的入场和离场进行管理; e)定期评估外包的服务质量; f)制定外包服务意外终止的应急措施。
5.6督促检查
定期检查审计,对运维制度的执行情况和运维工作开展情况定期进行检查和审计,以督促运维工作持续改进。
指定人员负责对日常操作执行情况进行检查,确保运维管理制度和操作流程的有效执行。对检查和审计结果采取纠正、预防措施。
6.运行维护
6.1日常操作及监控分析
未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。
电脑发生故障时,使用者作简易处理仍不能排除的,应立即报告IT,非专业管理人员不得擅自拆开机箱或调换设备配件。
计算机及其相关设备的报废需经过IT 部门或专职人员鉴定,确认不符合使用要求后方可申请报废。
运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。
主要监控指标具体如下:
a)机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;
b)网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络
延时、丢包率等;
c)主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;
d)存储:设备运行状态、数据交换延时、存储电池状态等; e)安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;
6.2 数据与介质管理
配合数据应用部,对核心业务数据进行周备份,并每季度进行恢复性测试。
对设备和人员出入进行管理。进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。
6.3机房管理
对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。
应指定机房管理负责人。确保机房环境整洁和安全,包括: a)应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;
b)应保持机房环境卫生,设备摆放合理,归类; c)不得随意出入机房。
d)未经审批不得接入其它用电设备。 6.4 网络管理
确保网络、系统的正常运行。网络管理应包括: a)绘制网络拓扑图,并保持更新;
b)应保持网络设备的可用性,及时维修、更换故障设备; c)应负责网络系统的参数配置、调优; d)应定期对系统容量进行检查和评估;
e)应定期检查网络设备的用户、口令及权限设置的正确性; f)应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; g)应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计
算机网络跳线应整齐干净,跳线标识清晰;
h)应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。
权限管理应包括如下要求:
a)权限分配应履行审批手续,权限设置后应复核; b)应按照最小安全访问原则分配用户权限; c)应在用户账户变化时,同时变更或撤销其权限; d)应定期检查权限设置的有效性。
6.5 弱电管理
严格按图纸施工,在保证系统功能质量的前提下,提高工艺标准要求,确保施工质量。质量检查制度,现场管理人员将定期进行质量检查并贯穿到整个施工过程中。统运行验收:当设备安装完毕并调试运行无误后,由公司派现场调试人员进行系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。
6.6桌面维护 日常数据注意事项:
a.个人文件(Excel、Word、PDF 等)建议员工不要存放在系统盘(通常为C 盘),可以存放在其它盘符。
b.工程师可通过多种方式或途径来告知员工如何进行日常文件的备份,如:口述、邮件、培训等。
c.未经许可,禁止使用U 盘,移动硬盘,手机或其它外设,如:
网盘、邮箱等,盗取公司内部文件。
重装系统前注意事项:
a.询问用户有哪些相关数据需要备份,如桌面、我的文档、收藏夹、邮件等。b.用户Email 的备份:如客户端为Outlook 则导出相关OST 或PST 文件;硬件损坏需更换或维修时,运维人员进行测试,明确是否真实异常,不可随意更换。
关于账号、权限、密码
a.必须严格按照公司制定的IT 策略进行管理,不可私自制定规范。b.禁止私自把个人管理员权限借给他人或告知他人。
c.禁止为他人开设规定以外的权限,如:本地管理员、其他部门目录访问权限、上网权限、电话权限等。
d.更改任何类型用户权限时需得到相关审批层级确认才可执行。e.如电脑无特殊应用需求,则一律为“user”普通权限。
f.人员离职时,总部和分部应及时通过OA 确认,删除离职人员的相关账号与信息。
g.妥善保管自己所知的密码。 6.7服务器及系统变更
不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。
使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。
管理员对管理员账户与口令严格保密、重要数据库,网站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。
任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人
员不得擅自操作机房内设备。
严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。除管理员外,任何人不得随意改动服务器内系统及环境配置。
除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。
6.8 配置管理
明确配置管理负责人。
建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。
定期对配置进行备份及文档库归类。
及时检查并定期审计,对发现的不一致情况及时纠正修改。 6.9 事件与问题管理
对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。
对所有事件响应、处理、结束等过程进行跟踪、监督及检查。对问题进行分析、提出解决方案,通过变更管理审批后部署实施。
7.应急管理 7.1应急准备
明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。
网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密
切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。
应急准备应符合如下要求:
a)系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;
b)在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包
括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;
c)应建立有效的应急通讯联络系统,确保信息畅通; 7.2应急处置
在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。
暂时无法确定事件原因、责任和结论的,应先给出事件的初步分析判断,并组织力量尽快查找原因,给出解决方法,采取整改措施。 第三篇:运维管理系统建设
ITIL提升中国电信运维管理系统建设
ZDNet CIO频道 更新时间:2008-01-25 作者: 来源:CSDN 本文关键词: 中国电信 ITIL 运维管理
运维管理是电信运营商主要的生产和管理活动之一。运维管理系统建设和运营的好坏直接影响到电信运营的整体成本、管理水平和服务水平。因此,近两年来,各大电信运营商纷纷对现有的运维系统进行改造。
中国在电信领域的增长速度超过了其GDP增长的速度。正是电信快速的增长,推动了运维系统的发展。如何更有效地利用现有的资源,提高运营维护的工作效率,提高整体服务质量是目前各大运营商面临的普遍问题。毫无疑问,中国电信在运营维护方面,也面临相同的问题。建设新一代中国电信运维管理系统,成为解决目前运维管理问题的唯一方案。
根据我们长期在电信领域的实践,下面的几点经验,值得我们在中国电信运维系统的建设中更加关注。
一、采用ITIL作为运维系统的方法论
IT基础架构库(ITIL-ITInfrastructureLibrary),被誉为IT服务管理的圣经,其中包含了总结国际大公司在IT服务管理中的经验并得到证明的IT服务计划和运营的最佳实践框架。
ITIL已经为《财富》500强的一些企业所采用,并取得了预期的效
果。加特纳(Gartner)和国际数据集团(IDC)等世界权威研究机构的调查研究表明,企业通过在IT部门实施最佳服务管理实践,将因重复呼叫、不当的变更等引起的延误时间减少了79%,每年每个终端用户平均节约800美元的成本,同时每项新服务推出的时间也缩短一半。
要成为国际一流的企业,就要吸取国际一流企业的成功管理经验,借鉴其管理手段。因此,中国电信在运维管理系统的建设,也应确立ITIL在系统建设过程中的方法论地位,吸取ITIL中的成功经验。
作为众多国际大型企业成功实践的积累,ITIL使我们找到了解决运维流程规范的方式和方法。可是,如何更好地运用ITIL这一经典的方法论呢?我们认为应该注意两点:
1)ITIL是从实践中得来的精髓,不是僵化的教条,应该结合实际情况去运用ITIL,建立更加适合中国电信的流程规范,而不是照抄照搬。
2)由于ITIL理论博大精深,不可能在短期内在企业中全面实施。应该根据实际情况,选取实施重点,逐步实施,逐步完善。
在中国电信运维系统建设中,应该深入理解ITIL的核心理念,结合电信运维的现状,解决核心和关键问题,逐步实现对运维的科学管理。
二、ITIL理论与实际情况相结合,注重工作流程细节的设计和优化,是系统建设的关键
理顺工作流程、提高服务效率是新运维系统建设的主要内容之一。 在工作流程的制定过程中,容易陷入以下两个极端。
1.盲目照搬流程。作为方法论的ITIL,本身含有大量的成功实践框架。但是,正如前面所说的,ITIL是从实践中得来的精髓,不是僵化的教条,盲目照搬,只能使得工作流程不切合实际,并流于形式,对系统的贯彻和执行产生不好的影响。
2.完全遵照现有流程,实现其电子化。虽然这样更符合目前的工作习惯,可能容易为运维人员所接受,但是,仍然解决不了目前运维所存在的一些问题。例如,我们在项目实施中曾遇到“工单在部门之间的重派”的问题。在当前手工作业的工作模式中,各单位将不属于本单位处理范围的工单,或部门需要其他部门配合的工单,均提交给
故障处理的负责人,由该负责人向其他单位进行转派和重派。这种处理方式,主要便于手工作业条件下负责人及时了解项目处理状况。在建立运维系统后,负责人可以通过运维系统随时了解到故障的处理状况,每次重派和转派之前,对负责人的回复变成了一种无效的工作,大大降低了事件的处理效率。如果仅仅将目前的手工作业电子化,那么故障处理的效率仍然没有得到有效的提高。
因此,将ITIL理论与实际情况相结合,注重工作流程细节的设计和优化,是系统建设的关键。
三、树立主动服务观念
在现行的运维工作中,我们经常遇到这样的情况:一方面是运维部门疲于应付各种突发事件,加班加点处理各种重复事件,工作繁重,身心疲惫;一方面是客户代表不断抱怨和投诉“技术人员服务水平太低”。二者不可调和的矛盾,是新运维系统要解决的重要问题。
传统的运维方式给人的印象是:故障发生前,维护人员似乎无所事事;故障发生后,则是手忙脚乱。这就是被动服务给人们留下的印象,运维人员是在被动地等待故障的发生。在新的运维系统中,我们必须改变原有的运维方式,变被动服务为主动服务。
在主动服务模式下,运维人员主动地监控系统的变化,对日常工作及故障处理完成后主动进行问题分析,对系统的变更风险进行评估。在新系统中,可以通过种种技术措施,使得运维工作从被动服务转移到主动服务,如:增加变更管理流程以防范变更风险。
在日常运维工作中,变更工作是在所难免的。例如,新的系统安全漏洞被公布,为了保证系统安全,就需要安全系统补丁,而这种变更给系统带来的风险则是难以估计的。例如在安装补丁后,有时会产生大量莫名其妙的问题。这么一个简单的例子已经可以说明,如果没有很好的风险防范手段,系统变更将给我们的日常运维工作带来大量的问题,后果往往是难以想象的。在新系统中,我们可增加变更管理流程。在变更管理流程中,变更方案需提交变更经理,由变更经理组织由专家组成的变更顾问委员会(CAB)对变更进行风险评估,在评估通过后才能够进入变更的实施过程。变更管理是防范变更风险的最
好办法。
当然,主动服务是一种理念,在这种理念下,我们可以定义更多的流程,如问题管理流程,对系统中存在的隐患问题进行挖掘,防患于未然。总之,我们应该树立这样一个理念,在各流程的定义中进行运用,主动地提早发现系统存在的风险和隐患,减少突发事件的发生。
四、从平台到业务的全面管理
网络管理是运维系统的组成部分。对系统的监控也是运维的主要业务之一。以往网管系统实现了对平台的监控,可是在实际运维工作中,平台往往只有少数的几个系统管理员负责,大多数业务人员更多地是面对业务系统。对于业务的监控和管理,是业务人员更加关心的问题。因此,在网管系统中,应加入业务监控的内容。
需要注意的是,业务是建立在平台的基础之上的,而不是孤立存在的。因此,监控中,应强调业务监控与平台监控密不可分的联系,从业务的角度出发,建立平台与业务的关联关系。在故障发生时,应能够即时描述对业务的影响程度,能够描述故障的影响范围。
例如:采集源的某台交换机产生异常,除了可以看到交换机告警外,我们还应该能够在业务拓扑图中直观看到,采集系统受到影响,同时采集、预处理、分拣等相关业务也不同程度受到影响。其影响程度,能够通过不同的颜色直观地展示出来。
只有这样才能够更加直观而全面地反映系统的运行状态,反映业务的运行情况。能够帮助运维人员在故障发生时,快速修复关键部件,减少故障带来的损失。
五、建立科学的激励与监督机制
多年来,系统的使用和推广问题成为系统能否得到良好运用的一个重要问题。
假设:我们制定了变更管理流程,但是,变更管理没有被很好地执行,而只是流于形式,则风险的防范也只能是停留在理论上的空谈。
在运维系统建设过程中,建立了一整套科学的考核制度,以激励运维人员更有效地提高服务质量和服务水平,是至关重要的。
对运维人员的考核,并不能就管理论管理,应该从客户服务的角
度出发,以客户满意为前提,进行考核。例如,根据每个部门的服务水平,制定了服务时限。假设,某个用户投诉,需要多个部门协同进行处理。在处理过程中,各部门互相推托,虽然工单在各部门的停留时间没有超过部门承诺的时限,而整体处理时间已经超过了运营商对该用户承诺的处理时间。为了杜绝这种现象的出现,我们应该从用户的角度出发,进行各部门处理时间的分段计算。计算结果将反映在每月故障处理情况的统计报告中,而这些报告直接与各部门、各单位的绩效考核挂钩。
通过这样的考核机制,形成对员工日常工作的科学评价,既调动了员工积极性,又提高了工作效率和服务质量。 第四篇:运维管理系统方案
运维管理系统方案 概述
伴随着企事业网络规模的不断扩大,企事业服务器的增多,企事业管理的信息化,企事业网络管理也变的越来越重要。一旦网络、服务器、数据库、各种应用出现问题,常常会给企事业造成很大的损失。怎样能7x24小时检测网络系统的运行情况,避免各种故障的发生,改进传统的网络管理方式来适企事业信息化发展的需要?
因此,运维管理系统就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、服务器、数据库、各种应用系统,及时发现将要出现的问题,并通过短信、Email、声音报告给运维管理人员。运维管理人员就可以及时排除故障,避免造成重大损失。
运维管理系统的功能: 故障发现与警报;
记录日常运维日志信息; 服务器故障统计; 服务器软硬件信息统计; 服务进程管理;
将数据信息存储到数据库,并使用图形方式直观的展示出来; 权限、密码管理; 将数据生成报表。运维管理系统的特点: 邮件和短信实时故障报警;
B/S结构,能够通过web对远程服务器下达指令;
监控服务器和被监控服务器之间通过python socket来发送信息; 统计日常故障处理,以便下次出现同样故障时能够更快的解决问题; 实现自动化管理和自动化监控; 安全管理服务器性能; 操作流程统计与管理。
第五篇:运维技术研发管理规范
目 录 第一章
总则..........................................................................1 第二章 技术研发经费管理..............................................................1 第三章 技术研发环境管理..............................................................2 第四章 技术研发团队管理..............................................................3 第五章 技术研发人员的绩效管理........................................................4 第六章 技术研发规划管理..............................................................4I A0 GSB/T 316.22
技术研发管理规范 第一章 总则
第一条 为规范运维技术和工具的预研和开发管理,有效提升公司运维服务能力,不断改进服务过程,为客户提供稳定、安全、高效运行的运维产品和工具,特制定本规范。
第二条 本规范适用于在研发中心立项自研的运维系统项目和运维产品的设计和开发管理。第三方的运维系统项目和运维产品的集成技术管理,由事业部负责。
第三条 本规范由研发中心负责解释和修订。 第二章
技术研发经费管理
第四条 技术研发经费管理原则
技术研发实行重视研发成本、促进研发进度、关注研发效益的经费管理原则,由集团财务部统一归口管理。
第五条 技术研发经费管理职责
集团财务部负责建立研发经费管理制度,根据研发计划和费用预算,提前准备资金确保研发资金需求,同时有效监督研发经费的合理使用。研发中心负责按照研发计划制定并执行各项开发项目的研发预算,有效利用研发经费。
第六条 技术研发预算管理
6.1为规范集团的经营预算管理流程,提高预算管理的科学性,保证集团经营目标的实现,根据《公司法》等国家相关法律法规,结合《公司章程》,公司财务部制定了《经营预算管理制度》。
6.2研发体系作为集团预算单位之一,对技术研发预算目标的实现承担经济责任,并享有相应的资源使用权,通过预算编制管理、预算执行管理和预算调整管理三个方面实施预算管理,其主要内容包括:编制和上报研发的经营预算草案,提供预算编制的各项基础资料;严格执行下达的正式经营预算方案,在预算范围内开展经营活动;分解和落实研发预算指标,监督和保证研发预算得到执行;分析和报告研发预算执行情况;当发生特定情形时,提出经营预算调整申请;配合财务部做好各项预算管理工作;研发负责人对研发预算执行结果负责。A0 GSB/T 316.22 第七条 技术研发核算管理
集团财务部为承担研发任务的研发中心设立台账归集核算研发费用,研发中心发生的各项开支均纳入研发费用管理。集团财务部协助研发中心做研发投入费用的预算编制和控制,对研发费用的入账方式进行规定,研发阶段的支出全部费用化,计入当期管理费,开发阶段的支出符合资本化条件的,按照财政部有关规定,确认无形资产;研发费用的纳税扣除,按照财政部、国家税务总局有关规定执行。集团每年在当年财务会计报告中,按照规定披露研发费用相关财务信息,包括研发费用支持规模及其占销售收入的比例,集中收付研发费用情况等。
第八条 技术研发成本控制
技术研发成本主要包括研发物料成本、人力工资成本、差旅费用等,其中研发物料成本估算在技术研发项目任务书中体现,集团财务对项目成本进行控制、统计,同时,研发中心内部制定了《研发物料
管理规定》和《关键物料导入管理规定》等规定,对研发物料成本实施监督管理;人力工资成本是技术研发成本的主要构成部分,即研发项目成本主要来源于项目实际工作量,通过项目管理对研发项目投入人工实施成本管理;差旅费用及其他费用按照集团财务部《借款和日常费用报销制度》和《研发中心费用管理制度》相关条款对费用执行进行监督和管理。
第三章 技术研发环境管理
第九条 公司应在编码规范、公共技术平台、软件开发环境、模拟测试环境、项目管理环境和配置管理环境等方面,形成明确的管理要求,为运维项目和运维产品的设计开发奠定扎实的技术基础。
9.1编码规范:研发中心应编制C语言编码规范、C#编码规范、C++编码规范、Java编码规范等代码设计规范,并通过代码评审机制贯彻落实,确保运维产品代码质量。
9.2软件开发环境:研发中心应构建跨平台、跨框架、跨服务,且所有业务单元都能统一采用的公共技术平台,并通过该平台提供统一引进和采用的先进的开发工具、插件、组件等,有效实现研发公共技术和人员的复用,提高开发效率,支撑公司在运维系统项目和运维产品的快速和高效开发。
9.3模拟测试环境:研发中心制定研发费用预算时,应根据研发规划内容,评估A0 GSB/T 316.22 下一模拟测试环境需求,编制研发和测试环境采购预算,确保模拟测试环境与满足研发规划需求。
9.4项目管理环境: 所有运维系统项目应统一采用研发管理系统RDMS进行管理,管理内容包括任务管理、项目管理、测试管理和产品管理等。
9.5配置管理环境:研发中心输出的设计技术文件应统一采用SVN进行管理。经权责人员审批通过的设计技术文件,应由研发文控员通过OA流程,按照《设计文件分发一览表》的规定,分发到设计文件使用部门。
第四章 技术研发团队管理
第十条 运维技术研发团队由研发中心下设的运维开发部组成,运
维开发部根据职能划分为多个小组,包括研发管理组、产品设计组、应用开发组、基础平台组、智能分析组、技术预研组,各小组分别负责运维管理相关工具的管理、设计、开发和预研工作。
第十一条 运维开发部部门职责
11.1对运维新技术和前沿技术的应用、技术储备等进行分析研究,制定研发规划。11.2针对运维业务,开发与发现问题、与解决问题相关的技术及产品,不断提升运维服务能力,改进服务过程,为客户提供稳定、安全、高效运行的业务系统。
第十二条 运维开发部所有岗位,均应编制岗位说明书,明确岗位人员的经验要求,知识要求和技能要求。
第十三条 运维开发部各小组职责和岗位设置如下: 13.1研发管理组
1)职责:负责运维开发项目的计划管理、质量管理和技术文件的配置管理。2)岗位:设置研发项目经理和研发配置管理员岗位 13.2产品设计组职责
1)负责运维系统产品的需求分析和界面设计 2)岗位:设置产品经理和UCD设计师岗位 13.3应用开发组职责
1)负责运维系统应用软件的设计和开发
2)岗位:设置架构设计师和软件工程师(应用开发)岗位 A0 GSB/T 316.22 13.4基础平台组职责
1)负责运维系统基础平台的设计和开发 2)岗位:设置软件工程师(平台开发)岗位 13.5智能分析组职责
1)负责视频诊断分析算法的研究和开发 2)岗位:设置算法工程师岗位 13.6技术预研组职责
1)负责运维技术及公共组件的预研和开发 2)岗位:设置软件工程师(技术预研)岗位
第五章
技术研发人员的绩效管理
第十四条 依据公司《绩效管理制度》和《研发中心员工绩效考核实施细则》,研发中心成立了由研发总监、研发管理部经理和各部门
经理组成的绩效评估小组。
第十五条 研发中心绩效评估小组根据公司整体绩效目标要求,结合部门技术研发规划,将公司绩效指标量化分解为研发中心各部门和个人绩效指标,并签订个人KPI绩效承诺书,其中,绩效考核指标包括质量、进度及综合评定三个维度。
第十六条 研发技术人员的绩效考核指标必须包含研发规划任务实现情况。与运维相关的研发技术人员的具体绩效考核指标包括项目需求实现率,功能测试抽检通过率,缺陷修复率,项目平均进度偏差等。
第十七条 技术研发人员的绩效评价以季度为周期,根据技术研发人员考核周期内所完成研发规划任务的进度和质量数据,结合任务完成的实际情况和影响因素进行综合考评。其中,质量指标考核以测试支持部提供数据为准,进度指标考核以研发管理部提供数据为准。
第十八条 个人绩效得分由研发管理部汇总、整理,经上下级绩效面谈过程确认和研发绩效评估小组总体评估,并报请研发总监核准通过后执行。
第六章
技术研发规划管理
第十九条: 研发中心每年年初全面收集和汇总客户及运营业务部对于服务及新技术的原始需求,分析本业务目标及未来三年公司业务战略。测试支持部每年年初总结上A0 GSB/T 316.22 一技术支持过程中遇到的技术难题、专题等,提出改善服务管理工具的需求,经产品设计部门统一汇总后形成《运维技术研发规划》初稿,规划初稿应包含服务产品的需求、工具的开发需求、技术研究。
第二十条:产品设计部门组织相关技术部门和核心技术人员、研发项目经理等,对技术研发需求进行可行性分析,分析内容应包括但不限于技术可行性、资源投入、研发经费投入等。
第二十一条:研发项目经理组织相关人员明确《运维技术研发规划》中需启动的各项目相关信息,信息应包含项目团队成员、项目计划、项目经费等。
第二十二条:产品设计部门应组织研发中心总监、事业部总经理、
运营业务部经理等相关人员,对运维技术研发规划进行评审,评审结论包含:通过、修改检查后通过、返工再评审、项目终止。产品经理跟进落实评审意见直到关闭。
第二十三条:《运维技术研发规划》评审通过后,由研发项目经理上报公司总裁、董事长审批,研发中心负责执行审批通过后的《运维技术研发规划》。
因篇幅问题不能全部显示,请点此查看更多更全内容