请选择 进入手机版 | 继续访问电脑版

IT运维管理,ITIL,ITSS,ITSM,ISO20000-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

艾拓先锋
搜索
查看: 691|回复: 0

运维自动化的定义就是数据-事件-流程

[复制链接]
来自- 广东广州

参加活动:0

组织活动:12

发表于 2017-9-13 11:40:30 | 显示全部楼层 |阅读模式 来自- 广东广州
本帖最后由 monicazhang 于 2018-8-27 11:07 编辑 ! M; s8 h3 i- S9 t$ }/ W; x, u

$ ~# W  X$ r1 x# U' z$ b7 ]

随着互联网发展迅猛,不同的公司IT基础设施面临的增长和快速发展。从人肉维护,建设到半自动,全自动,由此产生的自动化体系/运维工具越来越多,目前大多数运维IT环境架构主要分为3种技术体系:

: A& p/ H1 b- E

1)开源工具

# [) A, D+ ^( [- ?6 n" F

8 h9 }( C& v6 ?% _4 E' S- k

2)自研发工具(更多的是包含和利用开源软件优秀的特性进行定制化开发)

! L/ [- l! M! a


9 u. F5 z2 a3 O/ {4 D5 k! l

3)从0自主研发,底层改造到应用层开发

1 @5 K0 ]& Y7 I9 G' d9 Q. y8 G

# J7 K1 m" y  z- f; D% J2 i, a& J6 k2 f. U! G0 @

开源的代表作有很多,比如:puppet,saltstack,Ansible,nagioszabbix,Docker,KVM,Openstack等主流开源软件。

自研:资产管理系统,发布系统,监控系统,配管系统,工单系统等。

, A# R+ T/ q3 O" g. w8 h, Q

总结:运维自动化已经是成熟的代名词了,无论从网上搜索,还是各大技术分享,都有很多不错的案例和实施过程。但也很多朋友觉得实施起来很困难,复杂,但是看似很简单。困难和复杂:想不通如何把重复性,不可规整/聚合,业务连接成一线枢纽。看似简单:因为有人/其他互联网运维团队实施出来了,实现的还不错,看似近在迟尺。先定义后实施,这个是关键点,想明白才去做,没想明白千万别去做,否则只有推翻重来或者坑越来越多。

6 q% v/ Q0 L% U/ b

定义分为三个层面:1.数据的定义2.事件的定义3.流程的定义

* c, Z  C- T; C* G7 d  H" a

" I3 c" q  T7 X7 v! M2 D3 E9 k4 u
+ x; n# K3 g. M

1.数据的定义:

$ |# C1 v8 _. _$ S  W% x

) h: L* S/ E8 d5 j
& X/ u7 V$ V- b4 O9 h; ~
! s1 ^. I$ P  @' a

一切的基石基于数据,第一步数据的纬度要设计好:


# m- S9 a& C, e6 G

①.机房的定义:比如北京机房,上海机房,香港机房等


/ D4 c# `) H4 R) D

②.机器类型定义:私有云,公有云,物理机,公有云:ali,aws等细化纬度。


! s. f# `' ^8 x- w$ d, y5 U

③.业务定义:比如官网业务,订单业务等纬度细化。

) d+ @; v) E) B7 z7 W

④.存储的定义:比如根据自家公司的业务和技术体系来设计:


+ W, l; V0 Z" _, X6 I4 T$ X, [' o

比如哪些基础信息是需要的,哪些信息看似可要/可不要的,要做好取舍。


. k6 [0 s' g  h* L, r

数据存储的信息一定要是展现出来有实际意义的,数据存储不在于多,而是在于价值,繁重的数据越来越多,如果定义很多可有/可无的数据存储,对于一个IT基础资产库来说,也是种负担。


- v- U. a5 P; X5 y4 {

数据的存储考量:唯一的,有价值的,可维护,可扩展的四个原则。

7 p4 M' L1 x1 A% R: J+ v/ m: R- B1 u

⑤.协同的定义:当拥有一份完整的IT基础资产库的时候,只是一份基石,基石铺垫好了,才有上升的扩建空间,数据的标准接入协同分为二部分:

" ~: b6 |/ t6 l2 [. z3 T- D

1)内部的系统/资源(运维内部的系统)


0 ?6 V( O, H! ]. W6 d7 l; {, {

2)外部的系统/资源  (业务,安全的系统)


7 h3 x/ q3 R3 o9 R. h

内部系统/资源和外部系统/资源对资产信息库的对接关系策略纬度:

, F7 n; @5 j. U/ a( g7 h

1.可增加/删除的,初始化类型数据系统/可移除的资源数据系统,比如:自动化装机系统


  J% {) u. M2 ?1 R0 c8 S) u! w

2.可获取的,获取的信息纬度哪些类型,比如:发布系统,监控系统(拿到资产信息库的业务类型,组,主机/IP信息等。


2 x( u. T: n& `) B5 s4 g

3.可查询的,单条件查询,多条件查询,连同条件查询,比如:安全审计系统,业务类型系统,对外/对内访问IP区分等。

/ u; H, l" f9 r9 _! f/ T5 a. p


" u$ x1 ]/ r0 ?0 J- Z! c+ }

2.事件的定义:


) k! X2 m. ^3 N' w4 M# d0 I) c! A) W/ s" ?7 @' T8 e
9 d. l" M# o: T2 U$ ?, G
; A4 U3 A1 {- P) G4 A

第一要点的数据定义已经设计好,有了完整规范的数据格式,来定义围绕基础信息库基石上扩展事件。


" a0 q7 m! x9 |6 N

事件定义的逻辑方法论:事件设计-事件构建-事件交付-事件数据汇总

* W  ~- \: p' g/ j* n% ]: k

每个自动化操作都依据某个事件场景来实施,实施的策略很多,也需要平衡好优缺点。

& S: P5 [" G& k3 b$ T0 I


% i; T+ n5 A; U' v: @, o3 p5 O9 i' H

1)数据的初始化录入系统,俗称:自动化装机系统

5 g. v8 T* C4 X- ^3 ~


: i4 r! M# t0 _9 L: `6 U8 }

自动化装机系统初衷:


4 y/ t8 F) z9 a" E, a) k' ?2 V

1.需要人工重复性操作

; }2 D+ |* C* t+ w' V9 Z4 f

2.快速交付时间周期慢


  [+ l2 F, ^" A" Q& `0 D2 k

3.技术提升优势不大


' \. I9 _. q2 J! j5 Q. C6 u6 U

4.用事件根据场景来优化


; n+ A1 Z& ~4 I  r

5 f! Z% u/ h( z

自动化装机系统交付要点(根据不同主机类型来构建事件场景):


, q7 r3 @- f4 o9 V& X- M

1.物理机类型(硬件层面:不同硬件厂商的类型,比如远程卡,BIOS初始化,RAID阵列自动划分,软件层面:cobbler)

$ Q9 l2 ~6 n, m$ ~

2.公有云类型  (服务商的Api或者SDK接口)

: r  T4 q6 g# o- j- e) B7 I$ {/ H; r$ k

3.私有云类型 (Openstack,Docker,KVM私有云规范的Api接口或者自己构造一份标准的接口).

! K! M' P+ F  J

4.从类型选择初始化配置-内部DNS数据接入-获取主机信息资源-启动新主机。

+ \5 T0 [4 O, F9 \3 X1 V" U

5.数据完整保存,方便以后分析和进一步优化。比如:成本的使用/扩展,业务方机器资源使用率,分析对该事件场景构建优化提升之处。

3 Z! ?% w* F0 s; u! q2 H, w6 N1 M

5 ?  C/ k% x! B2 z& `

发布系统,运维日常支持工作占到百分之50%或者更多。代码发布也是运维考核的和支持最重要的一项日常工作。

( N" @0 _/ p" a# c; V" }

发布环境常用的包含:local,beta,demo,gray,online等


+ ?$ \1 y' j+ ?$ Y% {+ H( Z

发布的代码类型:混合型居多。


' n8 q, H) ?3 q

通常情况下,人肉支撑的耗时,重复性,自检成功/失败发布,排查故障周期很长。尤其是对于重要业务平滑,耗时的情况更多。

而发布系统满足重要的三个因素:


( L7 O- ^$ p, _, R' m5 w: u

1.自动无损平滑发布(支持多种负载均衡策略,发布代码不重启服务策略,环境组主机流量自动切换)和可视化实时过程/结果查看。


& L: ~* `; k( S

2.稳定,并行的构造多环境/多业务发布,即使某个业务出问题,对于整个发布平台/其他业务发布也是无感知,无影响。


9 p' T8 X( ~* B/ O& L1 m

3.权限,安全隔离,完整的审计功能,让研发自助的发布。


* T4 f- }1 L9 c. B3 E0 U5 Z

4.数据的完整保存,分析目前业务发布测试/迭代,资源调度率,发布时间点,全年发布优化指标等。


2 d: `/ Z$ e9 W+ M  h' o+ Y

总结:以上就举2个事件场景构建的案例,一切事件构建皆为场景,场景的价值在于数据是否帮助/量化,改进业务层面/运维层面的持续增长/交付。


9 q5 Q4 {  t- d" b+ `" v  f

: H9 }# j. N6 r

3.流程的定义(一切入口,规范,从流程抓起)

9 \1 e1 U% j3 q, Q& p" [% q
7 D2 C, b  [& P0 }- X

, O$ p$ S3 r. o, ^, R* V/ H  q7 F- C

为什么最后才是流程,因为在没有数据做基础铺垫,事件场景构建,一切谈流程都是空话,虚拟的。


! p- m: r9 H/ T4 |- a

流程基于实施的要素:


3 B" w/ d2 c. ~2 o! p" W

1)基于一切数据+事件的入口配置


! [5 T9 t+ j0 l: G

2)流程不在于复杂,在于易用,快捷,可塑造。

6 w# @, G5 h0 o: A2 c

3)源地址-目的地址全部过程保存,可追踪。


& U2 F5 |. ]% `


& C8 c1 N* D- |8 k- Y" v  L

自动化价值:


; }, h. I- o0 q, ?& @$ f- R9 j

1)价值性产出:站在业务/团队角度去思考,不追从完美产品方案,只选择合适的产品方案,同时在一定程度上做好取舍。

: E% m% i& i+ c; m9 F4 J

2)从小而做到细,从细扩展到大,才是本质。


: {$ ]) s& O. k

3)  自动化产出一切为数据,对数据定义要设计好,宁愿设计周期长些,也不要盲目实施。


- }) |6 x4 i, G# A- G6 k

原创:符杰超


# a4 G6 b: U: h8 B" z) `1 O

本版积分规则

选择云运维时代的王牌讲师-长河老师,助你轻松入门ITIL Foundation培训课程

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1|网站地图

Baidu

GMT+8, 2019-1-23 22:38 , Processed in 0.248315 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表