请选择 进入手机版 | 继续访问电脑版

IT运维管理,ITIL,ITSS,ITSM,ISO20000-ITIL先锋论坛

 找回密码
 点击获取邀请码 - 立即注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

艾拓先锋
搜索
查看: 557|回复: 0

运维自动化的定义就是数据-事件-流程

[复制链接]
来自- 广东广州

参加活动:0

组织活动:12

发表于 2017-9-13 11:40:30 | 显示全部楼层 |阅读模式 来自- 广东广州
本帖最后由 monicazhang 于 2018-8-27 11:07 编辑 " |5 i6 O/ I; e* J9 f& s; O0 M+ Z
- R( P! N5 f7 _  J/ b/ k+ e) y

随着互联网发展迅猛,不同的公司IT基础设施面临的增长和快速发展。从人肉维护,建设到半自动,全自动,由此产生的自动化体系/运维工具越来越多,目前大多数运维IT环境架构主要分为3种技术体系:


6 T: _$ a( y5 \

1)开源工具


3 c  E$ S& ^9 G  _& g+ [


$ E7 n% s- N1 a7 u) V6 f4 D

2)自研发工具(更多的是包含和利用开源软件优秀的特性进行定制化开发)

; C, y( t( f& ?& O2 R2 S; L( \

; y+ V$ ?2 H9 G

3)从0自主研发,底层改造到应用层开发

: [: \$ s) S' D& _/ u, j

! n% Q$ D* G, t4 l: ~. ]8 k4 ~4 j# O" ^& J( f$ w

开源的代表作有很多,比如:puppet,saltstack,Ansible,nagioszabbix,Docker,KVM,Openstack等主流开源软件。

自研:资产管理系统,发布系统,监控系统,配管系统,工单系统等。

' Q( A; G0 @( q

总结:运维自动化已经是成熟的代名词了,无论从网上搜索,还是各大技术分享,都有很多不错的案例和实施过程。但也很多朋友觉得实施起来很困难,复杂,但是看似很简单。困难和复杂:想不通如何把重复性,不可规整/聚合,业务连接成一线枢纽。看似简单:因为有人/其他互联网运维团队实施出来了,实现的还不错,看似近在迟尺。先定义后实施,这个是关键点,想明白才去做,没想明白千万别去做,否则只有推翻重来或者坑越来越多。


7 B2 I# N8 S/ k9 \+ G/ j6 D+ k

定义分为三个层面:1.数据的定义2.事件的定义3.流程的定义


: v( Z7 W* q9 k% E

; Z" V5 w4 w% X1 I% X7 T- t5 x

  X7 X( @$ n0 c2 l& ]

1.数据的定义:

: O8 Q" t" e0 S. E0 m# p8 N8 ]

1 r2 r% w* V* I% d! l
& W9 @5 _5 d! a8 |, v: y
1 M8 G1 }1 v0 O* n+ O2 P$ ^

一切的基石基于数据,第一步数据的纬度要设计好:

8 Z8 ?$ W0 m- _* a. Z

①.机房的定义:比如北京机房,上海机房,香港机房等

% g1 Z3 [4 S+ S9 U

②.机器类型定义:私有云,公有云,物理机,公有云:ali,aws等细化纬度。


; `5 D- s# \  U& [, J

③.业务定义:比如官网业务,订单业务等纬度细化。


* K+ x) Z1 p" r, H

④.存储的定义:比如根据自家公司的业务和技术体系来设计:

& i/ s. h* h4 ?) E. L2 d

比如哪些基础信息是需要的,哪些信息看似可要/可不要的,要做好取舍。


( X( P- I# a$ _# A

数据存储的信息一定要是展现出来有实际意义的,数据存储不在于多,而是在于价值,繁重的数据越来越多,如果定义很多可有/可无的数据存储,对于一个IT基础资产库来说,也是种负担。

* o" T! o2 z/ N9 K/ O" t5 Q

数据的存储考量:唯一的,有价值的,可维护,可扩展的四个原则。

) i2 {6 c$ O9 y& q3 n) s

⑤.协同的定义:当拥有一份完整的IT基础资产库的时候,只是一份基石,基石铺垫好了,才有上升的扩建空间,数据的标准接入协同分为二部分:


( G5 O, A  ?2 Z' F! l

1)内部的系统/资源(运维内部的系统)

7 \9 J' i7 ~2 H* A

2)外部的系统/资源  (业务,安全的系统)


+ M( \0 w- Y+ _. f

内部系统/资源和外部系统/资源对资产信息库的对接关系策略纬度:


  K% o9 `8 x+ |( W+ r  y

1.可增加/删除的,初始化类型数据系统/可移除的资源数据系统,比如:自动化装机系统

) e: P, X2 v8 k$ m+ g

2.可获取的,获取的信息纬度哪些类型,比如:发布系统,监控系统(拿到资产信息库的业务类型,组,主机/IP信息等。


- `0 l6 f' V3 R# P; p( U; [( q) Q% W

3.可查询的,单条件查询,多条件查询,连同条件查询,比如:安全审计系统,业务类型系统,对外/对内访问IP区分等。


4 p1 V, S& t0 P4 E

4 H5 v, W; ]- ^- N) i! {( _, p( N" f

2.事件的定义:

+ w0 m4 F" |6 A. Y& R5 S) I# P

" m/ z- [4 O: q  O5 j3 C9 d4 M- {8 ^  ~4 `0 O7 c% R+ ^
6 d* Z' m# N2 P. Q; Y% s

第一要点的数据定义已经设计好,有了完整规范的数据格式,来定义围绕基础信息库基石上扩展事件。

- H; ^$ y- i& @' b' P

事件定义的逻辑方法论:事件设计-事件构建-事件交付-事件数据汇总


, K* I4 g' Y9 X6 L! L0 l7 A$ i: A

每个自动化操作都依据某个事件场景来实施,实施的策略很多,也需要平衡好优缺点。

2 S2 E, K7 h9 D+ r


& }3 e! t8 q4 H" e& S: }9 Y8 C

1)数据的初始化录入系统,俗称:自动化装机系统

* F, @9 @9 g8 ]- }& U- @( O

9 }2 `  r* c1 b; F: o9 e+ }

自动化装机系统初衷:


  K. F" m! Q* U1 ^( u- W% e

1.需要人工重复性操作

1 j% I+ b8 ?! l5 q

2.快速交付时间周期慢


& G8 h$ u5 x; Y. J. W4 E7 |7 x

3.技术提升优势不大


7 g) z3 A9 Y0 ~9 d1 T- K' k

4.用事件根据场景来优化

' z: A+ C1 \8 d5 D# g- l/ T' f


, u5 u" D( n5 `' Q( i# C* p

自动化装机系统交付要点(根据不同主机类型来构建事件场景):

' E) P0 p( A7 e5 D  x# r

1.物理机类型(硬件层面:不同硬件厂商的类型,比如远程卡,BIOS初始化,RAID阵列自动划分,软件层面:cobbler)

9 j( S! _" H& `) r. `! A" D0 J. C

2.公有云类型  (服务商的Api或者SDK接口)


8 S2 M, k: L; T

3.私有云类型 (Openstack,Docker,KVM私有云规范的Api接口或者自己构造一份标准的接口).


6 [% ~9 t# P- s# `9 J* t5 O

4.从类型选择初始化配置-内部DNS数据接入-获取主机信息资源-启动新主机。

1 g! R- c& S& Q  o) v6 G, V3 |# R; o

5.数据完整保存,方便以后分析和进一步优化。比如:成本的使用/扩展,业务方机器资源使用率,分析对该事件场景构建优化提升之处。

8 h6 z) M% D- r; Y

6 Y3 p3 |. d  `' A8 g+ e

发布系统,运维日常支持工作占到百分之50%或者更多。代码发布也是运维考核的和支持最重要的一项日常工作。


# Z& ]- N/ V* e. ?+ L' j

发布环境常用的包含:local,beta,demo,gray,online等

# K+ S4 V) J) ?4 c$ Q/ g! P: k7 m- K

发布的代码类型:混合型居多。


7 K4 M3 ^8 I: j5 t- T/ @; j

通常情况下,人肉支撑的耗时,重复性,自检成功/失败发布,排查故障周期很长。尤其是对于重要业务平滑,耗时的情况更多。

而发布系统满足重要的三个因素:


3 s' p! m5 R( {9 I+ W+ F

1.自动无损平滑发布(支持多种负载均衡策略,发布代码不重启服务策略,环境组主机流量自动切换)和可视化实时过程/结果查看。

. n) T6 B1 d3 ?& A' Z' l

2.稳定,并行的构造多环境/多业务发布,即使某个业务出问题,对于整个发布平台/其他业务发布也是无感知,无影响。


1 @. ^  N( M$ Y! h; }8 p

3.权限,安全隔离,完整的审计功能,让研发自助的发布。


# O! [& w1 Y, G

4.数据的完整保存,分析目前业务发布测试/迭代,资源调度率,发布时间点,全年发布优化指标等。


, Y5 K' D( _6 `! o

总结:以上就举2个事件场景构建的案例,一切事件构建皆为场景,场景的价值在于数据是否帮助/量化,改进业务层面/运维层面的持续增长/交付。

& S. V5 M) T+ e, _/ w3 G; T


5 g/ K# y. L) j* O

3.流程的定义(一切入口,规范,从流程抓起)


7 b5 L, o4 @& A: o2 q" u% L& K* V/ _2 [! I) _

. K3 D7 b( M! Q+ I* j- b; @7 W
2 r2 W0 ~4 z! U" i7 V

为什么最后才是流程,因为在没有数据做基础铺垫,事件场景构建,一切谈流程都是空话,虚拟的。

4 u. |* M5 d3 M: t

流程基于实施的要素:

, D/ O5 ~0 b6 Z, }2 s

1)基于一切数据+事件的入口配置


; z4 y+ Q( F5 h( p

2)流程不在于复杂,在于易用,快捷,可塑造。


3 v& t+ L" p7 @' ]- p2 a$ t( ^

3)源地址-目的地址全部过程保存,可追踪。


" q5 W% Z" @6 T' S


- M7 {- @- g9 f3 N. E& z$ t

自动化价值:


, e8 P6 V) g, v! v* ^! P% n8 @* N- C

1)价值性产出:站在业务/团队角度去思考,不追从完美产品方案,只选择合适的产品方案,同时在一定程度上做好取舍。


' }9 x. j. |8 L9 z+ S) [7 l& X

2)从小而做到细,从细扩展到大,才是本质。

: t, \  q- i' c! t! x- y

3)  自动化产出一切为数据,对数据定义要设计好,宁愿设计周期长些,也不要盲目实施。

8 ]5 ~% G0 W0 }. G6 o, \

原创:符杰超

) A$ Y) i5 V; V0 g9 S5 z% n$ q

本版积分规则

选择云运维时代的王牌讲师-长河老师,助你轻松入门ITIL Foundation培训课程

QQ|小黑屋|手机版|Archiver|ITIL先锋论坛五万运维人社区 ( 粤ICP备17056641号|网站地图

Baidu

GMT+8, 2018-9-21 01:17 , Processed in 0.250881 second(s), 33 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表