请选择 进入手机版 | 继续访问电脑版

IT运维管理,ITIL,ITSS,ITSM,ISO20000-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

艾拓先锋
搜索
查看: 645|回复: 0

运维自动化的定义就是数据-事件-流程

[复制链接]
来自- 广东广州

参加活动:0

组织活动:12

发表于 2017-9-13 11:40:30 | 显示全部楼层 |阅读模式 来自- 广东广州
本帖最后由 monicazhang 于 2018-8-27 11:07 编辑 - u2 A8 |& k. v+ ~+ j, I$ U
5 @8 K$ ]4 c# i, O- i

随着互联网发展迅猛,不同的公司IT基础设施面临的增长和快速发展。从人肉维护,建设到半自动,全自动,由此产生的自动化体系/运维工具越来越多,目前大多数运维IT环境架构主要分为3种技术体系:


- O! J( G, _- ]) _4 @( q1 x" ?

1)开源工具

+ w' `! m1 @, N4 |


: u2 Z. w6 g' ~( X: D3 R

2)自研发工具(更多的是包含和利用开源软件优秀的特性进行定制化开发)


$ ?6 O' y- J: M# X7 E0 R% [  m


! V# q) O# F' G: H4 D6 g$ B0 S; r

3)从0自主研发,底层改造到应用层开发


7 f5 l& e( i8 O+ O* Y9 G* b9 \
% {- p& G3 h1 n7 U& \* @; s) ^! c" t

开源的代表作有很多,比如:puppet,saltstack,Ansible,nagioszabbix,Docker,KVM,Openstack等主流开源软件。

自研:资产管理系统,发布系统,监控系统,配管系统,工单系统等。


! g( k! c6 v8 W! c; a! K- }9 l

总结:运维自动化已经是成熟的代名词了,无论从网上搜索,还是各大技术分享,都有很多不错的案例和实施过程。但也很多朋友觉得实施起来很困难,复杂,但是看似很简单。困难和复杂:想不通如何把重复性,不可规整/聚合,业务连接成一线枢纽。看似简单:因为有人/其他互联网运维团队实施出来了,实现的还不错,看似近在迟尺。先定义后实施,这个是关键点,想明白才去做,没想明白千万别去做,否则只有推翻重来或者坑越来越多。


! w4 x1 \: g/ [- I3 D4 n# }8 H

定义分为三个层面:1.数据的定义2.事件的定义3.流程的定义


" n1 c! }. {3 Z0 V7 J3 ^( v. q

" O7 p/ O4 [4 U

, @; m7 ]9 g  x

1.数据的定义:

, o( S  X, ^2 H  E0 C
# }4 K, ^& a3 H, y  }

: }0 r! h* N* \' q; F2 r" A6 U

一切的基石基于数据,第一步数据的纬度要设计好:


8 M4 A7 g8 x. m; X2 e* r! v: f! I# G

①.机房的定义:比如北京机房,上海机房,香港机房等

) r9 @9 O) F8 T$ j/ b$ J1 `

②.机器类型定义:私有云,公有云,物理机,公有云:ali,aws等细化纬度。


) x  @, w7 j& g7 F- c

③.业务定义:比如官网业务,订单业务等纬度细化。

" U0 t  x4 M0 x0 z% e) @

④.存储的定义:比如根据自家公司的业务和技术体系来设计:

2 l# r4 G% a: ?3 `6 j2 F9 Z/ Z

比如哪些基础信息是需要的,哪些信息看似可要/可不要的,要做好取舍。

: q1 V# w. l6 b9 N) k

数据存储的信息一定要是展现出来有实际意义的,数据存储不在于多,而是在于价值,繁重的数据越来越多,如果定义很多可有/可无的数据存储,对于一个IT基础资产库来说,也是种负担。


; s+ e0 s- E. ?7 x* j  e  P

数据的存储考量:唯一的,有价值的,可维护,可扩展的四个原则。

# T/ Q8 o, v3 \# ~1 B; S

⑤.协同的定义:当拥有一份完整的IT基础资产库的时候,只是一份基石,基石铺垫好了,才有上升的扩建空间,数据的标准接入协同分为二部分:


2 V) x, _% i) k: T" l0 y& K

1)内部的系统/资源(运维内部的系统)


; |, {+ T# ~7 @- `; j

2)外部的系统/资源  (业务,安全的系统)

+ E/ O6 Q7 W$ O9 ^

内部系统/资源和外部系统/资源对资产信息库的对接关系策略纬度:


# T2 \) n1 l  k( x1 L( e

1.可增加/删除的,初始化类型数据系统/可移除的资源数据系统,比如:自动化装机系统


1 {! }. p" s* f6 B5 t

2.可获取的,获取的信息纬度哪些类型,比如:发布系统,监控系统(拿到资产信息库的业务类型,组,主机/IP信息等。

0 w: W- y3 ]5 f7 N

3.可查询的,单条件查询,多条件查询,连同条件查询,比如:安全审计系统,业务类型系统,对外/对内访问IP区分等。

# I! f& w' c, R, s/ u1 Z


7 T0 h( o& S5 F  J9 B" |

2.事件的定义:

* t( c) @1 C. z% m5 G8 v

2 k# E! G: Z. u7 J( X
$ T  ^3 a, {5 p5 K- ~
2 l5 y/ N1 o$ q- G7 i# {- ?8 z

第一要点的数据定义已经设计好,有了完整规范的数据格式,来定义围绕基础信息库基石上扩展事件。

* Y0 M0 D% `7 z$ P$ T

事件定义的逻辑方法论:事件设计-事件构建-事件交付-事件数据汇总

' H& i' Q7 Y: F+ g5 O5 T  `& L

每个自动化操作都依据某个事件场景来实施,实施的策略很多,也需要平衡好优缺点。

* }1 b# }  h; \; A


; c, W  d6 K8 v3 J4 {! M

1)数据的初始化录入系统,俗称:自动化装机系统

+ k2 U; P; B8 o7 f

- w' ?3 i$ `0 N! j/ f9 s

自动化装机系统初衷:


2 l4 k6 G) @6 Y$ D. p3 c

1.需要人工重复性操作

* u) h) G1 J3 y7 ^" }$ J

2.快速交付时间周期慢

8 [4 L) A' T, @( N$ ~- T4 o4 _

3.技术提升优势不大

* D# F1 J3 b2 T7 D

4.用事件根据场景来优化

" F7 g5 Q% p9 _8 L2 ]5 j

" `! D. ~: i  U- h1 I' `! y

自动化装机系统交付要点(根据不同主机类型来构建事件场景):


& ^$ G/ N7 g$ o# Q

1.物理机类型(硬件层面:不同硬件厂商的类型,比如远程卡,BIOS初始化,RAID阵列自动划分,软件层面:cobbler)


0 i4 p" a$ ~8 B% g  A5 Z3 ]! d

2.公有云类型  (服务商的Api或者SDK接口)

6 n! I4 @  A, e+ |  U2 Q

3.私有云类型 (Openstack,Docker,KVM私有云规范的Api接口或者自己构造一份标准的接口).


" G: Q, T3 p* B' q0 |" i

4.从类型选择初始化配置-内部DNS数据接入-获取主机信息资源-启动新主机。


$ D* C' }% }6 c1 [- d  N$ E- t  n

5.数据完整保存,方便以后分析和进一步优化。比如:成本的使用/扩展,业务方机器资源使用率,分析对该事件场景构建优化提升之处。


' e  H4 e5 p( A2 h6 ?/ o

" q$ g( a1 k5 l# s

发布系统,运维日常支持工作占到百分之50%或者更多。代码发布也是运维考核的和支持最重要的一项日常工作。


. U" c% z0 G6 D- M

发布环境常用的包含:local,beta,demo,gray,online等


% Q% ?' R$ s6 y. [& Z# I

发布的代码类型:混合型居多。

0 ?2 e" i! L) `" D# ]( o

通常情况下,人肉支撑的耗时,重复性,自检成功/失败发布,排查故障周期很长。尤其是对于重要业务平滑,耗时的情况更多。

而发布系统满足重要的三个因素:


$ g) l0 Q" y' h' ^- C/ ~3 g) Z

1.自动无损平滑发布(支持多种负载均衡策略,发布代码不重启服务策略,环境组主机流量自动切换)和可视化实时过程/结果查看。

' ]. t+ C1 h. Y8 V% ^  Z

2.稳定,并行的构造多环境/多业务发布,即使某个业务出问题,对于整个发布平台/其他业务发布也是无感知,无影响。

, i3 @# s) m2 n6 P9 U5 R) |: y- B4 |  J

3.权限,安全隔离,完整的审计功能,让研发自助的发布。

0 B+ N7 O0 z. k  \- n. q2 F

4.数据的完整保存,分析目前业务发布测试/迭代,资源调度率,发布时间点,全年发布优化指标等。

- V7 H4 Z1 ^$ f, j/ q( P$ |

总结:以上就举2个事件场景构建的案例,一切事件构建皆为场景,场景的价值在于数据是否帮助/量化,改进业务层面/运维层面的持续增长/交付。


& n. Z& v; ~* f6 {, g5 C7 I6 n


! `# _4 f+ ^& S0 \/ N  Y

3.流程的定义(一切入口,规范,从流程抓起)


4 O# ~7 d8 G/ ]5 z+ j8 Q# g& }- q( y

" y  H" P, Q/ k6 i3 o) i% _* M& Z- i/ V

为什么最后才是流程,因为在没有数据做基础铺垫,事件场景构建,一切谈流程都是空话,虚拟的。


) ^$ E% q; x& k( Z) h; d6 j5 B

流程基于实施的要素:


+ K" J* @  y( r! K' G7 p

1)基于一切数据+事件的入口配置

  Y7 B; J% O5 P0 Z5 t, y; @$ H

2)流程不在于复杂,在于易用,快捷,可塑造。


& D3 b( b" ]8 f# q4 r/ c$ _7 N

3)源地址-目的地址全部过程保存,可追踪。

: L) F2 x& b7 X" [* d" [# ~

% N3 A3 C, C' U( P8 s- F7 _1 E" G

自动化价值:


  f0 t& k" Z$ N& m

1)价值性产出:站在业务/团队角度去思考,不追从完美产品方案,只选择合适的产品方案,同时在一定程度上做好取舍。


# n9 |* e6 ]& \; I: v

2)从小而做到细,从细扩展到大,才是本质。


1 E1 C  e# y4 A0 a

3)  自动化产出一切为数据,对数据定义要设计好,宁愿设计周期长些,也不要盲目实施。

! Y! d; {3 y1 ]1 C. v7 b# v

原创:符杰超


+ g, @3 r7 p# v

本版积分规则

选择云运维时代的王牌讲师-长河老师,助你轻松入门ITIL Foundation培训课程

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1|网站地图

Baidu

GMT+8, 2018-11-14 13:22 , Processed in 0.298002 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表