请选择 进入手机版 | 继续访问电脑版

IT运维管理,ITIL,ITSS,ITSM,ISO20000-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

艾拓先锋
搜索
查看: 774|回复: 0

运维自动化的定义就是数据-事件-流程

[复制链接]
来自- 广东广州

参加活动:0

组织活动:12

发表于 2017-9-13 11:40:30 | 显示全部楼层 |阅读模式 来自- 广东广州
本帖最后由 monicazhang 于 2018-8-27 11:07 编辑
% N$ D, T8 A" f- u  |: M" ~; [- ?/ T3 [# m

随着互联网发展迅猛,不同的公司IT基础设施面临的增长和快速发展。从人肉维护,建设到半自动,全自动,由此产生的自动化体系/运维工具越来越多,目前大多数运维IT环境架构主要分为3种技术体系:

+ U9 ^. r& v. f5 }& T7 J

1)开源工具


5 w2 i! O( K& o" I

3 j+ n0 }0 V  H2 H1 C

2)自研发工具(更多的是包含和利用开源软件优秀的特性进行定制化开发)


" @+ J' b$ `4 i' N% N1 H


8 U5 M5 F5 p3 L; V9 W3 z+ I

3)从0自主研发,底层改造到应用层开发


- q" W- }0 J$ b& W6 ^# O7 p! n$ Y
( W. R( e0 @$ e5 O( H8 E( o) G) A# v# Q

开源的代表作有很多,比如:puppet,saltstack,Ansible,nagioszabbix,Docker,KVM,Openstack等主流开源软件。

自研:资产管理系统,发布系统,监控系统,配管系统,工单系统等。

0 i2 ~9 ?0 R& t) X. v7 `

总结:运维自动化已经是成熟的代名词了,无论从网上搜索,还是各大技术分享,都有很多不错的案例和实施过程。但也很多朋友觉得实施起来很困难,复杂,但是看似很简单。困难和复杂:想不通如何把重复性,不可规整/聚合,业务连接成一线枢纽。看似简单:因为有人/其他互联网运维团队实施出来了,实现的还不错,看似近在迟尺。先定义后实施,这个是关键点,想明白才去做,没想明白千万别去做,否则只有推翻重来或者坑越来越多。

6 [6 a: J! T4 `, d8 I' u# ^  E

定义分为三个层面:1.数据的定义2.事件的定义3.流程的定义

; b# G. ~# o% S8 k

# z- U0 m% L# |- a) Z! u" P( ~
. G# Y  H! w# Q" A# x

1.数据的定义:


( h/ w) f* h, d1 ~% A! u1 h* h( C2 ~% ~( z* C* e! Z; S( ]# r0 D3 r

  n, }+ v1 \& Z2 b: r8 S  g  z( M" @8 j$ j$ S9 e0 O5 P5 ?! N, n

一切的基石基于数据,第一步数据的纬度要设计好:


' G( _* ~3 o: S8 y, u

①.机房的定义:比如北京机房,上海机房,香港机房等

5 s4 m3 m% R% b9 N! k

②.机器类型定义:私有云,公有云,物理机,公有云:ali,aws等细化纬度。


- y! N- K- G; I

③.业务定义:比如官网业务,订单业务等纬度细化。


- I3 G8 T9 o2 y  K. o2 c: K

④.存储的定义:比如根据自家公司的业务和技术体系来设计:


# U6 ~1 w( G4 L% N8 V+ _

比如哪些基础信息是需要的,哪些信息看似可要/可不要的,要做好取舍。

: F: I2 L( B8 l4 {4 X+ y% p. ~8 f

数据存储的信息一定要是展现出来有实际意义的,数据存储不在于多,而是在于价值,繁重的数据越来越多,如果定义很多可有/可无的数据存储,对于一个IT基础资产库来说,也是种负担。


4 v: H7 A/ C9 u9 r4 s9 A* n

数据的存储考量:唯一的,有价值的,可维护,可扩展的四个原则。


4 E& T6 \# F3 i# w7 c. B# v( H6 e" P- b

⑤.协同的定义:当拥有一份完整的IT基础资产库的时候,只是一份基石,基石铺垫好了,才有上升的扩建空间,数据的标准接入协同分为二部分:

( F* n5 x) r& _' M$ q1 b

1)内部的系统/资源(运维内部的系统)

6 P4 u3 h) u5 x

2)外部的系统/资源  (业务,安全的系统)

) A  g+ D1 G7 c: z6 c3 _

内部系统/资源和外部系统/资源对资产信息库的对接关系策略纬度:

. M* o! I; E4 n- c7 Z8 W. F, p

1.可增加/删除的,初始化类型数据系统/可移除的资源数据系统,比如:自动化装机系统


% H, l2 l, A* N* N

2.可获取的,获取的信息纬度哪些类型,比如:发布系统,监控系统(拿到资产信息库的业务类型,组,主机/IP信息等。


7 c" f0 ?2 w& O' \' H! z, D

3.可查询的,单条件查询,多条件查询,连同条件查询,比如:安全审计系统,业务类型系统,对外/对内访问IP区分等。


' @! ]. |* X: p6 ?1 r2 @+ y. ^) t

  r& {7 D5 p" X% N

2.事件的定义:

, J. x3 D7 f) ]# }& u

- @! ~$ F  L% i( I+ e, P# ~: K7 U! Z, r% P0 _* k# W
' R& p+ y& ~) X

第一要点的数据定义已经设计好,有了完整规范的数据格式,来定义围绕基础信息库基石上扩展事件。

" K1 \; H- [) H% S$ n

事件定义的逻辑方法论:事件设计-事件构建-事件交付-事件数据汇总


! ?! Z7 [8 v% r) d7 p/ I( x+ p

每个自动化操作都依据某个事件场景来实施,实施的策略很多,也需要平衡好优缺点。


6 l' N3 u. [& x; w3 N


0 u$ @4 L% M, {. ?. v

1)数据的初始化录入系统,俗称:自动化装机系统

5 e; {+ ^4 @% x# p


8 m6 c) l, l5 q2 J

自动化装机系统初衷:

+ G" P% v, R' T; k

1.需要人工重复性操作


3 k2 g& o) ~5 ^4 ~# C

2.快速交付时间周期慢

; y& `& V' X! i' L* |4 A

3.技术提升优势不大


  v% \; o" r/ x5 H. E8 x% n

4.用事件根据场景来优化

$ L+ J" a5 @7 U+ y


: ^9 h# w2 U8 b" y

自动化装机系统交付要点(根据不同主机类型来构建事件场景):

3 Z4 q# I% q5 C5 Z8 H  v

1.物理机类型(硬件层面:不同硬件厂商的类型,比如远程卡,BIOS初始化,RAID阵列自动划分,软件层面:cobbler)

- V% \4 n9 H6 K, |) e4 u: a

2.公有云类型  (服务商的Api或者SDK接口)

, C) g5 H  z9 K" f

3.私有云类型 (Openstack,Docker,KVM私有云规范的Api接口或者自己构造一份标准的接口).


& |3 f: }- k6 j( r% V3 w1 t  I( C: @

4.从类型选择初始化配置-内部DNS数据接入-获取主机信息资源-启动新主机。

# u# N' p( t; Y5 x' O$ H5 M+ r# _

5.数据完整保存,方便以后分析和进一步优化。比如:成本的使用/扩展,业务方机器资源使用率,分析对该事件场景构建优化提升之处。


( b! i, D, J% R5 U- _

2 u! n6 m0 l* a+ Z) Z2 F

发布系统,运维日常支持工作占到百分之50%或者更多。代码发布也是运维考核的和支持最重要的一项日常工作。

* v7 p) O* I5 G( Q( y. N

发布环境常用的包含:local,beta,demo,gray,online等

3 x" o: u5 b. H  Y% S: Y5 {* U- d6 I1 J; t

发布的代码类型:混合型居多。

# f) J2 B2 f5 d+ ~

通常情况下,人肉支撑的耗时,重复性,自检成功/失败发布,排查故障周期很长。尤其是对于重要业务平滑,耗时的情况更多。

而发布系统满足重要的三个因素:


. D: e  G9 J4 r- e" ~

1.自动无损平滑发布(支持多种负载均衡策略,发布代码不重启服务策略,环境组主机流量自动切换)和可视化实时过程/结果查看。


4 a  G9 m) s% g0 V6 H! h4 j

2.稳定,并行的构造多环境/多业务发布,即使某个业务出问题,对于整个发布平台/其他业务发布也是无感知,无影响。


8 F( |: _. ~3 [/ v

3.权限,安全隔离,完整的审计功能,让研发自助的发布。


( J, V" A% n; R% N4 O1 v& \; C

4.数据的完整保存,分析目前业务发布测试/迭代,资源调度率,发布时间点,全年发布优化指标等。


7 W- l0 |" d$ F0 ]

总结:以上就举2个事件场景构建的案例,一切事件构建皆为场景,场景的价值在于数据是否帮助/量化,改进业务层面/运维层面的持续增长/交付。


0 M9 A1 A" p, ], R9 j. r


& u% P; L, ]3 G

3.流程的定义(一切入口,规范,从流程抓起)

# }" t  p& E/ B; i  B! D7 a8 p- f

4 Q0 ^9 H* h/ ~/ G+ T9 h0 ?% _; E* ~) w' l# b

$ c, v: W0 y+ ?) m& r. [

为什么最后才是流程,因为在没有数据做基础铺垫,事件场景构建,一切谈流程都是空话,虚拟的。


( V* j; o9 `5 @4 O4 q

流程基于实施的要素:


5 `8 [, i6 F2 ^1 T

1)基于一切数据+事件的入口配置


* F: f  \3 @% W

2)流程不在于复杂,在于易用,快捷,可塑造。

+ C1 s# z% n2 R: N$ W! U

3)源地址-目的地址全部过程保存,可追踪。


, q' ^/ m5 z4 i( v

0 |! ^5 k4 l1 H9 g4 Q0 M3 A! \; I

自动化价值:

! K& j- ]% m8 R$ `5 W7 W0 s5 ~2 x3 K. e6 ^

1)价值性产出:站在业务/团队角度去思考,不追从完美产品方案,只选择合适的产品方案,同时在一定程度上做好取舍。


6 z8 p( [1 z* [  r" y+ I# ?

2)从小而做到细,从细扩展到大,才是本质。


: [5 _0 Y6 Q' k! S* j* c

3)  自动化产出一切为数据,对数据定义要设计好,宁愿设计周期长些,也不要盲目实施。

% e& r+ n; u& J6 D9 `4 n

原创:符杰超


& m8 ]) z" Q" U# a9 R

本版积分规则

选择云运维时代的王牌讲师-长河老师,助你轻松入门ITIL Foundation培训课程

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1|网站地图

Baidu

GMT+8, 2019-5-24 13:57 , Processed in 0.218899 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表