请选择 进入手机版 | 继续访问电脑版

IT运维管理,ITIL,ITSS,ITSM,ISO20000-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

搜索
查看: 541|回复: 0

腾讯织云的DevOps流水线应用平台践行之路

[复制链接]
来自- 湖南

参加活动:0

组织活动:0

发表于 2018-10-11 16:46:02 | 显示全部楼层 |阅读模式 来自- 湖南
本帖最后由 adminlily 于 2018-10-11 16:48 编辑 6 ~1 G1 X: G) V
$ [. ]; N0 p/ w7 D
前言
1 \5 i* R$ K; N  Q6 M9 C6 [0 a

" }, P/ {  q3 M# T) w4 ?! K1 }# ~
国家的“互联网+”战略开启了一个企业业务与互联网相结合的新业务形态,有越来越多的企业将自己的业务以互联网为媒介对外输出。任何一款互联网产品都会经历从产品的规划与设计、开发的功能实现、测试的度量验收、运维的发布交付,也是常常被成为企业的IT价值链的全流程,将产品输出个最终的用户,以产生商业价值。
& ?0 p. o+ b" e9 J& I1 K

; @+ C8 a! `- F/ r, q+ S
腾讯的DevOps实践

6 g  |! x. ?+ |3 s# l1 C

' d9 k% E8 \/ v9 L/ F; J6 ?; H; q
在DevOps的理念中,企业的IT价值链流转的速度越快,意味着企业的互联网产品的交付能力越强,这也意味着企业在同行业的竞争中,凭借IT能力的优势,能够收获更大的竞争优势。
1.png

% }+ h0 Z$ n3 [+ e9 I* i+ N' \

$ p. N6 M  H5 h4 K! i) H. N
腾讯公司诞生于互联网行业,以海量用户规模和设备规模著称社交网络业务,其DevOps的技术实践,主要由四大平台系统组成。
1.png
; g1 x( y1 r: `! o, b: \" d

, J7 I! a) d( G) j, d' c
四个系统共同组成DevOps流水线,腾讯的海量业务使用这套流水线系统可以轻松完成从需求设计、代码管理、开发测试、发布&运维的各阶段工作。
1.png
  • TAPD支持敏捷项目管理,实现产品需求与开发分支关联;
    5 }) }# G2 l& e

. @) v$ o+ |+ d, t+ F" c
  • TGit支持代码管理,通过webhook钩子触发持续集成系统的能力;

    $ D) ~5 p2 A8 h' u5 ~9 T- J

! b( k5 M, b$ E0 W$ [5 V* o

1 L. j6 |( \) w$ \- ?! T
  • CIS负责自动化完成编译、测试等任务,以输出制品库:软件包或docker镜像;
    ) v. T. m( S5 [3 ^

! H" y, x; n. v9 M% C/ \6 j' S3 T: o

' }: Y9 ~* K+ i! u' ?
  • 织云对接CIS获取制品,以自动化的方式完成业务的发布/变更任务。

    + m" ^9 Y7 c: O+ b
1.png
应用架构的可运维性0 Q3 C6 I" l/ x9 H- M+ ~7 A
对于互联网产品而言,发布仅仅只是开始,在持续为用户输出价值的运营过程,由运维团队和系统来保障服务的稳定可靠。以腾讯的应用架构实践案例,我们来看下腾讯业务对可运维性的定义。
. i5 z, k: B) o) h' T
0 }  g5 G8 g  f- i2 [
DevOps持续交付的八大原则对可运维性给出了这样的定义,在企业中研发和运维体系必然需要相互配合,开发团队负责功能性需求实现的同时,在架构和编码上注重非功能性需求的实现,测试团队与运维团队将围绕着各自职能的需求,规划与建设DevOps流水线中对应的工具系统,加速企业IT价值链的流转,以为企业创造更大的商业价值。
4 R. F  E# E( _  p, i

  ]; O+ a% S  W! j
1.png

" d8 O5 K0 ~2 {  L: g; T/ Q% ]' ?
/ y& N" a9 f" e4 e
有了持续交付方法论的支撑,我们认为要实现可运维性的过程可分为4个阶段:统一架构、运维规范、标准操作、运维自动化。
1.png

  v# P2 b4 K5 \. Q) ?$ |5 @
6 S2 S  l) l+ ^3 E+ w7 x; I
将互联网的业务架构抽象成为三层:接入层、逻辑层、数据层。
1.png
7 d7 u  C  G5 o. c

- R! _8 ]) P% t! U  R! ~: p" Q
并在业务架构的技术选型与规划时,遵循四个原则:框架化、组件化、无状态、分布式。
1.png

4 F2 |% q9 |" `4 c5 f3 i

) f) W2 f' p" Z/ b  H( X" m, Z6 }9 C
框架化的引入,可以有效的降低开发的工作量,通过有限的编码即可实现快速业务功能需求。如下图所述,对于常见的socket通讯型的C/S架构,由框架实现了网络的通讯,业务逻辑由动态库的方式加载到框架中,快速拼装出满足业务功能需求的软件程序。得益于框架的支持,可运维性诉求的非功能性的规范亦可被纳入框架中实现,如数据上报、统一日志、管理工具等。
1.png

( U0 y( k& X. {3 ]( h# [( Y
# V1 d2 a. k" Y/ N" ]
组件可以将共性的服务统一化,如腾讯内部大量应用的软件路由服务,帮助业务轻松实现负载均衡、名字服务、容错、过载保护、流量调度的功能特性。除了为业务解决了路由的难题,也使日常的运维管理变得更加简单高效。
1.png
3 B' B& O% S- ~% Q9 `8 B; r
- a- n% m0 E8 L* U! {( R& _, h6 [
通过对可运维性的思考,在统一规划与标准化的持续推进实践中,保障了腾讯的业务架构有序的发展,架构的演变从千人千面进化成千人一面。结合框架与组件的非功能规范的落地实现,将运维保障业务质量与效率的规划落实。
1.png
8 @% c7 R$ p' h4 t) p2 @

- p+ h. n- C. y6 I( W% C
* a: P4 ^0 f5 j7 L' }. i3 x
1 \. T6 [) l. q! v: Z! k
腾讯织云的持续部署实践

5 \" P+ v% T) }8 P3 o$ K0 a9 H  {6 F! b# @
要满足企业的长期发展,仅靠堆砌运维工具是不够的,必须体系化的、全局的考虑标准化、配置化、自动化、智能化的一体化运维管理系统。下图是腾讯运维平台——织云的功能规划,我们以此管理着腾讯社交网络海量的服务。
1.png
6 K" F9 G$ \1 |, I& U1 [* ]0 g, N

- I+ H: X( D2 I* ~. Y1 Z6 X- V1 ?3 F2 h
在运维的过程中,我们要面对很多复杂的运维对象,结合可运维性与非功能规范的要求可以很好的防止业务架构失控,但倘若要更好的管理这些运维对象,我们必须要做好配置管理。

! Q% _% r; I) w* R; g; q3 v, z
7 P6 O; h3 B  {
织云平台实践中,我们将标准化的运维对象配置化,以下图为例,每个微服务集群在织云CMDB中被定义成不同的模块名。模块可被划分为两大类配置属性:基础配置与应用配置。
1.png
2 M; N. |! `# I; Z
" X/ o6 m0 y, |1 p$ u) s' j% m
基础配置中的资产配置,可被用做资产核算、预算规划等;硬件配置可被用于虚拟化和机型规划等方面;分布信息会记录设备的上联交换机与IDC等信息,在优化机房穿越、网络设备故障的智能分析场景,可以提供很好的数据支持。

, [) y2 }8 \1 V, _3 X0 q

  G) _! @( e! E  E" q, V! ]/ [
应用配置中的资源配置,可对接镜像仓库或制品库,实现与发布/变更相关的运维对象关联,为自动化提供支撑数据;流程配置将工具或接口通过自定义编排实现操作流或工具链,让运维的工具收敛复用;变更记录提供了运维操作审计与联动监控数据的配置信息。
我们将运维日常关联生产环境的操作提炼如图:对资源的传输与执行。
. u2 x  t. r1 j/ {- B
- s/ N2 ^: @1 t3 _6 ?/ R
1.png
% x- D: ], `' w9 X3 P6 u% C
4 o( ]- M/ o$ e! J1 O! g
从统一规划、标准化、配置化、自动化到联动监控,用持续部署的流水线工具串行起来,我们将得到一个体系化的运维能力模型,基于此模型,运维团队能够全局规划持续部署的能力与工具系统。
1.png

9 T! ]( ^. u2 H

0 ^3 d7 f; t0 B, R
通过工具编排功能,自定义运维操作流程、工单审批流程、服务请求流程。并与CMDB的业务、负责人、状态等数据接口联动,解决运维操作与配置数据状态的协同的难题,实现从ITIL离线流程到线上自动化流程的技术升级。
1.png
$ A" O- u4 ~; V: K3 D# o6 e

4 l/ B9 {7 I2 J* B) D
以织云的自动化扩容流程为例,将原子运维工具或系统接口以运维的最优操作流程组织起来,自动化的完成扩容操作,并且保证每个步骤都会被严格执行到位,不会受个人的经验深浅或文档的新旧影响。从而解决运维团队“文档即过期,离职即消失”的难题。
1.png
: y# \. `, H5 p- F( d2 y. @- o
3 \3 ^' N+ f3 y
基于统一规划的运维体系,不仅能提升运维效率,同时对服务质量的保障也能有很多好处。如下案例是进程自愈的场景,结合CMDB的业务属性,通过自动化的流程完成配置注册,从而实现进程监控的自愈。
1.png
结束语# R- d* ]5 H. l- E
# S. u5 |5 Z, z4 S' ^. s
: M* e; O; K" ?: Y4 y
在腾讯多年的海量运营经验中,DevOps是贯穿整个应用软件生命周期的,发布完成并非终点,我们要全局思考、统一规划,为业务的健康发展打造一个标准有序的业务架构,和为业务提供一套完整体系化的运维解决方案。
& ~4 D) Z, p0 x3 o3 Z

0 i8 p3 }* ^, J. ^) j# u
1.png

7 d/ t" s7 X; q, s

7 u4 o8 a: L" M' B" e3 ^8 @4 c
原创:梁定安,腾讯织云负责人,目前就职于腾讯社交网络运营部,任运维技术总监,高效运维社区核心成员,开放运维联盟委员,腾讯云布道师,腾讯课堂运维讲师,复旦大学客座讲师。
: ^( }+ P- k/ D4 U# e1 P

4 o9 z2 s5 N0 M% ?, z- {' H0 ]+ ]8 H4 A0 w. u

本版积分规则

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1|网站地图

Baidu

GMT+8, 2019-7-17 04:50 , Processed in 0.214569 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表