请选择 进入手机版 | 继续访问电脑版

IT运维管理,ITIL,ITSS,ITSM,ISO20000-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

艾拓先锋
搜索
查看: 317|回复: 0

腾讯织云的DevOps流水线应用平台践行之路

[复制链接]
来自- 湖南

参加活动:0

组织活动:0

发表于 2018-10-11 16:46:02 | 显示全部楼层 |阅读模式 来自- 湖南
本帖最后由 adminlily 于 2018-10-11 16:48 编辑
% e& [9 h5 T4 o+ M0 u
4 A" }. ]6 b. q% o$ [前言
1 v3 O! p7 `$ ?# T8 I- E
7 D$ f. K8 g7 W1 b9 ]  o
国家的“互联网+”战略开启了一个企业业务与互联网相结合的新业务形态,有越来越多的企业将自己的业务以互联网为媒介对外输出。任何一款互联网产品都会经历从产品的规划与设计、开发的功能实现、测试的度量验收、运维的发布交付,也是常常被成为企业的IT价值链的全流程,将产品输出个最终的用户,以产生商业价值。
/ ^9 t" D2 b: W8 N- K% g, ]
. l: `. Z# B* h- L3 u4 G# e5 s3 m  w5 C: u
腾讯的DevOps实践

1 G  P) J4 F) ~" N/ p8 Z: |$ ~
5 O9 ^& Y; D1 [6 R% p* J5 [9 V) F+ E
在DevOps的理念中,企业的IT价值链流转的速度越快,意味着企业的互联网产品的交付能力越强,这也意味着企业在同行业的竞争中,凭借IT能力的优势,能够收获更大的竞争优势。
1.png

9 N, Y! ?- I- h8 H( @% ]/ i4 ^
/ K0 R/ n- u% P
腾讯公司诞生于互联网行业,以海量用户规模和设备规模著称社交网络业务,其DevOps的技术实践,主要由四大平台系统组成。
1.png

# a# L/ \( R$ @1 N# y8 U* T

& g- j8 `3 B$ p
四个系统共同组成DevOps流水线,腾讯的海量业务使用这套流水线系统可以轻松完成从需求设计、代码管理、开发测试、发布&运维的各阶段工作。
1.png
  • TAPD支持敏捷项目管理,实现产品需求与开发分支关联;

    + v3 [. N1 a9 C) d. s$ l# |" z

& e. @% R# |# ?4 M* J- @2 @! l
  • TGit支持代码管理,通过webhook钩子触发持续集成系统的能力;

    0 f3 i' E8 A2 m9 o1 F) `9 |) P

4 Z1 u) d! {) {' s5 W8 x' F' ?

" x( D/ V% J$ h2 R
  • CIS负责自动化完成编译、测试等任务,以输出制品库:软件包或docker镜像;

    ( K0 |9 J% O: \9 ]4 t; B

+ n9 Q1 I4 l5 ?5 d

# ?8 e; n) f0 J5 s1 H7 s+ S- y
  • 织云对接CIS获取制品,以自动化的方式完成业务的发布/变更任务。
    . L3 A) ]/ j; n+ ?
1.png
应用架构的可运维性
) z1 L! T, t7 f3 R6 S+ U. _; B1 ]
对于互联网产品而言,发布仅仅只是开始,在持续为用户输出价值的运营过程,由运维团队和系统来保障服务的稳定可靠。以腾讯的应用架构实践案例,我们来看下腾讯业务对可运维性的定义。
7 [8 U% P( d( E% k/ `$ q4 ]

) M1 G# H3 ^' G; C" U1 d
DevOps持续交付的八大原则对可运维性给出了这样的定义,在企业中研发和运维体系必然需要相互配合,开发团队负责功能性需求实现的同时,在架构和编码上注重非功能性需求的实现,测试团队与运维团队将围绕着各自职能的需求,规划与建设DevOps流水线中对应的工具系统,加速企业IT价值链的流转,以为企业创造更大的商业价值。

& d) L+ _" q+ C; @8 r

7 @3 n) p9 S: F
1.png

& |& |. l/ I" d$ J% @* |
+ u  F0 `% C& m  {( X+ C
有了持续交付方法论的支撑,我们认为要实现可运维性的过程可分为4个阶段:统一架构、运维规范、标准操作、运维自动化。
1.png
1 v3 i+ b- u& ^) F2 |

# M9 I6 f, w; ]' V9 {" K) ^
将互联网的业务架构抽象成为三层:接入层、逻辑层、数据层。
1.png
: F0 W- c2 e! U
& t; L) D. i% X
并在业务架构的技术选型与规划时,遵循四个原则:框架化、组件化、无状态、分布式。
1.png

# i  {! B7 P5 i; L& j3 g
, V' C+ V1 ^2 G  \+ a
框架化的引入,可以有效的降低开发的工作量,通过有限的编码即可实现快速业务功能需求。如下图所述,对于常见的socket通讯型的C/S架构,由框架实现了网络的通讯,业务逻辑由动态库的方式加载到框架中,快速拼装出满足业务功能需求的软件程序。得益于框架的支持,可运维性诉求的非功能性的规范亦可被纳入框架中实现,如数据上报、统一日志、管理工具等。
1.png
$ K; ^- y: R: R. o, {/ p

+ G5 h" D: M: Q& V  v' A0 x8 ~
组件可以将共性的服务统一化,如腾讯内部大量应用的软件路由服务,帮助业务轻松实现负载均衡、名字服务、容错、过载保护、流量调度的功能特性。除了为业务解决了路由的难题,也使日常的运维管理变得更加简单高效。
1.png
4 d2 ~# p4 z; _/ X

# n! B2 P- K2 @; W* s+ K3 \* d& |
通过对可运维性的思考,在统一规划与标准化的持续推进实践中,保障了腾讯的业务架构有序的发展,架构的演变从千人千面进化成千人一面。结合框架与组件的非功能规范的落地实现,将运维保障业务质量与效率的规划落实。
1.png
1 A: Z+ U9 R0 T' z6 z0 R# n& l

+ v; S4 E& z* A5 c, h
7 D: ~1 Q* U% ?
. b9 U# @) Y/ P5 V
腾讯织云的持续部署实践

% @' |- S. x6 [1 k% c) d6 {  j) g1 Z
, ~( N. C& Z7 Y8 Y  e
要满足企业的长期发展,仅靠堆砌运维工具是不够的,必须体系化的、全局的考虑标准化、配置化、自动化、智能化的一体化运维管理系统。下图是腾讯运维平台——织云的功能规划,我们以此管理着腾讯社交网络海量的服务。
1.png

- n* O6 ?' O3 y7 c  b, k7 c6 _
6 x4 f" \$ ?# {4 K, e. i
在运维的过程中,我们要面对很多复杂的运维对象,结合可运维性与非功能规范的要求可以很好的防止业务架构失控,但倘若要更好的管理这些运维对象,我们必须要做好配置管理。
) c( N% w1 a  m0 p8 `% V- o. g" h

$ j9 y" m3 l$ J" L. I
织云平台实践中,我们将标准化的运维对象配置化,以下图为例,每个微服务集群在织云CMDB中被定义成不同的模块名。模块可被划分为两大类配置属性:基础配置与应用配置。
1.png

) Q5 @" e2 T; a: [
5 H; F8 M- |6 N0 R6 n
基础配置中的资产配置,可被用做资产核算、预算规划等;硬件配置可被用于虚拟化和机型规划等方面;分布信息会记录设备的上联交换机与IDC等信息,在优化机房穿越、网络设备故障的智能分析场景,可以提供很好的数据支持。
( q# T& M! Z/ \; t+ J6 }

$ r' k. u. \1 Z) U; t
应用配置中的资源配置,可对接镜像仓库或制品库,实现与发布/变更相关的运维对象关联,为自动化提供支撑数据;流程配置将工具或接口通过自定义编排实现操作流或工具链,让运维的工具收敛复用;变更记录提供了运维操作审计与联动监控数据的配置信息。
我们将运维日常关联生产环境的操作提炼如图:对资源的传输与执行。

1 \) w9 p7 O% i; g- x

9 t; G( [. {  _' A5 H
1.png
7 J% D0 O3 A" V2 z" Q6 F

3 N% ]* Z+ d  ^6 x9 w/ y
从统一规划、标准化、配置化、自动化到联动监控,用持续部署的流水线工具串行起来,我们将得到一个体系化的运维能力模型,基于此模型,运维团队能够全局规划持续部署的能力与工具系统。
1.png

( E; b. c* s$ J# o) k) ]
6 e4 u) H9 s. |3 p* S; n; y% u) @" I
通过工具编排功能,自定义运维操作流程、工单审批流程、服务请求流程。并与CMDB的业务、负责人、状态等数据接口联动,解决运维操作与配置数据状态的协同的难题,实现从ITIL离线流程到线上自动化流程的技术升级。
1.png
) Y! O/ |' R$ O9 ~' c# p0 Z8 x
3 |2 M, W" e) M5 _7 B0 a' y
以织云的自动化扩容流程为例,将原子运维工具或系统接口以运维的最优操作流程组织起来,自动化的完成扩容操作,并且保证每个步骤都会被严格执行到位,不会受个人的经验深浅或文档的新旧影响。从而解决运维团队“文档即过期,离职即消失”的难题。
1.png
% A7 W9 V) B5 V0 P

' f# T8 l: X5 O0 y2 Z' E2 v
基于统一规划的运维体系,不仅能提升运维效率,同时对服务质量的保障也能有很多好处。如下案例是进程自愈的场景,结合CMDB的业务属性,通过自动化的流程完成配置注册,从而实现进程监控的自愈。
1.png
结束语
7 h8 J/ a  h" g9 @7 }- n1 n5 I3 a0 P7 k
) h! M6 w8 y# k: Y( P  f3 ~
在腾讯多年的海量运营经验中,DevOps是贯穿整个应用软件生命周期的,发布完成并非终点,我们要全局思考、统一规划,为业务的健康发展打造一个标准有序的业务架构,和为业务提供一套完整体系化的运维解决方案。
) ~$ |- f! J1 |
- _# D6 K/ T& `/ E, Z. `" _! Y
1.png
+ {! z0 g: J7 p) I$ J

- d# Y3 X7 ^3 s6 H, V% a' b
原创:梁定安,腾讯织云负责人,目前就职于腾讯社交网络运营部,任运维技术总监,高效运维社区核心成员,开放运维联盟委员,腾讯云布道师,腾讯课堂运维讲师,复旦大学客座讲师。

3 q8 }5 e; T6 X' C- y" L+ w) l

5 B% j. K  V$ J4 e6 t
( S, w' r/ M2 s( r1 R

本版积分规则

选择云运维时代的王牌讲师-长河老师,助你轻松入门ITIL Foundation培训课程

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1|网站地图

Baidu

GMT+8, 2019-3-20 03:29 , Processed in 0.202905 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表