DockOne微信分享(一零三):Kubernetes 有状态集群服务部署与管理


【编者的话】本次分享将深入介绍Kubernetes如何满足有状态集群服务对容器编排系统提出的新需求,包括如何使用Kubernetes的动态存储请求与分配机制来实现服务状态的持久化存储,以及与高效部署和运行有状态集群服务相关的Kubernetes新特性,如Init Container、PetSet (StatefulSet)等。最后通过一个MySQL集群实例详解在Kubernetes中如何轻松部署一个高可用的有状态集群服务并实现自动化管理。

在容器化时代,除了无状态的容器服务,比如Web服务器,用户也越来越多地使用容器部署有状态的应用,这就对容器编排系统提出了新的需求。

我今天要和大家分享的主题就是如何在目前主流的容器云平台Kubernetes 上部署和管理有状态集群服务。

这次分享的关键词有两个:一个是Kubernetes, 另一个是有状态集群服务。

我们会在第一部分了解一下什么是 Kubernetes,以及运行有状态集群服务面临的一些挑战

接下来的两部分我们会重点介绍 Kubernetes 是如何应对这些挑战,以及 通过哪些特性来解决有状态集群服务所特有的一些问题

最后一部分是实战,通过一个MySQL集群的例子来展示如何在Kubernetes上轻松地部署和管理一个有状态集群服务。

Kubernetes简介和运行有状态集群服务的挑战

首先来看什么是Kubernetes?
001.png

简单一句话来说,Kubernetes是一个运行和管理容器的平台。它在Docker、rkt等容器运行时之上,实现了容器的集群化和高可用。

Kubernetes简称K8S, 来自Google,支持多种云计算环境,并且100% 开源,是云原生计算基金会的一部分,用Go语言开发的。

这里是Kubernetes的一些基本概念
002.png

其中最核心的一个概念是Pod,它是Kubernetes对容器进行的封装,是Kubernetes管理的最小单位。

Pod通过Deployment来部署,Deployment会创建一个Replica Set 来保证Pod的个数始终是一个指定的值 。

Pod一般不直接对外提供服务,而是通过Service对外提供一个稳定的访问接口,一个Service后面可以挂多个Pod实例 。

Service是如何找到它匹配的Pod呢?靠的是Label。Label是联系各个Kubernetes资源的纽带。Replica Set 和它管理的Pod之间也是通过 Label 来关联的。

如果Pod里的容器运行的是有状态服务,如数据库与缓存等,还需要挂载存储卷,用于存储服务状态。

讲完原理,我们来看一个实例。
003.png

这是一个在Kubernetes集群里运行的容器化应用案例,这个应用有自己的Web 客户端,同时还从Twitter采集数据,处理完后存储到自己的DB。

可以看到容器里跑的服务有两类,无状态和有状态。像Web服务器,流处理器等无状态服务出现问题后,直接杀掉,新建一个,管理起来非常简单。

但是对有状态服务,像数据库,它要求有更长的生命周期。在一个集群的情况下,集群成员之间如何能保持稳定的成员关系?这都对容器编排系统提出了新的挑战。

那么Kubernetes是如何应对这些挑战的呢?

Kubernetes运行的服务,从简单到复杂可以分成三类:无状态服务、普通有状态服务和有状态集群服务。下面分别来看Kubernetes是如何运行这三类服务的。
004.png

首先无状态服务,Kubernetes使用RC(或更新的Replica Set)来保证一个服务的实例数量。通过Service来对外提供一个稳定的访问接口。

然后是普通有状态服务,它多了状态保存的需求。Kubernetes提供了以Volume和Persistent Volume为基础的存储系统,可以实现服务的状态保存。

最后是有状态集群服务,它又多了集群管理的需求。Kubernetes为此开发了一套以Pet Set为核心的全新特性,方便了有状态集群服务在Kubernetes上的部署和管理。

Kubernetes 存储系统

下面我们首先来看Kubernetes如何满足“状态保存”的需求。

Kubernetes的存储系统大致分为三个层次:普通Volume,Persistent Volume 和动态存储供应

对普通Volume,最简单的一种是“单节点存储卷”。它和Docker的存储卷类似,使用的是Pod所在Kubernetes节点的本地目录。
005.png

具体有两种,一种是 emptyDir,是一个匿名的空目录,由Kubernetes在创建Pod时创建,删除Pod时删除。

另外一种是 hostPath,与emptyDir的区别是,它在Pod之外独立存在,由用户指定路径名。

这类和节点绑定的存储卷在Pod迁移到其它节点后数据就会丢失,所以只能用于存储临时数据或用于在同一个Pod里的容器之间共享数据。

普通Volume的第二种类型是“跨节点存储卷”。这种存储卷不和某个具体的Kubernetes节点绑定,而是独立于Kubernetes节点存在的 。
006.png

跨节点存储卷由于可以在任何一个Kubernetes节点上都能够被访问到,比较灵活,所以应用比较广泛。

Kubernetes上的Volume是通过插件方式来实现的,所以可扩展性很强。
007.png

目前来说几乎所有主流的存储在Kubernetes上都有相应的插件来支持。如果已有的存储不能满足要求,还可以开发自己的volume插件 。

Kubernetes存储系统的第二种存储方式叫persistent volume。它和普通volume的区别是什么呢?

普通Volume和使用它的Pod之间是一种静态绑定关系,我们无法单独创建一个普通volume,因为它不是一个独立的Kubernetes资源对象。

而Persistent Volume 简称PV是一个Kubernetes资源对象,所以我们可以单独创建。它不和Pod直接发生关系,而是通过Persistent Volume Claim,简称PVC来实现动态绑定。

接下来我们看一下这个动态绑定过程是怎样的?
008.png

这是PV的生命周期,首先是Provision,即创建PV,这里创建PV有两种方式,静态和动态。

所谓静态,是管理员手动创建一堆PV,组成一个PV池,供PVC来绑定。动态方式是通过一个叫 storage class的对象由存储系统根据PVC的要求自动创建。

一个PV创建完后状态会变成Available,等待被PVC绑定。一旦被PVC邦定,PV的状态会变成Bound,就可以被相应的Pod使用。Pod使用完后会释放PV,PV的状态变成Released。

变成Released的PV会根据定义的回收策略做相应的回收工作。有三种回收策略,Retain、Delete 和 Recycle

Retain就是保留现场,Kubernetes什么也不做。Delete 策略,Kubernetes会自动删除该PV及里面的数据。Recycle方式,Kubernetes会将PV里的数据删除,然后把PV的状态变成Available,又可以被新的PVC绑定使用。

刚才提到PV的供给有两种方式,静态和动态。其中动态方式是通过StorageClass来完成的,这是一种新的存储供应方式。
009.png

使用StorageClass有什么好处呢?除了由存储系统动态创建,节省了管理员的时间,还有一个好处是可以封装不同类型的存储供PVC选用。

比如这里就有两个StorageClass,它们都是用谷歌的存储系统,但是一个使用的是普通磁盘,名字为slow。另一个使用的是SSD,名字为fast。
010.png

在PVC里通过annotation指定了storage class的名字为fast,这样这个PVC就会绑定一个SSD,而不会绑定一个普通的磁盘。

好,到这里Kubernetes的整个存储系统就都介绍完了。

Kubernetes有状态集群服务相关特性

下面进入Kubernetes与有状态集群服务相关的两个新特性。Init Container 和 Pet Set。

什么是Init Container?
011.png

从名字来看就是做初始化工作的容器。可以有一个或多个,这些 Init Container 按照定义的顺序依次执行,只有所有的Init Container 执行完后,主容器才启动。

由于一个Pod里的存储卷是共享的,所以 Init Container 里产生的数据可以被主容器使用到。

这是Init Container的一个使用样例。
012.png

这个例子创建一个Pod,这个Pod里跑的是一个Nginx容器,Pod里有一个叫workdir的存储卷,访问Nginx容器服务的时候,就会显示这个存储卷里的index.html 文件。

而这个index.html 文件就是通过一个 busybox的初始化容器获得的。

介绍完Init Container,千呼万唤始出来,该今天的主角Pet Set出场了。
013.png

什么是Pet Set?顾名思义是Pet的集合,那什么是Pet呢?它是一种需要特殊照顾的Pod。它有状态、有身份、当然也比普通的Pod要复杂一些。

具体来说,一个Pet有三个特征:
014.png

一是有稳定的存储,这是通过我们前面介绍的PV/PVC 来实现的。

二是稳定的网络身份,这是通过一种叫 Headless Service 的特殊Service来实现的。 和普通Service相比,Headless Service没有Cluster IP,用于为一个集群内部的每个成员提供一个唯一的DNS名字,用于集群内部成员之间 通信 。

Pet的第三个特征是序号命名规则。 比如 Pet Set 的名字叫 mysql,那么第一个启起来的Pet就叫mysql-0,第二个叫mysql-1,如此下去。

当一个Pet down 掉后,新创建的Pet 会被赋予跟原来Pet一样的名字,通过这个名字就能匹配到原来的存储,实现状态保存。

好,与有状态服集群服务相关的Kubernetes特性就介绍到这里。

实战:在Kubernetes上部署和管理MySQL集群

理论讲完了,下面进入实战,以Galera MySQL集群为例子,介绍如何在 Kubernetes如何上部署和管理一个有状态集群服务。

首先大致了解一下Galera MySQL。
015.png

它不是那种主从式的集群,而是多Master集群,通过 Galera Replication 把多个MySQL实例关联起来组成一个集群。由Galera Replication 负责节点间的数据同步。

用户访问时可以连接到任何一个节点进行读写操作。每次写入的数据会被Galera Replication同步到整个集群,才算写入成功。

节点之间没有数据延迟,在某个节点失效后,直接退出集群即可,无需失效转移。

对Galera MySQL集群有了基本了解后,我们来看看如何在Kubernetes上部署和运行它。这是整体结构图:
016.png

左边的Headless Service用于为每个MySQL Pet实例提供一个DNS名字,右边的PV池为MySQL提供存储 。

这里有两个初始化容器,第一个用于安装需要的文件,第二个做MySQL的初始化工作 。

一个Pet Set里有多个Pet,每个Pet对应MySQL集群里的一个节点。通过Pet Set可以管理整个MySQL集群。

这是部署MySQL集群具体的YAML文件。
017.png

右边是一个Headless Service,名字是galera。

左边是Pet Set,它用到了右边的Headless service。Replicas的数目为3,会创建3个Pet。

在 Pet Set 的annotation里定义了两个初始化容器。
018.png

Install容器安装的文件可以被bootstrap容器使用到;同时bootstrap容器生成的MySQL配置文件会放到config存储卷里,供后面的MySQL 容器使用。

这是主容器 Galera MySQL 的定义:
019.png

除了常规的3306端口外,它还暴露了其它一些端口,用于集群内部的数据同步和状态转移等操作。

这里MySQL启动参数里用到的文件,是在初始化容器里生成的,通过共享存储卷传递过来。

最后是数据存储卷的定义。
020.png

这里定义了三个存储卷,其中config、workdir就是简单的本地目录,而 datadir是一个PVC,它可以去绑定PV来存储MySQL数据库的数据 。

所以部署一个集群总共就需要两个YAML文件就可以了,一个Headless Service,一个 Pet Set。其中Pet Set里定义了初始化容器和存储卷。

用上面的方式部署完MySQL集群后,后面的运维工作是比较简单的。

假如某个集群节点由于某种原因Crash掉了,Kubernetes 会自动创建一个新的Pet来替代,实现自动恢复。

如果要扩容或缩容,也是一条命令、指定一下这个Pet Set 的Replicas的数目就行了。

如果要升级,只需要修改Pet Set 定义里 podTemplate 的image值,然后把老的Pet删除,新创建的Pet,就是最新版本的了。

对于在Kubernetes上部署有状态集群服务,我们补充两点:

第一点是在最新发布的 Kubernetes 1.5 里 PetSet 重新命名为StatefulSet。所以根据你使用的Kubernetes版本不同,可能看到的名字也不一样。

第二点是简单介绍一下时速云提供的有状态集群服务:数据库与缓存 。
021.png

如上图所示,这项服务最大程度的简化了有状态集群服务的创建工作,用户不再需要了解我们前面介绍的所有技术术语,只需要指定一下副本数目,存储的大小就可以了。

最后以下面这张图做为今天分享内容的总结。
022.png

有状态集群服务的两个需求,一个是存储需求。另一个是集群需求

对存储需求,Kubernetes的解决方案是Volume、Persistent Volume 。对PV,除了手动创建PV池外,还可以通过Storage Class来让存储系统自动创建。

对集群需求,Kubernetes的解决方案是Pet Set。Pet Set 又通过Init Container来做集群初始化,通过Headless Service来为集群成员提供稳定 的网络身份。

最后我们以MySQL集群为例,说明了如何在Kubernetes上部署和运行一个有状态集群服务。

目前有状态集群服务在Kubernetes上的部署还不是正式版,但完全可用。如果您的项目中有容器化的需求,可以尝试。

今天的分享到此结束,谢谢大家!

Q&A

Q: 前面提到Init Container,Kubernetes里Pod初始化是基于GCR的pause,这个初始化镜像是自定义的吗?

A:Init Container和GCR的Pause是不同的概念,一个是初始化容器(运行完就结束),一个是基础容器(一直运行)。
Q:你介绍的Kubernetes存储技术都是比较新的,能否适应企业生产大规模使用,有没有什么性能和稳定性问题?

A: 性能和稳定性上我们也在不断尝试,先使用起来看看效果,目前创建过几百个集群,暂时没有碰到太多稳定性问题。
Q:存储系统如何动态创建StorageClass,如果 Headless Service没有Cluster IP,服务如何调用?

A:Kubernetes通过StorageClass 让存储系统动态创建PV,不是动态创建StorageClass。Headless Service 用于集群内部通信,外部调用,再建普通Service,二者并存。
Q:有状态集群还有其他的实现方式吗?

A: 在容器云里比较好的方式是用PetSet,当然也能自己做,相当于自己实现PetSet的一些功能。
Q:同步到整个集群才算写入成功,是不是意味着不适合高负载的项目使用?有可能增加其它策略供选择吗?

A:由于采用多主方式,对外只写入一个,内部扩散同步可以并行,而且每个节点都能对外提供服务,相当于增加了服务带宽,所以性能不是问题。
Q:您好,你们是采用什么分布式存储的,io性能如何?好像一些开源分布式的存储写io的性能普遍比较低,能撑得住一些io高性能的应用吗?

A: 性能上要等到支持host 模式后,才能满足一些IO要求比较高的场景
以上内容根据2017年01月10日晚微信群分享内容整理。分享人张寿红,时速云架构师。从事软件研发工作十余年,目前从事基于Docker和Kubernetes的企业级容器云平台研发工作,主要包括容器服务、存储服务、CI/CD和镜像服务等。在加入时速云之前,先后在CA Technologies和Symantec担任Tech Lead和Principal Software Engineer。参与研发的软件产品有:企业数据保护软件、云平台上的服务管理系统、企业客户服务平台等。 DockOne每周都会组织定向的技术分享,欢迎感兴趣的同学加微信:liyingjiesz,进群参与,您有想听的话题或者想分享的话题都可以给我们留言。

1 个评论

mark

要回复文章请先登录注册