DockOne微信分享(六十八):应用容器env化实战


【编者的话】随着Docker技术的火热发展, Docker在代码构建发布中扮演着越来越重要的角色。Docker让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到流行的Linux机器上。Docker非常适用于如下场景:
  • 应用容器的自动化打包和发布;
  • 自动化测试和持续集成、发布;


这次主要和大家聊聊应用容器在配置管理中遇到的问题。首先是介绍现有容器常用的配置文件加载方式,接下来重点介绍数人云组件在自动化打包和发布遇到的问题和解决方法。

现有的主要Docker加载配置的方式

首先简单介绍下现有容器的加载配置文件的方式。

  • 挂载宿主机配置文件的方式
    通过docker run -v 参数将宿主机上的配置文件挂载到容器指定目录中如:
    docker run -v /myredis/conf/redis.conf:/usr/local/etc/redis/redis.conf --name myredis redis redis-server /usr/local/etc/redis/redis.conf

    这种方式对于单实例应用比较方便。

  • 下载配置中心文件的方式
    这种方法首先需要建立配置中心,例如用Nginx等Web服务组件,提前将配置文件放在指定目录,在Dokcerfile entrypoint中拉取配置中心文件的脚本,之后容器启动就自动拉取配置中心的配置。

  • 通过环境变量传入到容器中
    通过docker run -e 参数将将环境变量传入到容器如:
    docker run --name some-mysql -e MYSQL_ROOT_PASSWORD=my-secret-pw -d mysql:5.6


应用容器的自动化打包和发布中遇到的问题

数人云组件采用微服务架构,将服务拆分,分别采用相对独立的服务对各方面进行管理,彼此之间使用统一的接口来进行交流,架构变得复杂,但优势非常明显。为了保证高可用,这些容器一般都运行在多个VM上,服务实例前是一层诸如HAPROXY的负载均衡器,它们负责在各个实例间分发请求。数人云分测试、演示、生产三种环境进行持续集成、发布,同时数人云组件通过Docker+Mesos+Marathon进行应用容器的封装下发和管理。首先说下我们容器发布遇到的问题——配置文件多,如何进行统一的管理?

我们由于采用微服务架构,就产生了各个模块的配置,导致配置文件过多;其次数人云的三套环境,如MySQL等基础组件IP、Port等配置不同,导致配置成倍增加;最后采用高可用架构,也造成了配置文件的增多。 下面是数人云Mesos系统架构流程图:
1.png

Marathon、Jenkins作为Framework注册在mesos-master上,动态调度mesos-slave资源。
  • Marathon负责应用的发布
  • Jenkins负责代码打包、镜像构建


Mesos Framework截图如下:
2.png

若单纯-v的挂载方式需提前将配置文件放在mesos-slave所在的宿主机上,新加slave时也需进行相同的操作,且当配置文件需要更新时,需更新每台mesos-slave宿主机上的配置文件,这显然不够灵活,所以我们刚开始采用应用容器启动下载配置中心文件的方式。

早期的配置中心,如下图所示:
3.png

此时存在的问题有:
  • 因为是多种环境,虽然把这些配置都在Configserver上集中配置,但是需要手动修改这些配置。手动修改容易出错,例如Dev更新了一个服务,可能过了一周才会更新到生产环境。那个时候再去修改生产就很容易出错,导致无法运行。
  • 如果配置发生了Bug需要回滚,手动修改也是不合适的。


我们进行了改进,引进Jenkins后工作流程如下图:
4.png

我们用Jenkins把它们整体串起来,我们的第一个工作是把所有的配置文件抽象化,各种环境的文件抽象出来一个模板,放在GitLab上。它的数据是放在数据库里面,这样组合起来是一个完整的配置文件。各个环境的值是不一样的。 我们的运维平台触发Jenkins,Jenkins去调度我们的ConfigCenter API,它传入两个参数,一个是需要更新的环境,另一个是更新哪个服务。之后API去做对比,从数据库去读现有的配置文件的模板Tag,再去读新模板的Tag进行对比。

如果这个文件需要更新,把它从数据库拉过来,数据做匹配,渲染成我们最终的配置文件,再传到Gitlab上。剩下的通过Jenkins 触发 Configserver去调Gitlab下载最新的配置文件到Configserver服务器,Jenkins再去调用Marathon去重启服务,服务就会成功更新配置文件。 这很好解决了配置文件对应文件,但还是存在以下一些问题:
  • 配置格式不统一,配置有env 、congfig.js 、.yaml 、.xml 等配置文件,各种配置文件需要在应用容器发布前进行替换,当新增配置文件项时,需重新编写模版,替换匹配内容较为繁琐。
  • Marathon发布应用采用了配置文件的方式,在Marathon界面看不到配置文件的内容,需后台查看,增加了运维复杂度。


后来我们对应用进行env化改造,统一配置文件格式,且配置通过变量传递给Marathon,使得所有配置在Marathon界面上可见 。

以下是具体的工作,我们对开发进行了规约。

产品模块GitHub目录规约结构

除了代码和产品开发的一些文件外,还需要规约一下目录结构:
module_name -
          |
           - deploy -
                    |
                    - env  
                    |
                    - deploy-marathon.sh
                    |
                    - compile.sh
           |
            - dockerfiles -
                         |
                         - Dockerfile_compile_env
                         |
                         - Dockerfile_runtime

在GitHub中更新env文件,这个由开发提供维护,里面有对应env文件如下图:
5.png

改进后具体的流程图如下:
6.png

以上主要对配置文件进行env化,减少配置替换复杂度,将配置存在于Marathon发布脚本中。

更新后产生的marathon applist:
7.png

单个应用容器配置:
8.png

  • 采用env化有助于配置文件的统一维护和管理,新版Marathon很好的支持了应用的更新和回滚,除去了容器启动对静态配置文件的依赖,使应用容器更新发布、回滚更加方便。从界面上可以看到所有容器配置信息,使排错管理也变得方便。
  • 线下数人云企业版组件采用和线上相同的镜像和env变量,通过API获取对应版本的envfile和Docker镜像,之后将所有配置文件抽离到一个配置文件中,实施的同事只需修改这张配置文件,从而省去修改其他配置文件的步骤,使得实施过程更加简单。


以上就是数人云组件配置管理碰到的问题,以及env化解决方式,欢迎大家提出宝贵意见。

Q&A

Q:Mesos运行一个任务,如果发现该任务运行过程中需要加大资源,Mesos如何做到对任务资源的弹性扩容?如果采用Docker的话,是新建更多的Docker容器还是直接扩大现有Docker的大小?

A:一般是扩展更多的Docker容器个数,除非是某个任务有最小资源要求,才要扩大单个Docker的大小。
Q:开发人员使用的本地环境变量如何管理?例如一个应用,有数据库,有搜索引擎,还有两个Java APP,不同开发可能需要嗯环境不同,例如我是搜索功能的开发,需要链接公共的数据库,而有些开发需要自己有数据库,搜索引擎却需要链接公共的。这种配置,如何管理?

A:这种最好将数据库环境变了进行区分,配置两个或多个类似环境变量。
Q:请问MySQL数据库怎么随Docker迁移?备份和恢复有什么好的建议吗?

A:MySQL现在是固定主机主从同步,没有对MySQL做迁移,我们的数据现在备份是定时全备份,正在尝试使用MariaDB集群Galera Cluster ,但还没有上生产,当然有共享存储的话就最好不过啦。
Q:请问线上服务更新war包,如何能使对外服务不间断吗?

A:数人云目前采用代码版本和镜像版本统一,对外服务不间断,数人云目前的做法是对应用进行无状态改造,后通过marathon put更新容器。
Q:请问 配置文件的话生产环境和开发环境怎么区分?

A:生产环境和测试环境都是隔离的,配置文件配置不同的参数即可。
Q:请问对类似Java应用jdbc、spring.xml等配置文件如何管理?

A:XML配置 通过sed替换传入的环境变量。
Q:生产上配置项变更怎么操作?

A:生产配置的值需要修改时 ,在configcenter页面中修改,再触发Jenkins更新配置文件的job, 生产新的配置文件 ,再调用marathon API 更新task进行更新。
Q:业务的配置是和环境配置放在一起的么?

A:是的,都是通过envfile进行统一的。
Q:请问你们针对应用弹性扩展是自感应的吗?如果是,请问是基于什么策略做的,监控报警还是什么?

A:数人云是通过监控报警触发弹性扩展的,如监控接口返回的时间,容器内存使用率等。
Q:请问你们对环境变量是采用什么样的管理方法?有相应的命名规范吗?环境变量多了,会出现管理方面的问题吧。

A:环境变量键值由开发维护,运维需要提前了解新增环境变量,目前在配置中心里维护,容器环境变量变量命名规范很重要,我们目前采用服务名+需连接的组件名+属性 进行命名的,且环境变量全部大写。
以上内容根据2016年7月14日晚微信群分享内容整理。分享人方志浩,92年的程序猿,毕业之后一直在数人云,对 Docker 和 Mesos 有深入研究,目前做数人云平台打包部署以及部分客户项目实施工作,喜欢在实践中尝试新事物并总结。 DockOne每周都会组织定向的技术分享,欢迎感兴趣的同学加微信:liyingjiesz,进群参与,您有想听的话题或者想分享的话题都可以给我们留言。

0 个评论

要回复文章请先登录注册