我在Mesos上运行Docker容器的经验


【编者的话】下面的这篇博客出自John Omernik之手,他是Big Data Analytics的Data Enthusiast和VP,还是Zions Bank的Fraud Center of Excellence的经理,Zions Bank是家顶级的金融服务公司。在这篇博客中,作者分享了他是怎么利用新技术如Mesos和Docker来使用MapR文件系统的,并编写了一个可以简化流程的脚本。

我的技术栈

正如在此博客中我所写到的,我想和你分享我如何在一个单集群中使用Docker容器来运行分析作业。我们在Zions研究这个技术(当然,我也会在家运行它),该技术是在MapR平台和MapR-FS之上运行的Apache Mesos。我的目标是尝试构建一个无处不在的计算平台。为了分析,我运行了Spark和Myriad(运行MapR和该领域的其他技术的话会产生较大的开发工作量)。我用Myriad来运行MapReduce作业。我将Kafka和Storm同时运行于Mesos,与MapR文件系统一起使用,或跟当前环境协同使用。
apache-mesos-logo.jpg

当在Mesos上运行Docker容器时,MapR会提供了极大的帮助。有一个例子是我在Docker内部运行的服务,这个服务是Hive metastore服务。因为Hive metastore需要一个关系型数据库来持久化表的元数据,其需要我同时部署一个MySQL服务实例。我在一个基于Mesos的Docker内通过Marathon来发布该实例,而不是在集群之外的独立服务器上部署MySQL。由于MySQL存储的数据非常重要,我想确认如果容器崩溃或其宿主机死掉,Marathon是否可以创建新的容器并接管其离线的所有完好的数据。MapR-FS的NFS功能可以很容易实现这点,因为它有随机读写的能力并且能为一个数据库维持负载的高性能。

利用MapR文件系统

一个需要我解决的问题是当一个MySQL数据库被启用,需要对数据库文件进行独占访问。我想要预防另一个Docker容器的意外启动,而产生对数据库文件的访问,这是因为如果你想要你的数据库文件保持完整性,那么有两个MySQL实例访问相同的文件将不是一个好事。所以我对这个问题进行了深入研究,并同Ted Dunning和Keys Botzum在MapR上开始了研究,我请教他们,“我如何使用一个锁?” 尽管从传统的Unix角度看,MapR NFS不支持锁定,但MapR却支持启用锁定的文件系统标准,这种锁定是通过创建目录和新建文件来启用。

听取了他们的建议,我写了一个脚本,实现了锁定模式,这种模式允许可靠的持久性数据存储。这就意味着别人也可以从中获得好处,所以我将该脚本分享于此。

这里分为两部分,第一部分是,“我想lock文件并且让其成为独占式的”。这里并不支持,但另一方面,MapR却支持 semantics,它能够创建一个目录并且是唯一一个能够创建该目录的,这也是我在该脚本中所使用的。我想能够创建一些东西,这样我的Docker容器可以检测到并且说,“有其他人正在使用这个数据,我需要关闭。”我的脚本可以阻止拥有两个不同的MySQL实例或Hive Metastore在我的集群之上运行,但我仍然有能力在我的集群的任意节点运行MySQL。这里对其运行在哪没有任何限制。 Mesos社区尝试去解决该问题,其中一种方式是将数据持久化到不同的框架上——所以你可以使用该数据块——并且包含在未来的版本中。但MapR拥有高性能的文件系统,而且在我的所有节点上都可用,因此我想更好的利用它。

为Docker容器处理文件系统锁而写的代码

基本上讲,这段代码就像一个垫片,我调用该代码而不是启用我期望在Mesos中直接启用的任何进程,该代码会检测每个我设定的特定目录。例如,如果是MySQL或Minecraft Docker容器,它会针对每个容器检测一个单独的地址。我的Minecraft服务器在MapR-FS中有一个地址;这正是其检测并决定是否它可以在该目录上拥用一个独占锁并运行。如果它不能够这样做——它发现有些进程也对该目录上锁,它会知晓它不能够运行并关掉该容器。这就保证了我不会有多于一个的 相同类型的Docker容器。我不想两个Minecraft服务器运行,因为他们将工作在相同的数据之上,因而导致文件损坏。

这里是我为Docker容器处理文件系统锁而写的代码:
#!/bin/bash

#The location the lock will be attempted in 
LOCKROOT="/minecraft/lock"
LOCKDIRNAME="lock"
LOCKFILENAME="mylock.lck"

#This is the command to run if we get the lock. 
RUNCMD="./start.sh"

#Number of seconds to consider the Lock stale, this could be application dependent. 
LOCKTIMEOUT=60
SLEEPLOOP=30

LOCKDIR=${LOCKROOT}/${LOCKDIRNAME}
LOCKFILE=${LOCKDIR}/${LOCKFILENAME}

if mkdir "${LOCKDIR}" &>/dev/null; then
echo "No Lockdir. Our lock"
# This means we created the dir!
# The lock is ours
# Run a sleep loop that puts the file in the directory
while true; do date +%s > $LOCKFILE ; sleep $SLEEPLOOP; done &
#Now run the real shell scrip
$RUNCMD
else
#Pause to allow another lock to start
sleep 1
if [ -e "$LOCKFILE" ]; then
    echo "lock dir and lock file Checking Stats"
    CURTIME=`date +%s`
    FILETIME=`cat $LOCKFILE`
    DIFFTIME=$(($CURTIME-$FILETIME))
    echo "Filetime $FILETIME"
    echo "Curtime $CURTIME"
    echo "Difftime $DIFFTIME"

    if [ "$DIFFTIME" -gt "$LOCKTIMEOUT" ]; then
        echo "Time is greater then Timeout We are taking Lock"
        # We should take the lock! First we remove the current directory because we want to be atomic
        rm -rf $LOCKDIR
        if mkdir "${LOCKDIR}" &>/dev/null; then
            while true; do date +%s > $LOCKFILE ; sleep $SLEEPLOOP; done &
            $RUNCMD
        else
            echo "Cannot Establish Lock file"
            exit 1
        fi
    else
        # The lock is not ours.
        echo "Cannot Estblish Lock file - Active "
        exit 1
    fi
else
    # We get to be the locker. However, we need to delete the directory and recreate so we can be all atomic about
    rm -rf $LOCKDIR
    if mkdir "${LOCKDIR}" &>/dev/null; then
        while true; do date +%s > $LOCKFILE ; sleep $SLEEPLOOP; done &
        $RUNCMD
    else
        echo "Cannot Establish Lock file - Issue"
        exit 1
    fi
fi
fi
#End

在MapR上运行开源软件:支持的非常好

有些人可能会因为使用一个“混合体”如MapR而担忧。我的意思是你想要运行的大部分工具都将成为开源软件,当然文件系统不会。这正是对开源社区一些人的挑战,因为有些人会想,“我想运行Spark;我想运行如Mesos这样的程序,如果我同时想运行其他的程序如MapR,谁会给我提供支持?谁会帮助我让它运行起来?如果我在标准的Apache HDFS上运行, 从社区的角度上来讲,很多人将会获得帮助。”这正是人们的恐惧之一(当开源与闭源捆绑使用)。

但我所发现的例子是,MapR可通过资源如answers.mapr.com,也可以通过直接交互与社区很好地融合,如果这里有些事情我不能解决是因为我所需要的代码不存在,MapR总是乐于和我一起工作并帮助我了解将会发生什么。

给那些想在MapR之上运行Mesos和Docker的人们一些建议

最开始确定给予MapR大量的资源,然后把剩下的资源给Mesos。当前, 我倾向于“一半一半”,因为我没有官方安装包,我仅仅是安装了MapR和Mesos,然后讲,“不错,一起运行的很好。”事情已经运作良好,但是我可以直观看到冲突,这取决于我如何调用资源。MapR正在解决某些问题,在不久的将来他们尝试动态的在MapR和Mesos之间合理利用资源。

其他在MapR上使用Mesos的有趣项目

我可以在这里很容易的讲出针对一些科目的议题!我目前所做的与其相关的一些东西非常有趣——在集群上从运行MySQL数据库到运行我孩子的Minecraft服务器,我可以做任何事情。我发现了一件非常神奇的事情——它真的可以做任何事情。我的孩子们非常喜欢它。在VM中运行Minecraft服务器和在集群中的Docker里运行之间没有任何问题。所有的Minecarft世界的数据是通过NFS服务保存于MapR-FS。对于我来说,其真正解决了一个问题,因为MapR能够做到其他技术做不到的一些事情。我不知道HDFS上的文件如何做的随机读写;我并不知道如何在HDFS中运行Minecraft——但我能够用MapR-FS来实现。

正如我所提到的,我正在通过Mesos,使我个人的家庭网络运行于MapR上,因为这里有很多有趣的方式来使用它。当然,很少有人会做该层面的集成。我这样做了,是因为这可以让我了解MapR和Mesos是如何一起工作的。同时,我使用一个开源的基于linux的DVR,叫做MythTV,它可以让你能够录 TV。 我现在将它运行在一个VM里,并且我的目标是尝试将它运行于我的集群中的Docker里,仅仅是尝试看我是否能够实现。

我非常享受使用技术比如基于MapR的Mesos和Docker,并且我期望你会发现我为持久化Docker存储而写的这段代码非常有用。

原文连接:My Experience with Running Docker Containers on Mesos(翻译:张明峰 审校:魏小红)

================================================
译者介绍
张明锋,数人科技资深DevOps,infrastructure工程师。专注于分布式系统和IDC(系统,网络,存储等)架构。对系统、数据库、网络、存储有深刻了解。日常开发使用Golang、C、C++、Python、Shell。

720.png

2 个评论

看着很有趣的样子,要自己玩下
这个我翻译的时候也有同样地相关想法,但是如果利用NFS作为共享挂载点又有数据量上来后性能不足的问题。

要回复文章请先登录注册