Apache OpenWhisk架构概述


【编者的话】Apache OpenWhisk是一个开源FaaS平台。现在,AWS Lambda是FaaS最流行的实现。 在开源组件的选择中,OpenWhisk是最好的选择。OpenWhisk是一个健壮的、可扩展的平台,支持数千并发触发器和调用。这篇文章将探索OpenWhisk设计和架构,识别各种组件及其作用,可以帮助我们更好的了解分布式系统和serverless平台。

【3 天烧脑式 Docker 训练营 | 上海站】随着Docker技术被越来越多的人所认可,其应用的范围也越来越广泛。本次培训我们理论结合实践,从Docker应该场景、持续部署与交付、如何提升测试效率、存储、网络、监控、安全等角度进行。

Apache OpenWhisk是一个由IBM和Adobe驱动的开源项目,它是一个健壮的FaaS平台,可以部署在云或数据中心内。相比其他serverless项目,OpenWhisk是一个健壮的、可扩展的平台,支持数千并发触发器和调用。

你可以使用Bluemix托管版本的OpenWhisk或在自己的开发机器上部署基于Vagrant的OpenWhisk环境。在本文中,我们将探索OpenWhisk的设计和架构,识别各种组件及其作用。

要获得最佳的指南,建议在自己的机器上部署基于Vagrant的OpenWhisk环境。OpenWhisk的CLI,wsk应该配置本地的设置。

架构的快速回顾

Apache OpenWhisk旨在作为异步和松耦合的执行环境,可以基于外部触发器运行功能。开发人员编写独立的功能,作为操作上传,完全独立于事件源。事件源通过必不可少的正确的参数集调用操作。

一旦操作就位,开发人员就可以创建触发器。触发器是事件源显式调用端点,事件源如:数据库、流处理引擎、文件系统和业务应用程序等。一个操作独立于触发器,这意味着触发器可能或可能没有任何操作绑定。当事件源触发一个触发器时,可能不知道被调用的操作。绑定到触发器的操作集只在运行时被发现和执行。

但是,开发人员如何使用触发器绑定操作?这就出现了规则。规则作为触发器和操作之间的粘合,在触发器和操作之间创建松耦合的关联。该设计模式使得相同的操作可以被不同的触发器调用。
c62548ae-ow-arch-1.png

这种松耦合的架构使OpenWhisk成为可扩展、可靠和强大的无服务器平台。 执行的每个层都被设计成独立扩展。

操作、规则和触发器可以通过REST端点创建和管理。 事件源调用一个操作所需要做的就是调用触发器的REST API。

下面是演示的工作流程,突出了创建和调用代码的简单而强大的机制:
$ cat > hello.js << EOF

function main() {

console.log('Hello World');

return {msg: 'Hello World'};

}

EOF

$ wsk -i action create helloAction hello.js

ok: created action helloAction

$ wsk -i trigger create helloTrigger

ok: created trigger helloTrigger

$ wsk -i rule create helloRule helloTrigger helloAction

ok: created rule helloRule

$ wsk -i trigger fire helloTrigger

ok: triggered /guest/helloTrigger with id 350364de139547ba8c95113ef0908911

OpenWhisk的构建模块

现在来看看OpenWhisk的核心组件。

下图描绘了OpenWhisk的架构。 从Nginx到Kafka到Docker,这个serverless平台使用多种技术。
2ae03e6a-ow-arch-2.png

通过访问Vagrant Box,使用SSH去检查运行的Docker容器和拉取的图像:
$ docker ps --format "{{.Names}} - {{.Image}}"

wsk0_425_warmJsContainer_20170202T014345371Z - whisk/nodejs6action:latest

wsk0_424_warmJsContainer_20170202T014153330Z - whisk/nodejs6action:latest

nginx - nginx:1.11

invoker0 - whisk/invoker:latest

controller - whisk/controller:latest

kafka - ches/kafka:0.10.0.1

zookeeper - zookeeper:3.4

registrator - gliderlabs/registrator

consul - consul:0.7.0

couchdb - couchdb:1.6

前两个容器代表最近被调用的操作,而其他容器则直接映射到核心组件。下面让我们了解每个组件的作用。

Nginx

这个开源Web服务器暴露HTTP(S)端点给客户端。它主要用做API的反向代理以及终止SSL连接。每个进入OpenWhisk基础架构的请求,包括那些源自wsk CLI的请求,都通过该层。由于它是完全无状态的,所以Nginx层可以轻松扩展。

控制器

在通过反向代理的请求之后,会触发控制器,该控制器充当系统的守门员。在Scala中,该组件负责OpenWhisk API的实际实现。在将控件交给下一个组件之前,它会执行每个请求的身份验证和授权。控制器被认为是系统的协调者,它将决定请求最终采取的路径。

CouchDB

系统的状态在CouchDB(一个开源JSON数据存储)中进行维护和管理。凭证、元数据、命名空间以及操作、触发器和规则的定义存储在CouchDB中。控制器根据存储在此数据库中的凭证识别凭证。

可以通过访问http://192.168.33.13:5984/_utils/(链接仅在开发者机器上使用)从浏览器访问数据库。
69e516f6-ow-arch-couchdb.png


查看创建的初始的操作、触发器和规则集http://192.168.33.13:5984/_uti ... hisks
71f7db81-ow-arch-couchdb-1.png

helloAction的源代码也保留在CouchDB中,包括操作的定义、默认参数和所分配的资源配额:
c34793cc-ow-arch-couchdb-2.png

OpenWhisk中的每次调用都会导致一个激活,它包含Action的输出。 例如,以下命令异步调用helloAction导致新的激活ID:
$ wsk -i action invoke helloAction

ok: invoked /guest/helloAction with id 8004746e06f147b99c1e8b0be875ec64

The output of this invocation can be retrieved through the following command.

$ wsk -i activation get --summary 8004746e06f147b99c1e8b0be875ec64

activation result for /guest/helloAction (success at 2017-02-02 08:01:46 +0530 IST)

{

"msg": "Hello World"

}    

如下是存储在CouchDB中的输出。
c2e16397-ow-arch-couchdb-3.png

Consul

OpenWhisk、Kubernetes和Swarm这样的现代分布式计算平台依靠分布式键/值存储进行状态管理。 OpenWhisk使用Consul作为系统每个组件可访问的单一数据源。 同时,consul还提供服务发现功能,使控制器发现调用操作的实体。 这些实体被称为调用者(Invokers),它们直接负责执行代码。 Consul拥有可用的调用者及其健康状况清单。

Consul支持注册者Registrator,注册者可以观看新的Docker容器,并检查他们,决定他们提供的服务。 当Docker引擎创建一个新的容器时,注册者会收到被推入Consul的事件。

当Controller需要将操作委派给调用者时,它会在Consul列表中查找合适的候选人。

Consul的UIhttp://192.168.33.13:8500/ui/#/dc1/services
02249ef4-ow-arch-consul.png

查看可用的调用者:http://192.168.33.13:8500/ui/#/dc1/kv/invokers/
c7b91496-ow-arch-consul-1.png

Kafka

Apache Kafka通常用于构建实时数据管道和流应用程序。它支持需要可靠、高速数据摄取的生产工作负载。 OpenWhisk利用Kafka连接控制器和调用者。

kafka缓存由控制器发送的消息,然后再将它们传递给上节的Consul的调用者。当kafka确认消息被传递时,控制器立即用激活ID进行响应。这种无状态架构使OpenWhisk具有高度可扩展性。

Apache ZooKeeper维护和管理Kafka集群。 Zookeeper的主要工作是跟踪Kafka群集中存在的节点的状态,并跟踪主题、消息和配额。

调用者(Invoker)

调用者使用Scala实现,调用者是处理执行过程的最后阶段。基于运行时的要求和配额分配,会自动创建一个新的Docker容器,作为所选操作的执行单位。 调用者从CouchDB复制源代码,并将其注入Docker容器。一旦执行完成,它将激活的结果存储在CouchDB中,以便将来检索。 调用者决定重新使用现有的“热”容器,或启动一个暂停的“暖”容器,或启动一个新的“冷”容器进行新的调用。它会查询Conusl的容器状态以进行适合的调用。

可能有多个调用者取决于平台的负载和利用率。

根据元数据,调用者会选择要使用的容器图像。以下是调用helloAction的两个容器。
$ docker ps --format "{{.Names}} - {{.Image}}"| grep "JsContainer"

wsk0_457_warmJsContainer_20170202T035154330Z - whisk/nodejs6action:latest

wsk0_456_warmJsContainer_20170202T035037341Z - whisk/nodejs6action:latest   

Docker

Apache OpenWhisk建立在一些开源技术基础上,Docker起着非常重要的作用。 几乎所有的OpenWhisk组件都打包和部署为容器。 从Nginx到kafka到consul,平台运行都是容器。可以通过Docker hub查询OpenWhisk镜像列表。

即将到来:API网关

虽然没有完全集成,OpenWhisk也有一个内置的API网关负责暴露操为HTTP端点。 基于Openresty的Nginx,此项目是由Adobe维护的开源项目。 目前这种能力是可用的实验功能,以下命令显示了可能的选项:
$ wsk -i api-experimental

work with APIs

Usage:

wsk api-experimental [command]


Available Commands:

create      create a new API

get         get API details

delete      delete an API

list        list APIs

总结

OpenWhisk是一个吸引人的项目去了解分布式系统和serverless平台。 感谢IBM和Adobe捐赠到Apache基金会,鼓励社区参与。 最近,尽管许多开源serverless平台如雨后春笋般涌现,而OpenWhisk以健壮的架构和设计的脱颖而出。

在开源组件的选择中,OpenWhisk是最好的选择,贡献总体成功的平台。 希望看到在未来几个月增加采用OpenWhisk。 并关注整合OpenWhisk与流行的数据库、存储引擎和API网关。

原文链接:An Architectural View of Apache OpenWhisk(翻译:范彬)

===============================================================
译者介绍:范彬,从事微服务、Docker和Kubernetes容器技术等方面的工作。可以关注译者的微信公众号:范范米饭。

0 个评论

要回复文章请先登录注册