云中树莓派(5):利用 AWS IoT Greengrass 进行 IoT 边缘计算

2022-12-14,,,,

云中树莓派(1):环境准备

云中树莓派(2):将传感器数据上传到AWS IoT 并利用Kibana进行展示

云中树莓派(3):通过 AWS IoT 控制树莓派上的Led

云中树莓派(4):利用声音传感器控制Led灯

云中树莓派(5):利用 AWS IoT Greengrass 进行 IoT 边缘计算

IoT 的诸多场景中,边缘计算有很多需求。比如,不是每个物联网设备都能连接到互联网,从而连接云上物联网服务。还比如有一些数据安全考虑,不允许将某些数据发到云上。因此,AWS 发布了 Greengrass 服务,用于支持物联网场景中的边缘计算。

1. AWS IoT Greengrass 服务概述

  AWS Greengrass 是一种软件,用于将 AWS 云功能扩展到本地设备,使得本地设备可以更靠近信息源来收集和分析数据,同时在本地网络上安全地相互通信。更具体来说,使用 AWS Greengrass 的开发人员可以在云中编写无服务器代码 (AWS Lambda 函数),然后方便地将其部署到设备以在本地执行应用程序。在 AWS Greengrass 中,设备可在本地网络上安全地通信并互相交换消息而不必连接到云。
 
安装:

Greengrass 是一个软件,可以安装在多种设备上,比如树莓派、AWS EC2 实例、Ubuntu 虚拟机,以及多种专用设备。 具体参加AWS 官网。

功能:
Lambda 运行时:可以将云上创建的 Lambda 函数部署到 Greengrass Core 上并使其运行。Lambda 函数可以和边缘物联网设备,以及云服务进行交互。
影子设备:为边缘物联网设备提供 Device Shadow 服务,类似云上 Device Shadow 服务。可以通过更新和查询设备的影子,来获取和修改设备的状态。
消息管理器:支持 Greengrass 组中的物联网设备之间的通信,以及与 Lambda 函数、设备影子服务之间通信。影子数据可以只保存在本地(Local Shadow),也可以同步到云上。
组管理: 管理 Greengrass Group,一个 group 为一个独立的边缘物联网环境。
发现服务:物联网设备可以通过连接到IoT云服务,然后通过 Discovery 功能来发现 Greengrass Core,从而与之通信。
无线更新代理:可以远程更新 Greengrass Core 软件。
本地资源访问:支持 Greengrass Core 上的 Lambda 函数访问本地资源,比如树莓派的GPIO,本地视频摄像头等。
机器学习推理:支持将云上 ML 机器学习推理功能部署到Greengrass Core。

架构:

关于架构的部分说明:

若干本地设备和一个Greengrass Core (GGC)组成一个 Greengrass 组。与 AWS Greengrass 核心通信的所有设备都必须是 Greengrass 组的成员。每个组都必须包含 AWS Greengrass 核心(似乎一个组只能有一个 GGC)。Discovery API 使设备能够检索连接到 AWS Greengrass 核心 (与设备位于同一 Greengrass 组中) 所需的信息。
本地设备和 Greengrass Core 通过本地网络通信,无法访问云(有看到 Discovery Service 需要设备在启动时连接到云上获取到 GG Core 的连接信息)。设备上必须安装 AWS IoT Device SDK。
Greengrass 可以和云通信,需要有互联网访问能力。
可以在 Greengrass Core 上运行 Lambda 函数,这些函数可以和设备之间通信,也可以和云通信。
云上的配置、Lambda 函数以及机器学习模版通过 『Deploy』 被安装到 Greengrass Core 上。Greengrass Core 上有一个部署代理,它在接到通知后,从云上获取待部署材料,然后在 Greengrass Core 上进行部署。
组中设备连接到GGC 的过程:
AWS IoT 设备使用其设备证书、私有密钥和 AWS IoT 根 CA 连接到 Greengrass 云服务。
连接后,AWS IoT 设备将使用 Greengrass Discovery Service 查找其 AWS Greengrass 核心设备的 IP 地址。该设备还可下载组的根 CA 证书,该证书可用于对 Greengrass 核心设备进行身份验证。
AWS IoT 设备尝试连接到 AWS Greengrass 核心,并传递其设备证书和客户端 ID。如果客户端 ID 与设备的事物名称匹配并且证书有效,则将进行连接。否则,将终止连接。

2. 部署 AWS IoT Greengrass Core

2.1 操作系统准备

我在本地创建了一台 ubuntu 16.04 虚机,用于 Greengrass Core 部署。根据 Greengrass 文档做一些操作系统配置,具体参见Greengrass文档。在配置完成后,可运行检查工具来验证环境是否可用:

cd /home/pi/Downloads
git clone https://github.com/aws-samples/aws-greengrass-samples.git
cd aws-greengrass-samples
cd greengrass-dependency-checker-GGCv1.5.0
sudo modprobe configs
sudo ./check_ggc_dependencies | more

遇到两个小问题,提示未发现 java8 和 nodejs610。此时,需要创建三个软链接:

ln -s /usr/bin/node /usr/bin/nodejs6.10
ln -s /usr/bin/node /usr/bin/nodejs
ln -s /usr/bin/java /usr/bin/java8

2.2 在 AWS IoT 上配置 Greengrass 服务

目前全球只有5个region 提供了 Greengrass 服务。在选择使用哪个region时候,一定要注意本地到这个region的网络情况。一开始,我想当然地认为国内到亚洲比如东京或者悉尼因为地理距离较近因此网络会较好,但实际上却发现到美国弗吉尼亚的网络比到东京的网络要好得多。

(1)创建 Greengrass Group

创建后,需下载两个压缩包:

一个是证书包:

一个是 Greengrass Core 软件安装包:根据系统平台选择。

一个 Greengrass Group 包含的资源如下图所示,具体有:

部署(Deployments)
订阅表(Subscriptions)
核心(Cores)
本地设备(Devices)
Lambda函数
本地资源(Resources)

(2)在设备上启动 Greengrass Core

    将上面两个 zip 文件传到待安装 Greengrass Core 的环境中
    将软件安装包解压到 /greengrass 中
    将证书zip文件解压到 /greengrass/certs
    下载 AWS IoT ROOT 证书到  /greengrass/certs 中
    修改 config/config.json 文件如下所示
    运行 /greengrass/ggc/core/greengrassd start 启动 Greengrass Core 服务
{
"coreThing": {
"caPath": "root.ca.pem",
"certPath": "022829d5c4.cert.pem",
"keyPath": "022829d5c4.private.key",
"thingArn": "arn:aws:iot:us-east-1:*******:thing/homepi_Core",
"iotHost": "*********.iot.us-east-1.amazonaws.com",
"ggHost": "greengrass.iot.us-east-1.amazonaws.com",
"keepAlive": 2000
},
"runtime": {
"cgroup": {
"useSystemd": "yes"
}
},
"managedRespawn": false
}

(3)问题排查

可以在 /greengrass/ggc/var/log/system 中查看 Greengrass Core 的日志文件。如果有错误,则定向排查。

2.3 测试

2.3.1 创建第一个 Lambda 函数

运行在 GGC 中的 Lambda 函数需要把 Greengrass SDK 打包进去。它的SDK 中提供了 HelloWorld 示例函数代码。函数代码如下,很简单,它每隔5秒钟向 hello/world MQTT 主题发送『Hello World』消息。

import greengrasssdk
import platform
from threading import Timer
import time # Creating a greengrass core sdk client
client = greengrasssdk.client('iot-data') # Retrieving platform information to send from Greengrass Core
my_platform = platform.platform() def greengrass_hello_world_run():
if not my_platform:
client.publish(topic='hello/world', payload='Hello world! Sent from Greengrass Core.')
else:
client.publish(topic='hello/world', payload='Hello world! Sent from Greengrass Core running on platform: {}'.format(my_platform)) # Asynchronously schedule this function to be run again in 5 seconds
Timer(5, greengrass_hello_world_run).start() # Start executing the function above
greengrass_hello_world_run() def function_handler(event, context):
return

参考GG文档,完成所需步骤后,完成该函数的创建。发布它的的一个版本,并创建别名 GG_HelloWorld。

2.3.2 将该函数添加到 Greengrass Group 中

在 Greengrass 服务中添加上面创建的函数:

2.3.3 创建订阅 (subscription)

订阅表用于定义 Greengrass 组内 (AWS Greengrass 核心设备、AWS IoT 设备和 Lambda 函数之间) 如何交换消息。订阅表中的每个条目指定源、目标和发送/接收消息时使用的 MQTT 主题。仅当订阅表中存在指定源 (消息发件人)、目标 (消息收件人) 和 MQTT 主题的条目时才能交换消息。订阅表条目指定从源到目标的单向消息传递。如果您需要双向消息传递,请创建两个订阅表条目,每个条目针对一个方向。

为了测试该函数是否按设计发出了消息,创建一个从该函数到 IoT Service 的订阅,这样从 IoT 服务上就可以收到它发出的消息了。

2.3.4 部署(Deploy)

云上的所有操作都必须通过『部署』应用到 Greengrass Core 上。因此,对 Greengroup 做了任何变化后,都必须通过部署操作将其应用到Core 上。

点击 Actions -> Deploy,开始部署。可以从 Core 的 runtime.log 文件中看到其大致过程:

    在Group 上有部署请求后,部署代理收到消息,消息中有 deploymentId
    部署代理从云上获取待部署的素材
    部署代理在Core上进行实际部署
[2018-08-13T15:56:55.622+08:00][INFO]-Received deploymentId 613dc2ec-8877-41b2-a217-8f939a7782fc of type NewDeployment for group f7a0bc8f-4527-481d-9301-1545b86fcf68
[2018-08-13T15:56:55.622+08:00][INFO]-Updating status to InProgress of deployment 613dc2ec-8877-41b2-a217-8f939a7782fc for group f7a0bc8f-4527-481d-9301-1545b86fcf68
[2018-08-13T15:56:56.611+08:00][INFO]-Executing the group Downloading step

然后查询其状态:

2.3.5 测试消息接收

在界面上的Test 功能中,可以收到 Lambda 函数发出的消息:

2.3.6 Core 上的变化

在 Lambda 函数被部署到 Core 上之后,在 Core 上起了一个新的进程:

ggc_user 21106  0.3  0.7 189616 15148 ?        Ssl  16:33   0:12 python2.7 -u /runtime/python2.7/lambda_runtime.py --handler=greengrassHelloWorld.function_handler

该进程利用了 cgroup 来限制资源:

root@greengrass:/home/ubuntu# cat /proc/21106/cgroup
11:freezer:/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
10:blkio:/user.slice/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
9:memory:/user.slice/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
8:net_cls,net_prio:/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
7:pids:/user.slice/user-1000.slice/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
6:hugetlb:/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
5:perf_event:/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
4:devices:/user.slice/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
3:cpuset:/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
2:cpu,cpuacct:/user.slice/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6
1:name=systemd:/user.slice/user-1000.slice/session-63.scope/system.slice/83db5d89-d650-4f65-542a-f6669153d4e6

目前只支持指定函数的内存限制:

3. 边缘物联网设备通过 Greengrass Core 进行消息交互

示意图:

3.1 云上配置

(1)在 IoT Greengrass 服务中创建两个设备,分别是 HelloWorld_Publisher (模拟上图中的设备 #1)和 HelloWorld_Subscriber(模拟上图中的设备 #2)。将获取到各自的证书文件。

创建设备:

创建结果:

(2)配置订阅,从 Publisher 到 Subscriber:

(3)通过 部署,把应用同步到 Greengrass Core 上。

3.2 树莓派中的配置和操作

以树莓派为平台,在上面运行两个程序,来模拟上面的两个物联网设备。

(1)首先需要在树莓派上安装 AWS IoT Device SDK

git clone https://github.com/aws/aws-iot-device-sdk-python.git
cd aws-iot-device-sdk-python
python setup.py install

(2)SDK 中有个示例文件 /aws-iot-device-sdk-python/samples/greengrass/basicDiscovery.py 可用于本测试

(3)运行脚本模拟 publlisher:

python basicDiscovery.py  -e *****.iot.us-east-1.amazonaws.com -r pubcerts/root-ca.pem  -c pubcerts/3ed88f606a.cert.pem -k pubcerts/3ed88f606a.private.key  -n HelloWorld_Publisher -m publish -t hello/world/pubsub -M "Hellow, I am Publisher"

它会不停地向 hello/world/pubsub 发送消息:

2018-08-14 16:44:14,143 - AWSIoTPythonSDK.core.protocol.internal.workers - DEBUG - Produced [puback] event
2018-08-14 16:44:14,145 - AWSIoTPythonSDK.core.protocol.internal.workers - DEBUG - Dispatching [puback] event
2018-08-14 16:44:15,144 - AWSIoTPythonSDK.core.protocol.mqtt_core - INFO - Performing sync publish...
Published topic hello/world/pubsub: {"message": "Hellow, I am Publisher", "sequence"

(4)运行另一个脚本模拟 subscriber:

python basicDiscovery.py  -e *******.iot.us-east-1.amazonaws.com -r subcerts/root-ca.pem  -k subcerts/7d8fefa9d3.private.key  -c subcerts/7d8fefa9d3.cert.pem -n HelloWorld_Subscriber -t hello/world/pubsub -m subscribe

它会不断收到消息:

2018-08-14 16:44:15,194 - AWSIoTPythonSDK.core.protocol.internal.workers - DEBUG - Produced [message] event
2018-08-14 16:44:15,196 - AWSIoTPythonSDK.core.protocol.internal.workers - DEBUG - Dispatching [message] event
2018-08-14 16:44:15,197 - AWSIoTPythonSDK.core.protocol.internal.clients - DEBUG - Invoking custom event callback...
Received message on topic hello/world/pubsub: {"message": "Hellow, I am Publisher", "sequence": 6}

3.3 过程说明

(1)订阅者一开始,会向 IoT Service Endpoint 发送一个 Discovery 消息:

 Sending discover request: GET /greengrass/discover/thing/HelloWorld_Subscriber HTTP/1.1
Host: a1upjpa864lewg.iot.us-east-1.amazonaws.com:8443

说明:这里说明边缘的物联网设备还是需要连接到云上的IoT端点,这说明它们仍然需要互联网访问能力。

(2)它收到返回消息

Receiving discover response body...
Discovered GGC: arn:aws:iot:us-east-1:*******:thing/homepi_Core from Group: 669d91fc-0690-48ab-a36d-90816b2332b4
Now we persist the connectivity/identity information...

(3)它连接到 Greengrass Core

Trying to connect to core at 192.168.1.12:8883

(4)它订阅到指定 topic

Adding a new subscription record: hello/world/pubsub qos: 0

(5)它开始接收消息

2018-08-14 16:44:09,381 - AWSIoTPythonSDK.core.protocol.internal.workers - DEBUG - Produced [message] event
2018-08-14 16:44:09,382 - AWSIoTPythonSDK.core.protocol.internal.workers - DEBUG - Dispatching [message] event
2018-08-14 16:44:09,384 - AWSIoTPythonSDK.core.protocol.internal.clients - DEBUG - Invoking custom event callback...
Received message on topic hello/world/pubsub: {"message": "Hellow, I am Publisher", "sequence": 0}

可见这过程里面,处于边缘的物联网设备还是需要连接到云上IoT 服务一次,去获取Core 的信息。Core 的 Connectivity 信息可以收入输入,也可以由Core 自动推送到云上。

4. 与本地设备影子进行交互

示意图:

4.1 云上配置

(1)在IoT 服务中,在 Greengrass 组内,创建两个设备,GG_Switch 和 GG_TrafficLight。

(2)创建订阅

(3)部署

4.2 树莓派上的配置和操作

从https://github.com/aws-samples/aws-greengrass-samples/tree/master/traffic-light-example-python 下载 lightController.py 和 trafficLight.py 文件。前者模拟一个Led 灯的控制器,后者模拟Led 灯。

(1)运行Controller

python lightController.py -e ****.iot.us-east-1.amazonaws.com -r switchcerts/root-ca.pem -c switchcerts/8bb0278c01.cert.pem -k switchcerts/8bb0278c01.private.key -n GG_TrafficLight --clientId GG_Switch

它会定时向设备影子发出更新请求:

{"state":{"desired":{"property":"Y"}}}
2018-08-14 17:00:28,915 - AWSIoTPythonSDK.core.protocol.mqtt_core - INFO - Performing sync publish...
~~~~~~~~~~Shadow Update Accepted~~~~~~~~~~~~~
Update request with token: 1827378e-9b0b-4b03-a7df-2c1af119510f accepted!
property: Y

(2)运行 Light

python trafficLight.py -e ****.iot.us-east-1.amazonaws.com -r lightcerts/root-ca.pem  -c lightcerts/eae63a2ee2.cert.pem -k lightcerts/eae63a2ee2.private.key  -n GG_TrafficLight --clientId GG_TrafficLight

它会收到 Delta 请求,变更Led 的状态:

Light changed to: Y
{"state":{"reported":{"property":"Y"}}}
2018-08-14 17:02:29,111 - AWSIoTPythonSDK.core.protocol.mqtt_core - INFO - Performing sync subscribe...
2018-08-14 17:02:29,120 - AWSIoTPythonSDK.core.protocol.mqtt_core - INFO - Performing sync subscribe...
2018-08-14 17:02:31,132 - AWSIoTPythonSDK.core.shadow.deviceShadow - INFO - Subscribed to update accepted/rejected topics for deviceShadow: GG_TrafficLight
2018-08-14 17:02:31,133 - AWSIoTPythonSDK.core.protocol.mqtt_core - INFO - Performing sync publish...
~~~~~~~~~~ Shadow Update Accepted ~~~~~~~~~~~~~
Update request with token: ec5f0cdb-0558-44b7-a685-02d2df8a31cb accepted!
property: Y

5. 从 Lambda 函数中访问云服务

示意图:

5.1 云上配置

(1)创建 IAM Role Greengrass_DynamoDB_Role,将其赋予给 Greengrass,用于访问 DynamoDB。

(2)创建 IAM Role Lambda_DynamoDB_Role,它会被赋予给 Lambda 函数,用于访问 DynamoDB。

(3)从 https://github.com/aws-samples/aws-greengrass-samples/tree/master/traffic-light-example-python 下载 carAggregator.py,打包成 Lambda 函数包,创建 Lambda 函数。函数名为 GG_Car_Aggregator。看下它的代码:

import logging
import boto3
from datetime import datetime
from random import *
from botocore.exceptions import ClientError dynamodb = boto3.resource('dynamodb', region_name='us-east-1')
tableName = "CarStats" # Create the dynamo db table if needed
try:
table = dynamodb.create_table(
TableName=tableName,
KeySchema=[
{
'AttributeName': 'Time',
'KeyType': 'HASH' #Partition key
}
],
AttributeDefinitions=[
{
'AttributeName': 'Time',
'AttributeType': 'S'
}
],
ProvisionedThroughput={
'ReadCapacityUnits': 5,
'WriteCapacityUnits': 5
}
) # Wait until the table exists.
table.meta.client.get_waiter('table_exists').wait(TableName=tableName)
except ClientError as e:
if e.response['Error']['Code'] == 'ResourceInUseException':
print("Table already created")
else:
raise e # initialize the logger
logger = logging.getLogger()
logger.setLevel(logging.INFO) # This is a long lived lambda so we can keep state as below
totalTraffic = 0
totalGreenlights = 0
minCars = -1
maxCars = -1 def function_handler(event, context):
global totalTraffic
global totalGreenlights
global minCars
global maxCars # grab the light status from the event
# Shadow JSON schema:
# { "state": { "desired": { "property":<R,G,Y> } } }
logger.info(event)
lightValue = event["current"]["state"]["reported"]["property"]
logger.info("reported light state: " + lightValue)
if lightValue == 'G':
logger.info("Green light") # generate a random number of cars passing during this green light
cars = randint(1, 20) # update stats
totalTraffic += cars
totalGreenlights+=1
if cars < minCars or minCars == -1:
minCars = cars
if cars > maxCars:
maxCars = cars logger.info("Cars passed during green light: " + str(cars))
logger.info("Total Traffic: " + str(totalTraffic))
logger.info("Total Greenlights: " + str(totalGreenlights))
logger.info("Minimum Cars passing: " + str(minCars))
logger.info("Maximum Cars passing: " + str(maxCars)) # update car stats to dynamodb every 3 green lights
if totalGreenlights % 3 == 0:
global tableName
table = dynamodb.Table(tableName)
table.put_item(
Item={
'Time':str(datetime.utcnow()),
'TotalTraffic':totalTraffic,
'TotalGreenlights':totalGreenlights,
'MinCarsPassing':minCars,
'MaxCarsPassing':maxCars,
}
)
return

代码也很简单。它首先会尝试创建一个 Dynamo table。然后在每次收到 documents 后,检查 reported 状态。如果为 「G」,表示为绿灯,它会向Dynamo 表中写入一条数据。

(4)将该函数添加到 Greengrass 组中。

(5)配置订阅。本地影子服务会将设备的 documents 发给 Aggregator Lambda 函数。

5.2 树莓派上的配置

保持 4.2 中的 Controller 和 Light 持续运行。几分钟后,Dynamo 中将会有数据产生:

6. 一点感受

感觉AWS IoT Greengrass 服务还有一些不太完善,主要有以下几个原因:

目前全球只有5个区域内可以使用 Greengrass 服务
似乎无法做到边缘物联网设备完全不需访问云而只需要能访问 Greengrass Core,因为至少 Discovery Serivce 需要访问 IoT Service Endpoint来获取 Core 的连接信息。
利用订阅来控制消息的发送很繁琐。如果有很多的设备,很多的topic,那这个配置将成为一个苦力活。
Greengrass 服务应该需要高可用,但是没看到相关的文档和方案。

参考链接:

AWS 官方的 《AWS Greengrass 开发人员指南》
https://medium.com/tensoriot/aws-greengrass-on-raspberry-pi-creating-core-and-node-devices-707a38452293

欢迎大家关注我的个人公众号:

云中树莓派(5):利用 AWS IoT Greengrass 进行 IoT 边缘计算的相关教程结束。

《云中树莓派(5):利用 AWS IoT Greengrass 进行 IoT 边缘计算.doc》

下载本文的Word格式文档,以方便收藏与打印。