模拟进程故障
本文主要介绍如何使用 Chaosd 模拟进程故障。该功能通过使用 kill 的 Golang 接口模拟进程被终止或暂停的场景,支持通过命令行模式或服务模式创建实验。
使用命令行模式创建实验
在创建进程故障实验前,可运行以下命令行查看 Chaosd 支持的进程故障类型:
chaosd attack process -h
输出结果如下所示:
Process attack related commands
Usage:
  chaosd attack process [command]
Available Commands:
  kill        kill process, default signal 9
  stop        stop process, this action will stop the process with SIGSTOP
Flags:
  -h, --help   help for process
Global Flags:
      --log-level string   the log level of chaosd, the value can be 'debug', 'info', 'warn' and 'error'
Use "chaosd attack process [command] --help" for more information about a command.
目前 Chaosd 支持模拟进程被终止或暂停的故障。
使用命令行模式模拟进程被终止
模拟进程被终止命令
chaosd attack process kill -h
输出结果如下所示:
kill process, default signal 9
Usage:
  chaosd attack process kill [flags]
Flags:
  -h, --help                 help for kill
  -p, --process string       The process name or the process ID
  -r, --recover-cmd string   The command to be run when recovering experiment
  -s, --signal int           The signal number to send (default 9)
Global Flags:
      --log-level string   the log level of chaosd. The value can be 'debug', 'info', 'warn' and 'error'
      --uid string         the experiment ID
模拟进程被终止相关配置说明
| 配置项 | 配置缩写 | 说明 | 值 | 
|---|---|---|---|
| process | p | 需要注入故障的进程的名字或者进程的标识符 | string 类型,默认为 "" | 
| recover-cmd | r | 需要在实验恢复时执行的命令 | string 类型,默认为 "" | 
| signal | s | 所提供的进程信号值 | int 类型,默认为 9。目前只支持SIGKILL、SIGTERM和SIGSTOP三种信号值。 | 
模拟进程被终止示例
chaosd attack process kill -p python
输出结果如下所示:
Attack process python successfully, uid: 10e633ac-0a37-41ba-8b4a-cd5ab92099f9
注意
只有 signal 为 SIGSTOP 的实验支持被恢复。
使用命令行模式模拟进程被暂停
模拟进程被暂停命令
chaosd attack process stop -h
输出结果如下所示:
stop process, this action will stop the process with SIGSTOP
Usage:
  chaosd attack process stop [flags]
Flags:
  -h, --help             help for stop
  -p, --process string   The process name or the process ID
Global Flags:
      --log-level string   the log level of chaosd, the value can be 'debug', 'info', 'warn' and 'error'
模拟进程被暂停相关配置说明
| 配置项 | 配置缩写 | 说明 | 值 | 
|---|---|---|---|
| process | p | 需要暂停的进程的名字或者进程的标识符 | string 类型,默认为 "" | 
模拟进程被暂停示例
chaosd attack process stop -p python
输出结果如下所示:
Attack process python successfully, uid: 9cb6b3be-4f5b-4ecb-ae05-51050fcd0010
使用服务模式创建实验
要使用服务模式创建实验,请进行以下操作:
- 
以服务模式运行 Chaosd。 chaosd server --port 31767
- 
向 Chaosd 服务的路径 /api/attack/process发送POSTHTTP 请求。curl -X POST 172.16.112.130:31767/api/attack/process -H "Content-Type:application/json" -d '{fault-configuration}'
在上述命令中,你需要按照故障类型在 fault-configuration 中进行配置。有关对应的配置参数,请参考下文中各个类型故障的相关参数说明和命令示例。
注意
在运行实验时,请注意保存实验的 UID 信息。当要结束 UID 对应的实验时,需要向 Chaosd 服务的路径 /api/attack/{uid} 发送 DELETE HTTP 请求。
使用服务模式模拟进程故障
进程故障相关参数说明
| 参数 | 说明 | 值 | 
|---|---|---|
| process | 需要注入故障的进程的名字或者进程的标识符 | string 类型,默认为 "" | 
| signal | 所提供的进程信号值 | int 类型,默认为 9。 | 
使用服务模式模拟进程故障示例
进程被终止
curl -X POST 172.16.112.130:31767/api/attack/process -H "Content-Type:application/json" -d '{"process":"12345","signal":15}'
输出如下所示:
{"status":200,"message":"attack successfully","uid":"c3c519bf-819a-4a7b-97fb-e3d0814481fa"}
进程被暂停
curl -X POST 172.16.112.130:31767/api/attack/process -H "Content-Type:application/json" -d '{"process":"12345","signal":19}'
输出如下所示:
{"status":200,"message":"attack successfully","uid":"a00cca2b-eba7-4716-86b3-3e66f94880f7"}
注意
只有 signal 为 SIGSTOP 的实验支持被恢复。