整体介绍

架构

Agent

agent用于采集机器监控指标,所有的被监控机器都需要部署,类似于zabbix_agent.

agent会开放接口,用户可以自行推送数据。

Gateway

多的region的情况下,可以使用Gateway,agent将数据推送至Gateway,再由Gateway推送至Transfer。类似于zabbix_proxy。

Transfer

transfer是数据转发服务,个人觉得是open-falcon最为核心的服务。

transfer按照哈希规则进行数据分片、并将分片后的数据分别push给graph&judge等组件,

push到tsdb,可以用于Grafana展示数据(有待实验)。

Graph

graph是存储绘图数据(历史数据)的组件.

Query

query组件,提供统一的绘图数据查询入口。query组件接收查询请求,根据一致性哈希算法去相应的graph实例查询不同metric的数据,然后汇总拿到的数据,最后统一返回给用户。

Grafana展示数据也可以通过queue实现,但是需要特定的Grafana的一个版本(有待实验)

Dashboard

dashboard是面向用户的查询界面。在这里,用户可以看到push到graph中的所有数据,并查看其趋势图

fe

统一的web入口,用户管理。

portal

Portal是用来配置报警策略的

hbs

心跳服务器,公司所有agent都会连到HBS,每分钟发一次心跳请求

更新机器信息

下发报警策略给judge

judge

Judge用于告警判断,agent将数据push给Transfer,Transfer不但会转发给Graph组件来绘图,还会转发给Judge用于判断是否触发告警。

alarm

sender

aggregator

nodata

task

agent-updater

安装部署

配置使用

维护管理