这两天天气还不错,有风,空气好
(其实之前也一直写工作日志,只是多数和公司产品直接相关,就不便公开了)
这两天花了很多时间研究应用监控解决方案。这方面的例子有很多,Google 的 Dapper、淘宝的鹰眼、eBay 的 CAL,以及在国内被众多厂商采用的,目前已经开源的大众点评的 CAT。
应用监控系统不同于像 Zabbix、Ganglia 这样的监控系统,后者侧重于对服务器的监控。应用监控系统可以是运维和开发人员了解到应用运行的内部细节情况。比如一次业务调用在系统内部涉及到了哪些调用,这些调用的关系是什么,调用的结果(状态、是否有重试、花费的时间等等)。同时,当内部调用出现问题的时候,监控系统还可以及时发现这些问题,避免问题夸大,加快问题的解决速度,减少运维和开发人员的重复工作。
CAT
在做了大致的了解之后,我开始尝试 CAT 系统。但是搭建 CAT 服务的时候并不是很顺利。编译并不困难,但之后的运行确实频频出错。 记录的比较详细。因为年前暂时没有 Linux 环境,所以运行 CAT 的尝试便没有继续下去。
过年的时候在移动硬盘上安装了一个 Ubuntu 系统,年后便可以继续运行 CAT 的尝试了。
Netflix Hystrix
Hystrix 的 Dashboard 功能使得开发运维人员可以在远程调用方面监控应用。所以,Hystrix 也是一个调研的方向。