Skip to content

Instantly share code, notes, and snippets.

@chenryn
Last active August 29, 2015 13:57
Show Gist options
  • Save chenryn/9825021 to your computer and use it in GitHub Desktop.
Save chenryn/9825021 to your computer and use it in GitHub Desktop.
网站运维之监控概述

监控的意义

对公司来说

  • 没钱的公司:求爷爷告奶奶别挂啊
  • 有钱的公司:啥产品不能买来用啊 DevOps产品截图

对个人来说

曾经…批量搭建服务器的故事 Noops的畅想?JD截图

系统管理层面的监控

系统命令与procfs

free top ps uptime sar

/proc/net/dev /proc/meminfo /proc/cpuinfo

了解底层机制的systemtap

可以定义触发动作的monit

集群管理层面的监控

集群监控的不同方式

主动抓取的代表Nagios/Nrpe

Nagios 原理

Nrpe 原理和插件开发

Nagios 分布式实现

广播推送的代表Ganglia

Ganglia 原理

Gmond 原理和插件开发

其他zabbix/opentsdb简介

zabbix 的 MySQL 优劣

opentsdb 的 HBase 优劣

产品运维层面的监控

为什么监控服务器还不够?

网站产品监控的监控点又是什么?

简单但是花钱的做法(NetworkBench)

不简单但是省钱的做法(boomerang)

监控工作的后续

自动预警?自动异常判断?

报表?趋势?全文搜索?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment