文档章节

初创公司谁来当你们的运维

OneAPM蓝海讯通
 OneAPM蓝海讯通
发布于 2016/04/11 10:44
字数 1493
阅读 69
收藏 3

运维,哎,多么沉重的话题,初创公司的运维,哎,还能愉快的聊天吗?

初创公司谁来当你们的运维

初创公司的运维,如今其实兼技术支持、系统管理员(SA)、网管、网络工程师、研发工程师、架构师,干着这些看似不相干甚至矛盾的工作。

他们的具体工作?

  • 在办公室中安装系统、帮同事排除机器故障
  • 在机房插网线、搬机器、拆服务器箱子
  • 天天盯着N个监控屏幕、8小时一动不动盯着流量图
  • 在 BOSS、开发工程师、网络/系统工程师、DBA 中间跑来跑去进行沟通
  • 在夜半三更收到服务器监控系统的警报,起床赶到机房,节假日陪女朋友收到报警也得赶到机房(当然更多的是没女朋友)

初创公司谁来当你们的运维

。。。。。。初创公司有那种整天斗地主,麻将下棋的吗?(还缺人吗,会打麻将的那种)

上面这些是有一定规模的公司运维的工作,当然初创公司同样的工作也是要运维来做的,而且不乏一人当多人用,即使是这样,当出现下面这些问题或需求时,怎么淡定呢?

  • 系统升级,如升级成 centos7 换成了 systemd,不少运维脚本都得重写
  • 业务上加了中间件,需要迅速监控上
  • 研发,运营,QA,产品经理都找你要业务数据,用户数据,测试数据等
  • 监控的数据要高度可视化,BOSS 一眼也能看懂
  • 业务层面的数据也需要一同监控,运营需要的用户信息也想可视化。。。。

初创公司谁来当你们的运维

于是找个大的 Zabbix/Nagios 框架,不停的写脚本,进行后期维护,图表不好看,那再接上 Graphite,这些如果熟悉还好,不熟悉的话还得先花一个月(?)去学习,而且规模大了一个人也不一定搞定的了,,,,但作为一个初创企业/团队,需要这么麻烦吗,真的需要弄这么大一个轮子吗,真的需要配备专门的人力去做这么这些事吗,毕竟公司一共就这几个人。。。。。

解放人力或者说把人用在更重要的地方(不是说运维不重要)才是现在公司应该采取的策略,现在市场上有那么多监控软件,找到自己适合的就要用啊啊啊啊啊,把一般运维的工作分散,服务器托管,用第三方工具,例如:

  • IDC 机房改成云服务器,安全也有保障,还提供免费的流量等监控
  • 对海量日志信息进行收集存储,并提供实时搜索功能,辅助快速定位故障
  • 通过第三方 APM 产品进行性能分析,故障诊断,缓慢代码定位等自动化运维任务
  • 收集服务数据,只要有线上服务在运行,服务数据流经过的所有节点产生的数据,都要采集、存储和分析起来,供不同的运维场景使用
  • 业务数据,运营数据通过直接 SDK/API 倒入实时显示图表的工具上,使得所有数据可视化
  • 设置监控告警,实现应用软件、中间件、数据库、主机、网络、存储、云资源的全方位监控告警
  • 所有数据统一平台,谁想看什么数据都有

运维的本质——可视化,当你把应用所用的所有服务器数据,业务层数据,日志等都监控起来,都有相应的可视化的数据,出现问题都有据可查,或者根据已有数据做趋势预测,设置报警,出现问题时第一时间知道(网站反应慢了第一个发现的是运维而不是用户),公司不管哪个部门需要的数据都可以放在一起看,简直完美!

初创公司谁来当你们的运维

硬广来袭,非战斗人员迅速撤离~~~

作为次时代系统监控工具,数据处理平台 Cloud Insight 完全能够解决上述问题,目前已经做到:

  • 一键部署,40s完成 Linux/Windows/Docker 系统服务器监控
  • 简单配置,支持30+ 数据库,中间件组件监控
  • 支持 SDK(API 开发中) 自定义上传时间序列数据
  • 仪表盘,自定义你的个人风格仪表盘
  • 告警/事件流,针对全指标设置报警策略

hostmap 等功能还在完善中,功能那么多,放哪张图好呢,好纠结。。。放张仪表盘展示 SDK 自定义上传数据的吧!

初创公司谁来当你们的运维

已经有很多初创公司选择 Cloud Insight,因为部署简单迅速,支持的组件也多,可以自定义上传数据,有技术支持来解决问题,有一批(注意这个词是「批」)开发人员在不断增加功能,还有什么理由不用呢?

好啦,回答一下标题的问题:初创公司谁来当你们的运维?当然是 Cloud Insight 啦。。。

Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。想阅读更多技术文章,请访问 OneAPM 官方技术博客

本文转自 OneAPM 官方博客

© 著作权归作者所有

OneAPM蓝海讯通
粉丝 94
博文 631
码字总数 1266889
作品 0
海淀
私信 提问
SRE的含义及与 DevOps 如何关联?

虽然站点可靠性工程师(site reliability engineer SRE)角色在近几年变得流行起来,但是很多人 —— 甚至是软件行业里的 —— 还不知道 SRE 是什么或者 SRE 都干些什么。为了搞清楚这些问题...

linuxCool
2018/12/10
165
0
什么是 SRE?它和 DevOps 是怎么关联的?

大型企业里 SRE 角色比较常见,不过小公司也需要 SRE。 虽然站点可靠性工程师site reliability engineer(SRE)角色在近几年变得流行起来,但是很多人 —— 甚至是软件行业里的 —— 还不知道...

作者: Craig Sebenik
2018/11/28
0
0
什么是DevOps?

点击上方“程序员小灰”,选择“置顶公众号” 有趣有内涵的文章第一时间送达! 本文转载自公众号 码农翻身 五天前,张大胖负责的开发团队向运维部门交付了一批新代码,这是一次用户期待已久的...

bjweimengshu
2018/01/11
0
0
互联网+下运维工具大宝典之运维需求篇

  【IT168评论】随着互联网+时代的到来,移动互联网和云计算技术得到了广泛应用,大多数初创公司在选择互联网创业的同时,不约而同的将IT系统部署到云平台上,也有不少的企业在保留或减少原...

it168网站
2015/11/28
0
0
开源堡垒机或者运维安全审计系统

堡垒机有以下两个至关重要的功能: 权限管理 当你公司的服务器变的越来越多后,需要操作这些服务器的人就肯定不只是一个运维人员,同时也可能包括多个开发人员,那么这么多的人操作业务系统,...

English0523
2016/05/19
0
0

没有更多内容

加载失败,请刷新页面

加载更多

同名依赖,多次引入导致的程序错误

表现: 本地测试正常,打包上线后报错找不到某个方法(缺少依赖),检测依赖发现,同名依赖有两个版本。 解决:删除一个,程序正常

避难所
30分钟前
3
0
在HTML中的下拉框中实现超连接

<!DOCTYPE html><html lang="zh-CN"><head> <meta charset="UTF-8"> <link rel="canonical" href="https://blog.csdn.net/weixin_34228617/article/details/86130280"/> ......

mickelfeng
35分钟前
3
0
Content7关闭防火墙命令

在外部访问CentOS中部署应用时,需要关闭防火墙。 关闭防火墙命令:systemctl stop firewalld.service 开启防火墙:systemctl start firewalld.service 关闭开机自启动:systemctl disable f...

无名氏的程序员
36分钟前
3
0
分布式存储原理:TiDB

浮躁的码农
49分钟前
7
0
CSS实现圆角边框的完美解决方案

css实现图片圆角,兼容所有浏览器: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 <style type= "text/css" > /*通用样式--容器宽度值*/ .s......

前端老手
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部