Linux运维用到的技术栈

发布时间:2025-07-14 点击:34
系统运维
[toc]
虚拟化篇
kvm
比较主流的虚拟化技术,不过在运维水平比较差的公司,还能看到在用盗版的vmware产品。如果测试环境规模稍微有点大,可以考虑使用云平台,诸如各种流行的 stack。如果自己有能力,可以使用 libvrit 提供的api,自己写一个管理平台也是可以的。适合内部使用即可,开源的各种 stack 都比较重,用起来都是有一些成本的。
docker
统一了开发及线上环境,适合微服务。
公有云
公有云有你用到的所有东西。在一个使用了公有云的公司,那么完全可以不需要运维及测试了,帮助企业快速完成devops转型。公司做dev,公有云做ops。
公有云在iaas、paas及saas层面都有相应的产品,真正懂你所需,公司可以根据自身情况选择使用合适的产品即可。
安全起见,可以使用子账号进行 api 相关的一些操作。
存储服务
如果数据量比较大,可以考虑使用开源的分布式存储,后面在私有云平台或docker或k8s上估计都会用到。
web 容器篇
openresty
openresty 并不是一个新的事物,而是 nginx 与 lua 的组合。openresty 创始人章亦春把 lua 脚本嵌入了 nginx,结合 lua 可以很灵活的扩展 nginx 的功能,如实现 waf 等。而且做的事情远不止这些。
数据库篇
主要包括关系型数据库与非关系型数据库。基本的 sql 功底还是要有的。
mysql
号称世界上最流行的数据库,用的还是非常广泛的。看来“最流行”的称号并不是吹的。运维最关注的还是如何确保数据的安全性及高可用性。
运维层面需要做到的是:
数据备份
数据恢复
主从同步
关于备份及恢复用到的工具,市面上还是有很多的。选择你熟悉的即可。
postgresql
号称世界上最先进的数据库,使用的用户还是很多的,不过这些用户大多在国外,在国内用的不如 mysql 广泛。如果你觉得没有合适的数据库可以选择的话,那就选择 postgresql 吧。
redis
主流的键值存储数据库。一般用来做关系型数据库的缓存。
mongodb
监控篇
zabbix
比较著名的开源监控系统,功能强大。如果要定制或二次开发,相对比较困难(需要我们有c语言(后端)及php(前端)的功底),这里所说的困难是面对运维人员来说的。
open-falcon
由小米开源的监控系统,使用go语言编写。如果要定制或二次开发则相对容易,支持脚本语言(bash、perl、python等)对其进行扩展或二次开发。而这些脚本语言对运维人员来说并不陌生,但能不能用的熟练就是另外一回事了。
颜值高的ui
上述的监控软件,它们的ui界面不是很nice,可以使用比较流行的grafana。
zmon
可以做监控及指标监控。
prometheus
应用程序的指标监控。四个黄金指标:
延迟:服务请求所需耗时;例如http请求平均延迟
流量/吞吐:衡量服务容量需求;例如每秒处理http请求数
错误:衡量错误发生的情况;例如http 500错误数
饱和度:衡量资源使用情况;例如cpu/内存/磁盘使用量
有了指标监控,再加上服务调用链追踪,效果会更好。
服务链调用追踪
服务链调用追踪解决的问题:
提供服务之间的调用链
性能及延迟分析
服务依赖分析
问题分析
zipkin
twitter 推出的服务调用追踪系统
jaeger
uber 推出的服务调用追踪系统
skywalking
华为推出的服务调用追踪系统
配置管理篇
ansible
比较轻量级(相对puppet及saltstack)的自动化配置管理工具。让运维告别使用脚本进行循环来完成批量操作的任务,而是真正的使用并行来做操作管理。
编程语言篇
做为it界的一员,不管是什么工种,不会一门编程语言,都不好意思跟别人打招呼。
python
python的口号是:"life is short, use python."
golang
golang具有c的性能及python的姿态,它的口号是:"life is short, let\\\’s go."
lua
openresty中需要用到lua语言,所以掌握一下这门语言也是应该的。
javascript
现在不管是什么职位,总得会点js吧,不然离全栈还是有点距离的。如果不会一点,自己想做个页面,还要找前端同事,多么不方便。
代码托管
有了编程语言及相应的开发环境,那就该有一个代码托管的地方。这里推荐使用gitlab作为公司内部的代码托管服务,相信很多公司也是这么选择的。
开发框架
java 相关框架
涉及到java开发,就少不了下面的几个组件:
jdk
maven(ant或gradle)
nexus
代码托管
数据库(关系型数据库、非关系型数据库)
spring全家桶要知道有什么,及怎么工作的。如:
服务注册、发现
负载均衡
熔断是怎么回事
配置中心
spring boot
spring cloud
python 相关框架
django
python 世界中一个大而全的web框架。
flask
python 世界中一个小而美的web框架。
ci/cd
这在日常的工作中,有着很大的比重。如果这一块做不好,运维将会比较苦逼。市面上的ci/cd工具比较多,选择也比较多,推荐使用jenkins或者自研。
运维小工具
平时可以开发一些小工具,这些小工具可以帮助自己或开发快速获取一些信息,如:
解析 eureka 的注册信息,可以知道自己的服务部署在哪里及监听的端口
从一台机器上复制文件到另外一台
从一个数据库实例,同步数据到另外一个数据库实例
还有很多
总结
运维要把基础型的工作做好之后,就可以用更多的时间与精力做更有价值的事情了。基础型的工作主要有:
持续集成与持续部署
基础设施监控
服务性能监控
上述工作做好之后,就可以做一些公司内部的运维平台,方便开发同事进行更高效地开发。

帮我开下服务器备份下数据
华为ModelArts 3.0正式发布
注册域名意义在哪?为什么要注册域名?
依蓝云服务器怎么样
如何远程控制云虚拟主机
什么是mvc框架,怎么认识
腾讯云服务器快照收费吗
学生云服务器哪家好