我对Linode有些误会…..

最早的时候 Linode 推出了 Volume 服务
申请了免费测试
那I/O 读写1M, 然后就不考虑这个服务了…..

最近有ELK的存储需求
建了个512M的测试
结果震惊到了 速度425M/秒 比SSD都快

这个可商用了
100美金1T算便宜吧

后来算明白了 测试有限制I/O

最近通过搜索访问本文章的关键词:

CentOS7 e1000 / 82574 网卡系列的bug和修复

这个也算是个奇葩问题了
这么多年就是不能打个补丁

这破问题 害我损失不少客户

无语了,我要换硬盘,你每次给加硬盘什么意思……

无语了,我要换硬盘,你每次给加硬盘什么意思……

有几台古董机器配的老硬盘 几年了 最近Raid报警
过去几个月一直在换,联系机房值班
原来搭配的N块盘,每次有盘坏了就给我加一块
坏盘也不给我拔掉,真鸡巴懒
结果现在挂了一堆硬盘了……

4.x的内核,在部分CentOS7系统下会异常

4.x的内核,在部分CentOS7系统下会异常
不是特别稳定,测试差不多的配置, 4台机器
3.x的内核正常
尝试升级到4.x 会出现负载升高,失去响应的问题

这个各种因素影响比较大,所以也没时间定位哪里触发的崩溃

LVM SATA SSD缓存 性能比较

给客户部署测试的

做了个性能测试比较

测试结果

提升了56M的写入速度,读取速度一般不会是不会成为瓶颈的
这个是未进行LVM差数优化的结果, 根据应用场景,应该有提升空间
例如图片存储,优化meta size的大写, 更换文件系统, 使用XFS,ZFS等等

总结
有效 提升空间不是特别大

服务器异常关机 最想不到的原因

服务器异常关机 最想不到的原因

说出来可能不信

客户上架一个机柜40台机器
39台正常 只有一台老是自动关机

分析发现
操作系统日志提示温度过高 断电保护

最后检查发现
5个风扇少3个,1个低速1000多转, 1个坏了

能不自动关机吗?

Raid卡的自动化管理

Raid卡的自动化管理

实现自动化安装系统并不难

难在如何实现按客户选的Raid级别
去自动实现Raid的Rebuild

终于明白逻辑了 还是传参

第一步
Raid卡是不是存在 存在=允许客户选择Raid级别
第二步
客户选择Raid级别, 计算是不是满足需求,满足就放行,否则返回False
例如, 客户选Raid5, 但是设备只有2块硬盘,只能建Raid0或Raid1
第三步
客户选择了Raid
系统开机,PXE启动维护盘,下载对应的Raid规则和脚本预定义
建立物理卷和逻辑卷,分区
完成后重新启动

第四步
继续PXE启动,进行网络安装系统!

CentOS 7 开启 Google BBR TCP 加速

#1 检查内核

如果非4版本的话,继续

#2 更新内核源

#3 调整内核

#4 重启

#5 开启TCP控制 给bbr接管

#6 检查
检查内核

返回4.9版本
代表OK

检查BBR

返回 net.ipv4.tcp_available_congestion_control = bbr cubic reno
代表OK