追逐DBA(13):协调硬件厂商,六个故事:所见所感的“服务器、

原创作品,出自 “深蓝的blog” 博客,欢迎转载,转载时请务必注明出处,否则追究版权法律责任。

【简介】

个人在oracle路上的成长记录,其中以蓝自喻,分享成长中的情感、眼界与技术的变化与成长。敏感信息均以英文形式代替,不会泄露任何企业机密,纯为技术分享。

创作灵感源于对自己的自省和记录。若能对刚刚起步的库友起到些许的帮助或共鸣,欣慰不已。

欢迎拍砖,如有关技术细节表述有错误之处,请您留言或邮件(hyldba@163.com)指明,不胜感激。

【前言】

这是一部个人记录的成长杂记,既然步入到oracle的这片蓝海,免不了一路的奔波与不断的考验。借由此杂记与库友们分享蓝的成长历程。

不知何时起对蓝有了一种说不出来的痴迷,痴迷其广博,痴迷其深邃,痴迷于近在咫尺却又遥不可及。

而又说不清从何时起,注视于oracle的红色耀眼,照亮出眼前的一道光,未知与迷惑在自己的脚下开始初露些许人生的充实与青春的回馈。

在追逐于DBA梦想的道路上步步前行。

___________________________________________________________________

面对自己不懂的知识面,抓住机会,就要“多问多学多看”。

——深蓝

___________________________________________________________________

第一个故事:多看——服务器磁盘的损坏

现象:服务器启动不正常。

开始说之前,想提的是,作为一个想从事数据库方面或是IT领域的人士们,不要认为小概率的事情就不会发生。因为这次发生的就是小概率。

下面记录了一个小操作,源于服务器的一块磁盘损坏,致使服务器在安装操作系统后,启动卡在滚动条界面。开始的时候,不知道这是怎么回事。看到系统厂商的工程师,敲击了下“ESC”,这才云开雾散,因为这时我看到了系统的启动过程,报出了检测一块dev设备(磁盘)时遇错了,而无法继续下去。突然想到这块磁盘在昨天硬盘指示灯确实红灯亮起过,报过故障了。只不过后来恢复正常绿灯了(不知道为什么),想毕应该是这块硬盘仍然存在不确定问题(排除了松动,怀疑存在坏道或控制器损坏等原因)。于是借由硬件厂商联系了服务器厂商(浪潮原厂工程师),一番描述后,联系好第二天会到现场检测。再之后,浪潮来的工程师更换了这块故障磁盘,系统启动恢复正常。因为磁盘做了RAID5,允许一块磁盘损坏。所以操作系统和原磁盘数据并未损坏和丢失。而最终确定,系统无法启动是因为自检这块磁盘时不通过,因为系统不通过检测,系统就会反复的对这块磁盘进行检测,从而出现了卡顿现象。

最后想说的是,这个服务器是跟随项目全新上线的,从系统集成商来装系统,到我方在现场检查硬件情况,前前后后,不出一周时间。而就在没有任何业务压力的情况下,一块磁盘莫名其妙的坏掉了。但遇到这种情况,见得多了就不以为新奇了,任何电子产品都有可能出现不确定问题。这也就是为什么会有容灾方案的原因吧。哈,所以这才意识到,硬件厂商的质保期不是没有用的,因为在出厂的时候,可能厂商就预见到了会有损坏的,这种情况是目前人为所不能控制的。但转念一想,是不是暴漏本身产品的质量缺陷呢?联想到了锤子手机的碎屏险,是不是因为工程师预见了屏幕的破损概率大,于是就做出了一个质保的方案呢(我这里胡思乱想了)。也怀念曾经的“诺基亚”,假设不给质保也不会担心有损坏问题(质量好啊)。但,或许这正是人类科技水平发展的道路上,在探索的过程中必然要经历的,进步是需要付出一定代价的。

至此,想再提一下这个简单的操作:就是在启动LINUX系统时,在进度条界面,如果我们点击ESC就会看到系统启动时进行的操作。如下图:

点击“esc”,可以看到启动过程,如下:

说实话,以前还真不知道。

挫折其实就是迈向成功所应缴的学费。

追逐DBA(13):协调硬件厂商,六个故事:所见所感的“服务器、

相关文章:

你感兴趣的文章:

标签云: