在选择供应商时,可靠性是一个至关重要的因素。拥有良好正常运行时间记录的供应商可以确保您的业务平稳高效地运行。
如何评估供应商的可靠性
评估供应商可靠性的最佳方法是查看他们的正常运行时间记录。正常运行时间是指系统或设备在特定时间段内运行且无故障的时间百分比。正常运行时间通常以百分比表示,例如 99.9% 或 99.99%。
寻找具有以下正常运行时间记录的供应商:
- 99.9% 或更高: 这是非常高的正常运行时间,表示该供应商非常可靠。
- 99.5% 至 99.9%: 这是一个良好的正常运行时间,但不是非常好。该供应商可能比具有更高正常运行时间的供应商更易出现故障。
- 99% 至 99.5%: 这是一个较低的正常运行时间,表示该供应商经常出现故障。您应该仔细考虑是否从该供应商处购买产品或服务。
您还应该考虑以下因素:
- 供应商的历史: 供应商的正常运行时间记录应覆盖一定的时间段。这将帮助您了解供应商的可靠性是否一致。
- 供应商的客户评价: 阅读其他客户对供应商的评论。这将为您提供有关供应商可靠性的第一手资料。
- 供应商的服务水平协议 (SLA): SLA 是供应商与客户之间的一份合同,概述了供应商将提供的服务水平,包括正常运行时间目标。确保 SLA 中包含明确的正常运行时间目标。
选择可靠供应商的好处
选择可靠的供应商有很多好处,包括:
- 更少的停机时间: 停机时间是您的业务或系统无法运行的时间。可靠的供应商将有助于最大程度地减少停机时间,从而让您的业务平稳高效地运行。
- 提高生产力: 当您拥有可靠的供应商时,您不必担心系统或设备出现故障。这将使您可以专注于发展业务,而不必担心技术问题。
- 提高客户满意度: 可靠的供应商将有助于确保您的客户获得所需的服务。这将提高客户满意度并帮助您留住客户。
- 减少成本: 停机时间和故障可能会给您的业务带来高昂的成本。选择可靠的供应商可以帮助您减少这些成本。
结论
在选择供应商时,可靠性是一个重要的因素。拥有良好正常运行时间记录的供应商可以确保您的业务平稳高效地运行。通过评估供应商的正常运行时间记录和考虑其他因素,您可以选择一家可靠的供应商,这将使您的业务受益。
产品的可靠性指标有哪些
这是我以前的一个回答:我只是个学生,只是喜欢找了些资料觉得还好,希望能对你有帮助可靠性即产品在规定的条件下、在规定的时间内完成规定的功能的能力,是衡量产品品质的关键要素之一。
H3C在该领域经过多年的实践和积累,教训很多收获更多。
本文以H3C产品为例,就通信产品硬件工程类的可靠性保证作简要探讨,借此让大家对通信设备以及H3C产品从研发到量产的可靠性过程有个初步了解。
随着互联网的普及,网络正成为人们工作和生活越来越重要的组成部分。
人们用它听歌看电影玩游戏,企业用它建立运营体系、存储数据、下发生产指令。
试想某天当我们无法上网时,会是怎样的境况?你将无法在MSN上和好友畅聊,无法在Google地图上查找交通路线,无法在家了解股票行情……习惯依赖互联网的我们将不得不改变生活方式。
对于企业来说,停机除造成直接的经济损失外,还可能引发社会影响和信任危机。
美国Infonetics Research对80家大型企业调查发现,由网络故障造成的损失平均占年销售额的3.6%。
就像电话一样,人们希望网络也能“想用就用”,可靠性的专业术语就是“可用度高”。
实现高可用网络的方法,除了像冗余备份、提高故障诊断能力、增加备件这些减少设备宕机时恢复时间的方法之外,还包括一个重要的指标就是设备的可靠性。
可靠性管理:可靠性保证和增长的基础之所以把可靠性管理放在第一位,优先于可靠性设计、分析和试验,是因为我们认为后者都是具体的、细节的技术或方法,是可以短期内修正或完善的,而可靠性管理则代表了一个公司可靠性领域在流程和制度上的成熟度,需要时间、实践、经验和数据的积累和沉淀,可以说是员工心智和公司文化的体现。
H3C经过两年的实践摸索,于2005年正式将可靠性纳入公司的流程管理,作为产品开发过程中的重要一环。
对于研发的每款产品,我们都会制定相应的可靠性规格和过程实施计划。
可靠性规格是产品概念阶段在可靠性指标上的承诺,根据各方面的需求决定出要做什么样的产品。
可靠性过程计划则明确定义什么阶段、由谁、完成哪些可靠性工作,达到什么目标,过程如何规范,交付哪些内容,在执行上保证了规格承诺的兑现。
举例来说,器件管理和优选便是可靠性管理体系中的重要组成部分。
做过产品开发的人都知道,不同厂家的同型号器件,往往很难做到所有参数完全一致。
当器件参数不一致时,产品在设计初期就需要考虑通过容差设计来兼容这些器件,这样就对设计和制造提出了更高的要求,一定程度上提高了设计制造的难度和成本。
随着供应商和器件型号的增加,管理费用迅速上升,彼此沟通变成了一个费时费力而且低效的工作。
另一方面,设计和制造也不断出现由“兼容设计”引起的问题,允许免检直接入库的器件变少。
对于这种问题,在H3C,有专门的部门负责器件优选和认证管理工作,他们跟踪业界器件技术发展的动态,对制造、客户出现的器件问题进行跟踪和数据搜集,提供各类优选器件清单,使器件选型工作简单有效。
当有器件需要替代时,必需经过足够的审核、测试和小批量验证才能被规模使用。
可靠性增长的一个重要方法是应用FRACAS系统(Failure Report Analysis and Corrective Action System),其原理是利用“故障反馈、闭环控制、预防再发生”,通过一系列规范化的工作程序,及时报告产品故障,分析故障根因并纠正,通过临时规避措施减少故障的影响,通过预防再发生的解决措施实现产品可靠性的增长。
在H3C,从研发、试产、生产到客户现场,各环节不同程度都在实施故障报告和闭环。
以HASA(Highly Accelerated Stress Audit,高加速应力稽核)流程为代表,该流程融入了FRACAS和8D的思路,对每一台HASA过程出现问题的设备,都建立流程跟踪,从条码记录、故障现象、故障风险分析、根本原因总结到解决措施、闭环实施,把各环节有机整合起来,实现发货前检验的高效率和问题闭环的有效性。
将每个HASA失效都看作改进过程的机会,从而使解决问题的投入达到利益最大化。
有人说,世界上只有上帝可以不用数据说话。
根据流程,我们把所有和可靠性相关的关键数据都集成到了QA系统的可靠性模块。
在这里,可以查到某款产品在特定发货时间的市场失效情况,可以跟踪市场实际MTBF、累计失效率、制造批次相关的失效率等等。
通过数据分析和同类产品比对,去发现设计、制造、管理各环节可以提高的机会,实现进一步的可靠性增长。
良好的可靠性管理通过建立一套严格的纪律,指导我们什么时候要做什么事情;可以让今天的教训成为明天的预防,在明天就“一次性把事情做对”;可以让我们“站在巨人的肩膀上”,做任何事情都不是从零开始。
而所有的目的,只是为了实现可靠性目标的承诺,保证提供给客户的产品,在承诺的时间内是高可靠的、是满足客户要求的。
可靠性设计:关注细节,重在执行谈到电子产品可靠性设计,我们几乎马上会想到热设计、元器件降额、容差容错设计、可靠性预计等等。
就像小学作文,中心思想是确定的,关键看如何写这篇文章。
可靠性设计是否成功,有两点必不可少,其一是执行,其二是细节。
我们先说执行。
以降额设计为例,不少公司都有降额设计规范,看上去很美。
但这个规范是否被严格执行了还是被束之高阁,超出降额的器件有没有被专业评估,降额要求是否根据制造/市场元器件的表现调整,不同产品是否需要分别对待实现全寿命成本最优,都是可靠性实现的关键。
再如热设计,在H3C,热设计由可靠性工程师保证。
每款产品,在开发初期,都会对散热进行评估和仿真,提前释放散热风险。
在整个评估过程中,可靠性工程师和结构工程师、产品开发人员、互连设计工程师的沟通是非常紧密的。
风险没有释放,就不能通过下一个技术评审点。
其次是细节。
航空爱好者知道,1980年,阿丽亚娜火箭第二次试飞时,一名工作人员不慎碰落一个部件的商标,堵塞了发动机燃烧室的喷嘴,造成发射失败。
1985年,美国发射“三叉戟”导弹,由于发动机燃烧室中剥落了一块黄豆大的绝缘层,结果高温火焰烧穿了那里的金属壁,燃气向外喷射,发动机爆炸。
可靠性设计是一个需要注重细节的工作,所谓“千里之堤,溃于蚁穴”,“Paying attention to details”是直接写入到美军标338中的,或者这也是经验和思考的总结。
以H3C为例,热设计中的热仿真过程不但仿真常态情况,还会对风扇停转等异常状态进行仿真;在降额设计上,对各类器件电应力进行遍历审查,对不同风扇转速下热应力进行遍历测试,保证在规定环境下每个器件承受的应力满足降额要求;对易损耗的器件进行寿命评估,保证在规定时间内设备符合用户的要求;对关键电路进行容差设计和仿真,保证器件参数随环境应力、寿命漂移时,电路依然可以可靠工作。
可靠性分析:防患未然,心知肚明可靠性分析主要包括三部分:可靠性预计、FMEA(故障模式影响分析)和FTA(故障树分析)。
可靠性预计通过MTBF、返修率等指标作为维修、备件成本的预计,或整网可用度的评估,对设备可靠性增长贡献不多。
FTA构造繁杂、对人员经验和技能要求高、容易出错。
对于复杂产品,FMEA是一个防患未然的有效方法。
举个简单的例子,我们有时会遇到十字路口红绿灯失效的情况,想想我们最不希望哪种失效现象出现?显然,当两条路上同时出现绿灯时交通事故隐患就被埋下了,这是我们最不希望发生的。
那么在开展交通信号灯控制系统的FMEA分析时,就要关注哪些器件失效会出现绿灯同时点亮的情况,是否有解决方法。
在H3C,复杂系统会开展FMEA分析工作,从而对系统中可能出现的故障现象做到心知肚明,评估容错设计是否足够。
对于冗余备份系统,保证失效发生时设备可以快速倒换,业务正常运行不受影响。
可靠性试验:真金不怕火炼我们研发出来的每一款产品,都会经受可靠性试验的洗礼,其中最严酷的当属HALT试验(Highly Accelerated Life Test,高加速寿命试验)。
90年代HALT试验在国外获得推广,而国内企业由于各种限制起步相对较晚。
与传统的施加模拟客户环境的应力来发现故障的环境试验不同,高加速应力是一种主动的试验。
使用应力步进的方法,使设备不断接近极限应力,直到故障暴露。
通过“暴露缺陷—不断改进—再试验—再改进”的方式,持续发现并解决设计、来料、工艺等相关问题,从而获得产品的快速稳定。
这有点像运动员的训练,如果要参加100米短跑比赛,那么运动员平常训练时绝不会只是重复训练100米冲刺,力量和耐力的训练必不可少。
同样道理对于产品来说,虽然标称工作环境是0~40/45℃,HALT试验过程中其实都会经受100℃高温和-40℃低温的极限考验。
到这里,可能你会提出两个问题:1,HALT试验做到-40℃和100℃有没有必要,室内应用的产品,怎么可能有这样的环境?经验告诉我们,非常必要且获益匪浅!按照H3C工程师的说法,现在不作HALT试验“心里没底”。
2,厂家宣称的0~70℃的器件能在-40~100℃环境工作吗?实践表明,在可靠的电路设计下,器件完全可以承受比规格更高的应力(极少数器件例外)。
如果你是做可靠性的同行,或者正在经受HALT问题的煎熬,可能还有第3个疑问,为什么可以用环境应力暴露未来5年甚至10年可能出现的可靠性问题?研究一下元器件资料,看看容差设计的原理和品质管控方面的书籍,就会发现一个共同点:器件参数漂移。
当一个器件在极限环境应力下参数漂移范围比工作5年参数漂移范围更宽时,只要该器件在电路环境中能承受极限应力,你就基本可以放心未来5年参数漂移引发失效的模式不会在电路中发生。
其他原因如振动累计损伤、磨损引起的失效加速分析等,这里不再展开。
除了HALT试验,在H3C,我们还采用了一个时尚前卫的可靠性保证手段,那就是HASA筛选。
研发出来的产品,到量产后,由于器件批次间的参数离散、工艺控制的原因,可靠性有可能会降低。
HASA利用温度、振动、电应力、数据流量等多应力同时施加的方式,有效筛选出故障设备,从而实现量产产品在质量和可靠性上的快速稳定。
我们通常的HASA筛选应力远超出设备工作应力,比如温变率,典型应用环境温变率不会超过0.5℃/分钟,H3C筛选应力是40℃/分钟。
其他常规试验如温湿度类试验、机械类试验、EMC的浪涌/静电/抗干扰试验,都是H3C产品的必检项,通不过这些试验,产品是无法到达客户手中的。
结语行文至此,相信你已对通信设备以及H3C产品可靠性保证体系有了简单了解。
钢铁铸就源于千锤百炼,打造质量卓越的产品永远是我们孜孜以求的目标。
参考资料:钢铁是怎样炼成的?——浅谈通信产品的可靠性保证
[寻找磁盘可靠性新标准]磁盘驱动器在寻找数据时
各大存储厂商一直都在强调磁盘可靠性对于整个存储系统的重要性,并用各种参数来说明自己的磁盘产品的高可靠性。
但事实上,相比于用户对于可靠性的需求来说,目前存储系统的可靠性技术发展已经滞后了,并且,评价可靠性的各种参数也不再适应当今用户的需求了。
因此,我们需要寻找新的标准来衡量磁盘的可靠性和使用年限。
据统计,有20%到25%的存储系统故障是由于磁盘问题所引起的,而且,磁盘驱动器的实际故障率是厂商们声称的15倍甚至更高,用户更换磁盘的频率也远高于厂商的统计数字。
上面这些统计数字让我们不得不更重视磁盘的可靠性,因此,用户在设计可靠性存储系统时应综合考虑更多的因素,如选择更可靠的磁盘类型和支撑架、使用冗余技术来应付组件故障、给不同的存储子系统配备独立的连接等。
在存储领域,MTBF(平均无故障时间,mean time between failures)和AFR(年平均故障率,average failure rate)一直都是存储厂商们自我评价的标准,同时也是用户在选购时非常关注的重要参数。
那么,为什么存储厂商和用户都会如此地关注这两个参数呢?从存储厂商的角度来看,他们希望用这样的数字来表征技术的发展。
现在,厂商们纷纷宣称自己的磁盘产品的MTBF已经达到了100万至150万小时的水平,相当于114年到170年,这样的年限甚至已经远超过了一般人的寿命。
MTBF是用来衡量存储产品的可靠性指标,具体来说,是指相邻两次故障之间的平均工作时间。
“但现在,MTBF这个参数已经变得越来越没有意义了,因为用户越来越弄不清楚这个数字究竟代表了什么。
”Data Mobility的分析师Robin Harris说:“存储厂商们都在宣称自己的磁盘产品的平均无故障时间已经达到了100万小时,甚至更长的时间,但事实上,磁盘根本就坚持不了那么久,这让很多IT主管以及数据中心中的管理员们都感到十分困惑。
” “这些被‘冠名’为MTBF或者是AFR的数字真的能够帮助用户衡量磁盘驱动器的好坏吗?”曾经是EMC员工,现在是一家咨询公司IT顾问的Steve Smith对此提出了自己的质疑。
其实,甚至连存储厂商NetApp自己也承认了这一点。
当有用户在分析机构Data Mobility所运营的StorageMojo博客上发表了一篇公开信来抗议实际的平均无故障率时间要比厂商标称的高出好几倍时,NetApp的回复是:大部分有经验的用户都知道,存储领域的磁盘故障率跟汽车厂商所标称的每公里耗油数的定义有些类似。
也就是说,关于磁盘故障率的问题,就好比是开同样的车、使用相同的汽油,但是跑的公里数却不一样,在平均无故障时间上出现的偏差在很大程度上是因为用户没有在最佳的环境中配置和使用磁盘。
很明显,这样的解释不免有些牵强。
MTBF已经过时 最近,很多研究机构对MTBF和AFR等衡量存储特性的参数进行了新一轮的研究,研究结果可以用这样的一句话来总结:在磁盘的可靠性和故障率的问题上,用户和存储厂商显然是行驶在了不同的车道上。
“事实上,MTBF确实是经过了实际的压力测试和科学的统计学推断而综合得出的数据。
但是,大家不要忘了,当存储厂商们宣布自己的磁盘产品的MTBF为30万小时的时候,他们实际上是在说,在经历测试的所有磁盘中,经过30万小时的运行后,只有一半出现了故障。
”Harris表示,“如果是这样的话,MTBF似乎对于某个磁盘驱动器能够使用多久并没有什么参考价值。
也就是说,MTBF根本无法准确地表达出某个磁盘真实的故障率分布。
” “MTBF参数就好比是某一地区女性的平均身高这类统计数据一样,我们并不知道这个身高平均值的基数以及具体某个人的身高。
其实,当初MTBF成为了衡量存储性能的标准参数的原因也就在于,人们觉得其在表示了磁盘可靠性高低的同时,不用去了解那些让人弄不懂的具体细节。
”Smith表示。
“但是,在今天,MTBF这种简化了的参数已经不能再适应用户的需求了。
”Smith补充说。
Gartner的分析师Stan Zaffos也同意Smith的观点。
不过,他也表示,MTBF还是能够比较准确地反映出存储厂商的技术发展水平,只不过这个参数对于用户来说理解起来比较困难,或者说这个数字对于用户来说意义已经没有以前那么大了。
“要想真正地理解MTBF并不是一件容易的事情,它需要IT管理者有很多工程方面的经验和概率统计学方面的知识。
”Zaffos补充说。
不吻合的三大原因 “现在,存储业界已经逐渐开始使用AFR来代替MTBF,以达到让用户更容易理解的目的。
”Harris介绍说。
同时,Carnegie Mellon研究中心的Bianca Schroeder也表示:“用户或许应该更想知道,在某一年中有多少比例的磁盘会出现故障。
” 不过,据Carnegie Mellon的一项调查研究结果显示,磁盘的更换率也比存储厂商所提供的AFR数值高很多。
厂商们提供的资料显示,AFR一般在0.58%到0.88%之间,但调查结果却表明,实际的年平均磁盘更换率超过了1%,一般来说在2%到4%之间,更高的甚至达到了13%。
“在这里需要强调的是,我们在此次调查中搜集了许多大型存储系统更换磁盘的数据,其中涉及了10万个左右的SCSI、Fiber Channel和SATA磁盘,因此数据的可靠性还是有所保障的。
”Schroeder补充说。
Schroeder还介绍说,研究发现,磁盘的更换率还会随着其使用时间而逐步升高,尤其是当磁盘使用了5年以后,磁盘驱动器通常就会开始老化。
这项发现与很多用户的普遍看法非常吻合,但同时却与厂商所提供的AFR出现了很大程度上的不吻合。
对于出现这种不吻合的一种解释是,此项研究结果关注的是更换了多少磁盘,而AFR描述的是有多少磁盘预计会出现故障。
“的确,故障与更换并不能划等号。
举个例子,用户可能会在磁盘稍有异常的情况下就将其更换掉了,而这块磁盘其实仍然还可以使用。
”Schroeder也解释说。
此外,出现这种不吻合的第二个原因可能是,存储厂商的测试环境一般都是十分理想的,而用户真正的使用环境通常就无法达到这样的水平。
“用户在使用磁盘时,很多情况都可能会导致磁盘的损坏,比如振动、电涌、尘土和湿度等。
”Zaffos介绍说。
而第三个原因可能就在于,存储厂商和用户对于故障的定义并不同。
比如,当磁盘驱动器厂商拿到一块返厂的磁盘时,他们会把磁盘插进测试设备中,如果发现没有问题,就会贴上“no trouble found”或者“NTF”的标签。
事实上,据统计,有20%到30%的返厂磁盘上都被贴上了“no trouble found”的标签。
但如果用户拿一个这样的磁盘插进自己的服务器中,就会发现根本不能用。
那么,对于用户来说,它就还是一块需要更换的坏磁盘。
当然,客观地说,在对磁盘的好与坏的判断上,厂商和用户都没有原则上的错误。
这就正如Google的一项研究发现,磁盘的故障在很多时候是由于匹配不当所造成的,比如磁盘驱动器与控制器的不匹配。
有的时候,用户在认为是坏了的磁盘驱动器中更换一个控制器后,就会发现仍然可以使用。
据说,在Google的研究过程中,还发生了一件很有意思的事情:有一块在用户那里无论怎样都不能使用了的磁盘,在测试人员手中却始终显示一切正常。
伊利诺斯州立大学的一项研究也证实了这个发现。
在分析了个商业存储系统和180万个磁盘错误记录后,得出了这样的结论:虽然存储系统出现的故障有20%到25%是由于磁盘问题所引起的,但系统的其他部分,比如物理连接或是协议栈等也是引起磁盘问题的重要原因――物理连接问题导致的故障占到了27%~68%;而协议栈问题导致的故障占到了5%~10%。
理论上的MTDL 另一个从MTBF衍生而来的参数是MTDL(平均数据丢失时间,mean time to data loss),MTDL是指一个组件可能失败使数据不能访问的时间,其主要是存储子系统厂商所使用的参数,磁盘驱动器厂商一般不会涉及,因为这个参数主要考虑的是所使用磁盘的数量、弹性、重建时间以及系统冗余的数量和类型。
Harris认为,MTDL是个相对来说更有用的数字,不过也只是停留在了理论阶段。
实际上,伊利诺斯州立大学的一项研究同样也对这个参数提出了质疑。
研究发现,存储子系统的故障表现出了很强的相关性,也就是说,在某一次故障发生以后,发生同样故障的几率要增大很多,且故障发生的时间也十分接近。
“而平均数据丢失时间的前提就是故障的随机不相关性。
但事实上,故障却并不是随机的,且故障之间是高度相关的,因此理论计算结果也并不能与实际相吻合。
”Harris说。
也许是因为磁盘驱动器是物理设备,既然是物理设备就一定会老化,也自然就会出现这种实际与理论上的不吻合。
事实上,据Google和Carnegie Mellon的一项联合调研表明,一旦磁盘驱动器使用超过了三年,AFR的值就会开始增大。
“其实,使用过大容量磁盘的用户早就已经有这样的经验了。
”Harris说,“如果用户只购买了200个磁盘,那么三年后,AFR这个数字对于他们来说就非常重要了,因为这个时候就要开始考虑更换磁盘了。
”当然,是否真的要更换还取决于用户对于数据的重视程度和对于系统的稳定性要求,以及用户自身备份系统的好坏。
寻找新标准 回到问题的本质,存储厂商该如何告诉用户他们所购买的磁盘究竟能够用多久?很多业内人士认为,MTBF还没有被抛弃的原因就在于,还没有找到能够替代它的参数。
“其实,现在大多数用户都希望能有一种新的评价标准来表征存储产品的可靠性,但是要想找到这种新标准却并不容易。
”Schroeder说。
Smith也同意这个观点,不过,他也表示,总会找到一种方式可以用来区别不同磁盘驱动器的可靠性程度。
此外,Smith还认为,其实存储厂商们拥有更“确切”的数字,只是他们不愿意公布出来。
“事实上,对于该如何更好地评价存储产品的可靠性,最为了解的莫过于大型磁盘阵列厂商了。
但是,他们却不愿意更清楚地告诉用户,因为这样就会减少他们在‘解释这个数字’的过程中所创造出来的附加价值。
”Smith说。
当然,还有一种办法就是使用实测的数据。
“但是,这样也很麻烦,有研究发现,磁盘的使用时间越长,故障率就会越高。
所以,从那些只使用了一年的磁盘上获得的统计数据也并不能应用到使用了多年的磁盘上。
”Schroeder说。
“也许,我们应该测出磁盘驱动器每年的AFR,但即使是这样,仍然有很多因素会影响到这个数据的真实可靠性,如运行状况和工作负载等。
”Schroeder补充说。
的确,很多影响磁盘可靠性的因素使得存储厂商们也很难建立起符合现实的模型。
不过,Schroeder也同意Smith的观点,存储厂商们应该、也有责任提供更多的数据让用户更好地了解磁盘的真实可靠性,如实际的磁盘更换率和潜在的扇区错误等信息。
目前,Carnegie Mellon就正在与Usenix合作建立一个记录不同种类、不同使用年数和不同容量的磁盘的故障信息数据库。
此外,Smith还介绍说,除了磁盘的可靠性以外,对用户影响最大的莫过于坏磁盘了,因为某个磁盘的故障可能还会牵连到其他磁盘。
“这也就是为什么对磁盘的安装做物理分析非常重要的原因,因为这样会找到系统中的一些代码缺陷或是一些坏的部件。
”Smith说,“当然,拥有成熟的服务和技术支持来跟踪系统运行并查找错误也非常重要。
”(主要内容译自《Computerworld》) 评论 谁来保障可靠性? 110万小时、114年,面对这些似乎让人有些不敢相信的数字,用户是不是可以得出这样的结论――磁盘驱动器的可靠性已经很强,因此完全可以不用再在乎MTBF和AFR之类的数字了?那么,在购买磁盘时,MTBF和AFR等参数还是影响用户选购的关键因素吗? 其实,已经身经百战的用户们也明白这些存储产品的MTBF有些过高了,这些数字对于他们来说已经不那么重要了,甚至他们已经根本不在乎了。
比如,两个磁盘厂商所提供的磁盘产品的MTBF相差10%,用户会觉得这是很大的差别吗?似乎100万小时与110万小时已经没有什么本质的区别了。
与此同时,用户们也开始觉得,让存储系统更可靠的途径似乎只有加固整个系统的架构,而并不是寄希望于磁盘。
除非存储厂商们可以用事实证明他们的磁盘是值得信赖的,磁盘的可靠性才能真正地成为保障存储系统的关键。
但是,现在的情况是,用户对磁盘驱动器的可靠性的需求增长越来越快,但存储厂商却并不能完全达到用户的需求。
25年前,2万小时的MTBF就非常不错了,而今天,虽然这个数字已经达到了百万小时,但似乎已经失去了原有的意义。
因为,相比磁盘可靠性的这种进步,用户遇到的问题似乎更多,并且这一差距还越拉越大。
(田梦)
作为采购人员,你认为如何选择合格的供应商?
选择方法:
供应商开发的基本准则是“Q.C.D.S”原则,也就是质量,成本,交付与服务并重的原则。
在这四者中,质量因素是最重要的,首先要确认供应商是否建立有一套稳定有效的质量保证体系,然后确认供应商是否具有生产所需特定产品的设备和工艺能力。其次是成本与价格,要运用价值工程的方法对所涉及的产品进行成本分析,并通过双赢的价格谈判实现成本节约。
在交付方面,要确定供应商是否拥有足够的生产能力,人力资源是否充足,有没有扩大产能的潜力。最后一点,也是非常重要的是供应商的售前、售后服务的纪录。
扩展资料:
广义的选择供应商过程包括以下步骤:
1,分析市场竞争环境。这个步骤的目的在于找到针对哪些产品市场开发供应链合作关系才有效,必须知道产品需求是什么,产品的类型和特征是什么,以确认用户的需求,从而确认供应商评价选择的必要性。同时分析现有供应商的现状,分析、总结企业的存在的问题。
2,建立供应商选择目标。企业必须确定供应商评价程序如何实施,信息流程如何,谁负责,而且必须建立实质性、实际的目标。其中降低成本是主要目标之一,供应商评价、选择不仅仅就是一个简单的评价、选择过程,它本身也是企业自身和企业与企业之间的一次业务流程重构过程,实施得好,它本身就可带来一系列的利益。
3,建立供应商评价标准。供应商综合评价的指标体系是企业对供应商进行综合评价的依据和标准,是反映企业本身和环境所构成的复杂系统不同属性的指标,按隶属关系、层次结构有序组成的集合。
根据系统全面性、简明科学性、稳定可比性、灵活可操作性的原则,建立集成化供应链管理环境下供应商的综合评价指标体系。不同行业、企业、产品需求、不同环境下的供应商评价应是不一样的。但应涉及到供应商的业绩、设备管理、人力资源开发、质量控制、成本控制、技术开发、用户满意度、交货协议等方面。
4,建立评价小组。企业必须建立一个小组以控制和实施供应商评价。评价小组必须同时得到制造商企业和供应商企业最高领导层的支持。
5,供应商参与。一旦企业决定实施供应商评价,评价小组必须与初步选定的供应商取得联系,以确认他们是否愿意与企业建立合作关系,是否有获得更高业绩水平的愿望。
企业应尽可能早地让供应商参与到评价的设计过程中来。然而因为企业的力量和资源是有限的,企业只能与少数的、关键的供应商保持紧密地合作,所以参与的供应商不宜太多。
6,评价供应商。评价供应商的一个主要工作是调查、收集有关供应商的生产运作等全方面的信息。在收集供应商信息的基础上,就可以利用一定的工具和技术方法进行供应商的评价了。
在评价的过程后,有一个决策点,根据一定的技术方法选择供应商,如果选择成功,则可开始实施合作关系,如果没有合适供应商可选,则返回步骤2重新开始评价选择。
7,实施合作关系。在实施合作关系的过程中,市场需求将不断变化,可以根据实际情况的需要及时修改供应商评价标准,或重新开始供应商评价选择。在重新选择供应商的时候,应给予旧供应商以足够的时间适应变化。