停止灭火 【特写】

在商业机构中,存在的问题始终多于人们有时间处理的问题。在最好的情况下,这会导致小问题无人问津的情形。在最坏的情况下,长期灭火会消耗企业的资源。研发及制造流程复杂的企业尤其容易发生破坏性的灭火行为。管理者和工程师在任务间奔忙,一项任务尚未完成,又被另一项任务打断。认真解决问题的努力沦为了应急的修补。生产力蒙受损失。管理工作成为了不断决定把超负荷工作的员工派往何处以及暂时忽略哪一个初期危机的杂耍行为。

在好几年的时间里,我和已故的同事拉姆钱德兰·贾伊库马尔(Ramchandran Jaikumar)对许多制造和新产品开发环境中的灭火行为进行了观察。当我们描述我们之所见时,人们立刻意识到我们在谈论什么——事实上,他们中的多数人表示,他们在自己的职业生涯中一直在灭火。然而,除了少数例外,灭火综合征一直未出现在组织理论家的雷达屏幕上。它值得更多的关注。事实上,灭火是许多复杂的、变革驱动流程的管理者们面临的最严重问题之一。

根据我们的观察,对灭火行为的最好描述是一系列症状。如果以下相互关联的元素中有三个长期存在于你的业务单位或部门,你就是患病之人。

·没有足够的时间解决所有的问题。存在的问题比解决问题之人——工程师、经理或其他知识员工——能够妥当处理的数量更多。

·解决方案不完备。许多问题是在进行修补,而不是解决。也就是说,表面效果得到了处理,但根本原因并未得到解决。

·问题反复出现且层出不穷。不完备的解决方案会导致旧问题重新出现或者实际产生新问题,这些问题有时会出现在企业中的其他地方。

·紧迫性取代重要性。正在解决问题的努力以及开发新流程等长远活动因必须灭火而一再中断或延迟。

·许多问题变成了危机。问题会悄然郁积,通常恰好在最后期限之前突然爆发。然后这些问题需要艰苦卓绝的努力来解决。

·业绩下降。如此多的问题未得到充分解决,如此多的机会被放弃,以至整体业绩直线下降。

最近的火星气候轨道探测器坠毁事件就是一个例子,说明灭火行为暗藏危险。究其原因,这次坠毁可以追溯到一个简单的沟通问题——一个工程小组使用的是公制单位,另一个使用的是英制单位——但这种解释掩盖了一个更为复杂的根本问题。根据美国航空航天局(NASA)在坠毁事故发生前不久公布的一份报告,项目早期的分包商人员数量比计划的少。这导致了工作延误、权宜变通和糟糕的技术决策,所有这些都需要以后抓紧赶工。工程人员是从其他处于初期的项目中借调而来——因而迫使这些项目身陷相同的境地。为保证按期完成任务,工程师们每周工作70小时,结果造成短期的错误频发和长期的效能下降。早期的警示信号未被注意或遭到忽视。根据坠毁发生之后的一份报告,导致坠毁的导航错误原本通过应急燃烧得到纠正,但由于其他紧急工作的挤压,是否执行燃烧的决定一直没有做出。这就是典型的灭火行为。

灭火不一定是灾难性的。显然,它会妨碍业绩,但还有更糟糕的可能性。比如,僵化的官僚规章可以帮助一家公司完全避免灭火行为,但代价是几乎没有问题得到解决。此外,有时即使是管理有方的企业也会暂时陷入灭火模式,而不会造成长期问题。危险在于,灭火力度越大,摆脱灭火行为的难度就越大。

有些企业从不灭火,尽管它们与灭火的企业有同样多的工作和同样多的资源限制。它们是如何避免灭火的?简而言之,它们有解决问题的强大文化。它们只有在致力于了解问题的根本原因并找到有效解决方案的条件下才会去解决问题。它们对问题进行鉴别分类。它们设定切实可行的最后期限。或许最重要的是,它们不奖励灭火行为。

灭火行为的一个简单范例

在我们进一步讨论灭火问题之前,我们需要更仔细地审视一下灭火的根本原因。一个简单的范例可以抓住本质的问题。(参见图表“问题如何在组织中流转”)

7-停止灭火-问题如何在组织中流转

让我们假设这一组织是某一工厂的工程团队,尽管它也可以轻易是一个研发机构或软件开发团队。当问题——因客户投诉、特殊订单、质量疏忽、供应商困难及其他原因所致——出现时,它们会被排入等候的队列,直到某位工程师有时间处理这些问题。

当工程师解决完一个问题时,他们会向负责这一问题队列的经理报告,决定哪些问题最紧急,每个问题应该让谁来解决。解决问题需要花时间:工程师必须研究症状,确认问题的真实性,进行背景研究,诊断原因,寻找好的解决方案,并实施解决方案。问题有不同的形态和规模,因此需要不同的时间。分配任务本身相当复杂。每位工程师会同时处理几个问题,而且每个人对某些问题的擅长程度高于其他问题。工程师可以团队工作,解决每个问题的团队可以不同。假期和日常工作让计划安排变得复杂。这些复杂事情中的每一件都会降低系统可实现的效率,并使管理者的决策更加困难。

这个系统中的一个关键数字是业务量强度——问题数量与用于解决问题的资源的比值。当问题更多或问题需要更长时间解决时,业务量强度会增加。当更多解决问题者加入进来时,业务量强度会减少。

业务量强度=(解决问题的天数)×(每天的新问题数)/工程师的数量

当存在一定余力时——当业务量强度低于80%左右时——系统运行良好。可是,当业务量强度接近100%时,问题就开始要排队等候一阵。当业务量强度大于100%时——即,当存在的问题多于能够解决的问题时,即使每个人都竭尽全力——企业会陷入真正的麻烦。队列越来越长,问题长时间内得不到解决。比如,假设一家工厂正在加紧生产一种新产品,每天大约会出现三个重大问题。四名工程师平均每人需要花两天时间解决一个问题,因此每天未解决问题的队列中会增加一个问题。到第三周结束时,有15个问题在等待处理。

8-停止灭火-合理的规则,不合理的结果

随着队列的加长,工程师和他们的经理们会感受到各种压力——知道进度拖后而自我施加的压力、来自立即想要产品的客户的压力、来自因客户投诉而感到不快的高级经理的压力。这个时候猛烈的灭火行为可能就开始了。出于政治原因,经理和工程师会让一些问题插队。他们会放下问题A(一台不断发生故障、造成瓶颈的机器),为问题B(一处严重的质量缺陷)寻找解决方案,因为B的比例达到了危机的程度。他们在问题C(为一组新的产品增强功能落实生产变化)上投入了大量精力,结果发现这些增强功能因在贝塔测试(beta testing)中无效而被无限期推迟。而且他们发现自己把更多的时间花在回应愤怒的询问上,而不是富有成效地工作。[参见边栏“合理的规则,不合理的结果”,获取企业对超长工作队列看似合理的应对方面的更多详细信息。]

换言之,恰恰在大部分工作需要完成之时,工作效率大大降低。工作积压的时间越长,陷入停滞的事情就越多。工程师们开始把时间花在正常工作之外——他们身陷会议之中,以确定下一步优先灭哪处的火;他们为订单被延误的客户处理特殊的加急任务;他们正在解决的问题后来“因事态发展而生变”。总之,在灭火行为大行其道之时,他们处理着随之而来的混乱和过量信息。然而,这还不是最糟糕的情况。

问题的解决事与愿违

真正的坏消息是,在灭火的状态下,压力会致使工程师在解决问题的时候不仅效率低下,而且方式糟糕。他们处理问题的时间不足以找出问题的根本原因——他们只会做出直觉诊断。然后,他们不是对自己假设的诊断进行线下测试,而是将仓促的改变引入流程。如果快速修复不能完全解决问题(通常不清楚它是否有帮助),他们会将其就地搁置,然后尝试另一种解决方案。他们之所以没有解决问题是因为他们没有花时间系统地处理问题。

在最好的情况下,这种肤浅的解决问题,或者说修修补补,也会比系统性解决问题耗费更多的时间。看看下面这个例子:一家钢丝绳制造商在一个工厂里有几百台机器。由于机器正常运行时间很重要,该公司鼓励维修工程师尽快对故障做出响应。即便如此,总体表现并没有改善。直到该公司开始按机器逐台保存和分析记录,而不是按人逐个进行此项工作之后,它才意识到工程师在维修一台机器时经常因另一台机器出现故障而被打断。他们会快速进行修复,然后继续维修下一台机器。结果证明,每一次最初的机器故障都会招致多次上门服务;平均而言,一个问题要修补三次才能最终得到解决。

修补不仅比系统性解决问题耗费更多的时间,而且也无法解决问题。一个较长的故事可以说明原因。我和一位同事最近帮助了一家电子企业解决一个重大的产量问题。该公司在一家美国工厂制造零件,然后在另一家工厂组装零件。正当一种新产品即将推出之际,该公司已将装配工作转移到亚洲,以降低劳动力成本。大概就在此时,装配产量崩塌了;一半甚至更多的设备出现故障。客户恳请提供更多的产品,但公司无法满足需求。结果就是灭火行为的大爆发。一个团队受命负责寻找快速解决方案。每个成员对于正在发生的事情以及改变流程会如何解决问题都有自己钟爱的理论。这家亚洲工厂尽职尽责地一个又一个实施试验“解决方案”。由于工厂的制约因素,获得每次试验的结果大约需要一个月的时间。

尽管这种情况持续了数月,但该团队在了解问题的原因上没有取得进展。因为团队成员认为他们没有时间,所以他们始终没有进行过对照试验,让同一批次的零件在亚洲和美国同时组装。因此,没有证据表明问题是由于两家工厂之间的差异造成的;问题有可能是因碰巧与工厂搬迁同时发生的制造上的改变而引发。毕竟,制造工艺也在同时提升。具有讽刺意味的是,该公司的高级管理层大肆谈论着使用现代质量方法和系统性解决问题的话题。可是,一旦来自客户的压力过大,人们就转而依靠修修补补的办法,认为它见效更快。

我们建议该公司对这个问题树立科学的认识。为此,我们在工厂使用了实验室实验、数学分析和大型对比实验。结果主要问题是以前不为人知的装配温度敏感性,这是前一年为解决某个问题而实施的工艺变化造成的直接结果。这种情况在美国和亚洲的工厂均有发生,但它们之间看似无关紧要的差异却使亚洲的情况糟糕得多。一旦弄清了问题的原因,解决问题就很简单了。基于新的认识,该公司还提高了其他产品的产量。这些认识使该公司与应对类似问题的竞争对手相比具有显著优势。用此方法解决这个问题花了几个月的时间,但灭火行为耗费的时间更长,却于事无补。

当随意出台变化方法时,就像在这个过程中一样,它们通常是在未经仔细研究的情况下制定的。比如,著名作家普里莫·莱维(Primo Levi)在二战后曾在一家油漆厂做过短暂的化学家。许多年后,他遇到了一位仍在那里工作的老朋友。这位朋友告诉他,这家工厂正在生产一种防腐涂料,其中含有一种可能加速腐蚀的化合物。当这位朋友向他的老板提出质疑时,他被告知这种涂料向来是这样制作的,这种化合物绝对必要,他不应该改变任何东西。巧合的是,当年是莱维首先在配方中加入了该化合物。他这么做完全是为了采取一项临时措施,防止一种重要原材料受到污染,可是当他离开时,他这么做的理由被人遗忘了,而配方却经久未变。

随意出台的变化方法会引起一个更严重的问题:它们很容易在流程中的其他地方产生新问题。这种事在软件开发中一直存在:在修补一个漏洞时,你又创建了另一个漏洞。工厂里通常也会发生同样的事情。在一家金属加工厂,为了提高一部分工艺的表现,工程师们改变了涂层的构成。数月之后,该公司最大的客户出现了一个重大问题:需要固定在橡胶部件上的金属框架不再贴附在该部件上。源于涂层变化的这个问题结果让客户和公司都付出了高昂的代价——当然,情况愈演愈烈,因为原因很长一段时间都不清楚。只要修补措施未经过仔细验证,修补工作就会产生新的问题。

修补在几种情形下是名正言顺的。比如,在软件开发中,添加检查特定错误的代码是常见的行为。如果发生该错误,软件会发送一条出错消息并终止进一步的计算。这之所以是补丁,因为它不能解决真正的问题,但它确实防止了问题的恶化。在制造业中,当存在尚未解决的问题时,通常会添加另一个检查步骤,以便可以撤销有缺陷的产品。这种淘汰提高了成本,但却避免了让缺陷零件过关。如果满足几个条件,这种肤浅的解决方案是可以接受的。首先,即使补丁没有解决问题的原因,它们也应该能改善大部分的损害。第二,补丁应该足够可靠,不会在稍后出故障。第三,它们应该比其他解决方案具有更好的效益成本比。这里的关键成本不是资金而是工程时间。

除这些例外情形之外,修补具有破坏性。解决率下降,隐藏问题的数量增加。(参见图表“灭火综合征的影响”)修补带来的新问题以及它未能解决的旧问题造成的乱子越来越多,直到新出现问题中有很大一部分实际上是旧问题的重现。工程师的环境变得越来越混乱,这使得进行实验、查明问题的难度加大。在某些情况下,企业解决问题的能力完全崩溃,整体表现直线下降。在这种时候,高级管理层可能需要采取断然行动——比如外包大量工作,关停并重启,或者引入大量外部援助。资金和管理时间主要消耗在这种转变上。即使在高管们进行干预的时候,他们有时也会因只应付当前危机而不解决深层次原因而让灭火工作变得更糟。幸运的是,有办法可以避免达到这样的危机点。

9-停止灭火-灭火综合征的影响

你可以预防起火

有几种方法可以消除灭火行为。它们大致可以分为三类:战术、战略和文化的方法。

战术方法。战术方法可以在不改变高层政策的情况下迅速实施。虽然有些方法在美国企业里具有文化难度,但一旦公司意识到灭火的危险,许多方法应用起来很简单。

增加临时解决问题者。当新问题的比例激增时,引进临时帮手是不错的短期解决之道。真正的消防部门会呼请邻近地区的消防人员前来对付最大的烈焰。在高科技领域,大多数硬盘驱动器企业在开始生产新产品时已经学会了直接将美国的开发工程师派遣到它们的亚洲工厂。这些额外的故障排除人员带来了关键的专业知识,因为他们通常在原型设计期间看到过相关的问题。此外,这种做法产生了强大的动机:美国工程师很快就认识到,修补开发中的问题会导致在升级过程中出现更多的问题,结果让他们在亚洲驻留更长的时间。

当然,临时员工也有其缺点。首先,只有当额外的工作量是零星的而非长期时,他们才会发挥效用。其次,将解决问题者从企业的其他部门抽调出来有可能会在原有领域引发火情。第三,临时员工通常不熟悉情况。

关闭运营。以前有人说过,一分预防抵得上十分治疗。当问题数量过大时,那就关闭运营,直到所有问题都得到解决。或者,仅在旧问题被排除时才允许新问题进入队列。文化中没有灭火传统的企业在产品升级过程中会本能这样做。一旦有一定数量的问题积压起来,惠普的一些开发中心就会关闭一条试生产线,因为在这些问题得到解决之前,检测和解决其他问题的稳定基础就不存在。很少有公司有勇气在正常运营期间限制问题队列的规模。

进行问题分类。限制队列的另一种手段是刻意做无论如何都会发生的事情:承认有些问题无法解决。从军事医学中借鉴的分类技术通过调节入口来控制队列。不要让问题无限期地排队,也不要让问题只为得到偶尔处理而在队列中一步一步向前挪动,而是要在问题刚一出现时就决定是否投入资源来解决问题。这项技术组织起来具有难度。告诉人们“我们会尽快着手解决你的问题”,并将其委托给某位超负荷工作的人,比表示“我们已经判定你的问题并不严重,所以我们不打算解决它”要容易得多。

战略方法。与战术方法相比,战略灭火方法实施的时间更长,但它们在一系列项目上和长期看收效良好。即使没有完全消除灭火行为,它们也会增加得到解决的问题数量。我们最初提到的几项变化主要集中在产品设计上,但它们也对制造环节产生了重大影响。

改变设计策略。新产品设计在过去的十年里已取得了长足的进步。在某些行业,企业已提高了跨代设计和跨产品设计的通用性。这减少了各代产品内部和跨代产品之间的设计问题数量以及制造过程中的变化,从而也减少了制造环节的问题。通用性可以通过模块化设计进一步提升,而模块化设计允许在改进产品的某一部分时不用对其他部分进行太多改变。

比如,硬盘驱动器企业过去让单独的团队负责一代接一代的驱动器——这导致在设计中,甚至连每种产品的螺丝都出现了变更。可是,他们逐渐采用了“平台”的概念。现在,只需通过更换磁头、介质和固件,以及更换电路板上最新最快的信号处理芯片,驱动器的容量就可以翻倍。新设计的制造方式几乎与之前的设计一模一样,问题都集中在新的领域。比如,希捷(Seagate)只需暂时将几位开发工程师调到工厂就可以将一些产品移交至制造环节;5年前,通常需要20位甚至更多的开发工程师。

将部分设计工作外包。汽车行业的企业已经转向“黑箱”设计:它们只规定子系统的特征,包括其尺寸、重量、功率要求和性能。建造子系统的分包商决定实现目标的最佳方式,包括使用哪些技术。虽然问题的总数可能不会减少,但许多问题已从中心设计团队中转移。

解决成类的问题,而非单个问题。有时可以将看似不同的问题归结成类,确定一组根本原因,然后对这些原因加以了解。一旦弄明白了原委,解决单个问题通常十分简单。

问题归类的一个例子来自半导体行业。当集成电路第一次被制造出来时,多数电路都因为缺陷而不得不扔掉。企业开发了描述故障的代码,根据这些代码测试出故障的电路。当特定代码造成的损失很高时,一个团队会试图找出原因。渐渐地,人们清楚地认识到,许多单独的问题都是由落在晶片表面并破坏电路的微粒造成的。因此,“微粒引起的缺陷”就是一个问题类别。它将工程师的注意力从各种具体的故障代码转移到了一个定义明确的问题上:了解微粒来自何处以及如何去除它们。

最终,企业重新设计了生产设施,将其改造成“净化室”,空气过滤器可在此去除微粒。随着电路变小,越来越小的微粒就成了问题。当工程师们意识到人们把微粒带进了净化室的时候,另一个突破就出现了。这又是一个问题类别:“来自人的污染”。这些企业要求员工身着特殊服装,禁止使用化妆品和其他涂抹皮肤的物质,一下子就解决了许多污染问题。

确定问题的类别需要对正式问题的解决做出刻意、广泛、持续的思考。企业必须长期关注源自企业不同部门的信息,开发科学模型,以便对流程产生更高层次的理解,并在工厂进行对比实验。这些恰恰是灭火行为推之门外的那种长期活动。

使用学习生产线。学习生产线是为了最大限度地真正解决问题而运行的生产线。与使用特殊设备和操作人员的试点生产线不同,学习生产线使用标准材料为客户制造真正的产品。因此,他们会面临工厂其他部门的所有无常变化,比如,不良材质批次、不可靠的机器和粗心的操作员。它们被用来收集数据、进行诊断实验、调试流程,并深入细致地解决问题,尤其是在制造升级期间。通常情况下,学习生产线的表现在工厂中是最好的,因为创新首先在那里落实到位,问题得到迅速发现并解决。使用学习生产线的部分技巧在于确保它忠实反映整个工厂的状况——并确保改进措施迅速移转到工厂的其余部分。实现这一点就不能把工程师隔离在学习生产线上。每位工程师都应该能够将学习生产线用作开展调查的实验室。

培养更多的解决问题者。全面质量管理(TQM)运动的一个成功之处在于,非工程师接受了培训,以解决简单的问题。尽管他们的速度和知识不及工程师,但技术人员及其他人可以处理许多更普通的问题,从而能够释放资源来解决难题。

文化方法。文化变革需要转变整个企业的思维方式和高级管理人员的行为。企业——甚至那些通常不灭火的企业——中的额外工作,偶尔也会产生开始灭火的压力。在这些时候,企业解决问题的文化至关重要。如果管理者脱离问题太过严重而看不到后果,如果奖励制度有利于灭火人员,那么灭火行为的恶性循环就会开启。避免这种情况取决于中高级管理者秉持的文化。我们建议遵循以下指导原则。

不要容忍修补行为。这一点的重要性已经讨论过,但它的施行需要各级管理层的支持。比如,在英特尔公司,管理人员自首席执行官以下都有丰富的生产线问题解决经验,能够区分修补措施与真正的解决方案。如果下属发现草率的解决方案又卷土重来,令他们伤透脑筋,从组织上讲,他们会避免修补行为。

不要不惜一切代价去赶最后期限。这样的目标总是会青睐灭火行为。相反,要灵活对待最后期限。要根据未解决问题的数量来衡量开发项目。大多数企业会衡量“未决问题”和产品发布后发现的问题,而且许多优秀的工厂都有未解决问题的准确列表和衡量指标。如果该列表在产品推出后保持不变或增长超过一个月,那么该企业就处于灭火模式。

不要奖励灭火行为。在大多数美国企业中,英雄是扑灭最大火灾的那个人。可是,问题开始时,这些英雄在哪里?为何他们不在问题变得如此严重之前更快介入?企业应该奖励那些没有太多火灾需要扑灭、施行长期预防和系统性解决问题的管理者。

建设解决问题的企业

在当今高度动态化的商业环境中,负责人的关键任务是创新、改进和应对出乎意料的局面。“意外”以问题的形式出现,而问题的解决通常可以打开创新和改进的大门。从这个角度看,管理者与工程师有很多共同点——而且他们同样有灭火的倾向。

那么,灭火的企业如何将自己转变为一个解决问题的企业呢?企业必须认识到,自我固化的灭火综合征并不是对高压管理状态的一种与生俱来的非理性反应。相反,它源自一套看似合理的规则和行为,但从长远来看,这些规则和行为实际上会导致灭火行为。企业不仅必须放弃这些看似合乎逻辑的做法,而且必须采用乍看起来似乎不合理的技术。

治愈灭火综合征并非易事。既有的企业文化和短视的逻辑往往与之背道而驰。认为人们在压力下会更努力工作的管理层加剧了这种状况。可是,将你的公司从灭火模式的泥潭中拽出来是值得的努力,因为灭火会让你最优秀的员工精疲力尽;不管他们多么努力工作,也不能把所有的火都扑灭。尽管极端,但灭火的明显风险是,企业将不得不撤走一条生产线或关闭一家被认为失效的工厂。不太明显但同样重要的风险是,企业最好的解决问题者会感到厌倦并离职。建设解决问题的企业十分困难,但好处显而易见,选择也明确无误。

罗杰·博恩是加州大学圣地亚哥分校的副教授。他与拉姆钱德兰·贾伊库马尔共同提出了本文中的观点。拉姆钱德兰·贾伊库马尔是哈佛商学院工商管理学的大宇教授,直至他1998年去世。这是他发表在《哈佛商业评论》(HBR)的第四篇文章。

罗杰·博恩(Roger Bohn)| 文  

永年 | 译   时青靖 | 校   李全伟 | 编辑

点赞

发表回复

电子邮件地址不会被公开。必填项已用 * 标注