降低当今数字依赖世界的系统故障成本

白皮书

随着电子系统变得越来越小,越来越复杂,越来越深深地嵌入我们的日常生活中,失败的后果已经成倍地变得更加严重。 在这些故障导致代价高昂的停机,产品召回和声誉损坏之前找到并修复这些故障需要采用全面的多学科方法来处理电子系统故障分析,其中包括专业工具和专业知识。

一个非常困难的挑战

导致难度增加的因素有很多 电子系统故障分析。 其中包括电子系统的日益复杂,小型化的快速发展,先进技术工艺的特殊特性,系统故障的间歇性以及与用于设计和制造当今组件的特殊材料相关的挑战。

系统复杂性正在增加 板,IC,封装和模具 水平。 工艺技术已从10早期的1970微米工艺发展到今天的28纳米节点及以下,使处理器和片上系统(SoC)器件能够从1980和1990中的数百万个晶体管扩展到数十亿个晶体管。 与此同时,以前的分立元件和独立的子系统正在集成,我们继续看到使用FinFET,金属栅极,低k电介质和其他先进工艺节点的电子元件的快速小型化。 封装也更复杂,包括SIP,MCM,SiSub,堆叠芯片,TSV和铜线,我们看到更复杂的封装和电路板材料,以及涂层和模塑化合物。 最后,我们看到失败的发生率不断上升,其间歇性使得它们极难诊断,无论其根本原因如何。

考虑今天在网络环境中的典型系统。 网络系统可能在多个板上包含数千个不同复杂程度的组件,包括许多复杂的IC和SoC,以及大量的RF,电源,高速数字和存储介质,所有这些都驻留在一个系统上,每个需要专业领域知识。

汽车系统同样也很复杂,引擎盖下通常包含30到80台计算机,仅包括将近20个用于门锁和开锁的电子控制单元。 根据Frost&Sullivan的说法,某些车辆包含多达100个ECU,甚至更多。 汽车的每个电子系统或设备都可以包含50至100个微处理器和100多个传感器。 倒车摄像头和车道变更警告系统已经广泛使用,汽车制造商也正在研究电子辅助驾驶和传感器引导的自动驾驶系统,它将带动方向盘行驶诸如保险杠到保险杠的交通,通行费收费等任务展位,识别限速和道路标志,在拥挤的车库中找到空间,或挤进狭窄的停车位。 这些系统可以包含十二个超声波检测器,以及多个摄像头和雷达传感器。

随着复杂性的出现,失败的风险也越来越高,后果越来越严重。 以下是在越来越依赖电子系统的世界中展示失败的潜在成本的示例:

  • 硬件故障导致72%的网络停机时间(来源:“了解数据中心中的网络故障:测量,分析和影响”,Microsoft和多伦多大学,2011)。
  • 对于依赖服务交付的组织(包括电信提供商和电子商务公司),计划外数据中心停机的成本可达每分钟11,000(来源:“了解数据中心停机成本:基础架构的财务影响分析漏洞,“Ponemon Institute和Emerson Network Power,2011”。
  • 维珍蓝色控股公司在2010宣布,其预订和登机系统的全面停运损害了高达20万美元的利润。
  • 消费者报告调查了2010中有关产品可靠性的读者,并发现了这一点 笔记本电脑的36百分比,台式电脑的32百分比,LCD电视的15百分比和等离子电视的10百分比 他们的第四年失败了(来源:“什么打破,什么不打?”,消费者报告,2011)。
  • 消费者产品安全委员会(CPSC)在59期间召回了2012百万产品。
  • 微软在2007上宣布它将支付大约1.05到1.15亿美元,以对其Xbox 360以及之前出售的控制台和新系统的故障实施额外保修。
  • 电子产品预计将占电子产品成本的40%以上
    从今天的25%增长到未来的汽车(来源:“ Frost&Sullivan汽车测试行业分析”,7年2013月XNUMX日)。

解决问题

全面的根本原因故障分析和解决方案的选择很少 - 主要是内部测试,或仅关注部分问题的第三方服务,没有定义的方法来处理系统级故障分析和调试。 内部团队缺乏专业知识和工具集,无法对当今先进的电子产品进行完整的因果分析。 虽然转向第三方提供商是一个更好的选择,但很少有历史上能够执行的不仅仅是粗略的调查,更少的人已经接触过广泛的失败,知道从哪里开始,以及要问的正确问题。 光学检测和基于任务的横截面分析更容易 - 但在许多情况下无法确定根本原因,并且不适合当今产品中使用的先进技术。

解决问题的唯一方法是与提供商合作,该提供商采用全面的多学科方法,包括电气和物理分析,以加强对根本原因的识别,相关的故障机制以及如何防止未来的故障。 重点必须放在整个系统上,从电子设备到材料,一直到IC晶体管级别的故障机制。 图1显示了查找,分析和解决电子系统故障机制及其根本原因所需的各种分析级别。

图1有效的故障分析方法需要关注每种潜在的根本原因和失效机制。

图1 有效的失效分析方法需要关注每类潜在的根本原因和失败机制。

此外,还需要专业的专业知识和设备。 专业知识必须从组件级扩展到系统级,拥有训练有素的员工,这些员工拥有可靠的跟踪记录,可以进行从设计到生产和现场退货的各种故障分析调查(参见图2)。

图2端到端故障分析方法

图2 端到端故障分析方法

以下列出了典型调查所需的分析专业知识:

  • 焊点完整性
  • PCB和电路板故障
  • 污染和腐蚀
  • 电气过应力
  • 模具化合物分层
  • 制造缺陷
  • 现场/客户退货
  • ESD故障
  • X射线和非破坏性检查
  • 光学检测
  • 材料表征
  • 电气特性
  • 热阻测量
  • 温度映射
  • 电阻过孔
  • 光刻图案缺陷
  • 模具附着圆角高度
  • 翻转芯片填充空洞
  • 栅极氧化物击穿

设备是这个难题的另一个关键部分。 这包括高级工具集,可能需要多达150百万美元的资本设备投资。 选择具有大量全面设备的供应商对于确保问题的正确解决方案以及执行大型项目的并行处理至关重要,并且能够随着范围和需求的波动进行扩展。 还需要系统冗余,以及高度专业化的设备,如 先进的高分辨率显微成像系统 (SEM, TEM双光束FIB)促进分析到组件级别。 此外,能够通过支持实时,无负载,非接触信号波形采集的激光定时探测来表征故障至关重要。 将故障本地化到单个设备的能力还需要针对28nm以下的高级过程节点的纳米探测功能,以及能够测量TEM图像上任何感兴趣特征的专用软件工具。

一旦获得了正确的专业知识和工具,最佳分析需要一个涵盖电气和物理故障分析的综合方法和计划。 图3。 显示了典型的步骤和工作流程,从电气故障特征的定义开始,最后确定了故障机制和问题的解决方案。

图3分析计划必须解决整个系统,从电子器件到材料,一直到IC晶体管级别的故障机制。

图3 分析计划必须解决整个系统,从电子器件到材料,一直到IC晶体管级别的故障机制。

定制也很重要。 今天百分之九十的失败问题可能从一个问题到另一个问题相似,但这是最后一个10百分比。 每种情况,客户,产品和失败机制都有其特定的特征和问题。 没有“一刀切”的方法。 故障识别,分析和解决需要一种有条理的方法,首先要事先询问正确的问题然后定制/设计工作流程。 一旦确定了工作流程,就可以快速执行解决方案。

电子系统故障变得越来越昂贵。 与此同时,寻找和解决这些故障的过程越来越难以应对使用特殊材料和先进技术流程构建的更小,更复杂系统的趋势。 故障本质上也变得更加间歇性,然而在它们造成代价高昂的停机,召回和声誉受损之前,快速找到并修复故障的风险从未如此高。 这需要一个全面的,多学科的电子系统故障分析方法和工作流程,从组件到系统级别考虑所有可能的根本原因,同时利用广泛的专业知识和各种先进的设备和工具集。

为了启用某些功能并改善您的使用体验,此站点将cookie存储在您的计算机上。 请单击“继续”以提供授权并永久删除此消息。

要了解更多信息,请参阅我们的 私隐政策.