失效分析工作不仅在提高可靠性方面具有很好的效果,而且有很高的经济效益。虽然失效分析工作不出产品,但是通过失效分析和采取纠正措施可以显著提高元器件的成品率和可靠性。器件一旦坏了,千万不要敬而远之,而应该如获至宝。
开车的人都知道,哪里最能练出驾驶水平?高速公路不行,只有闹市和不良路况才能提高水平。社会的发展就是一个发现问题解决问题的过程,出现问题不可怕,但频繁出现同一类问题是非常可怕的。
减少因元器件失效导致系统试验和现场使用期间的电子装备故障。系统试验和现场使用期间电子装备发生故障的经济损失巨大,排除故障的维修费用颇高,并且这种费用随着可靠性等级的提高而呈指数上升。
失效分析是通过对现场使用失效样品、可靠性试验失效样品或筛选失效样品的检测与解剖分析,得出失效模式(形式)和失效机理并准确判断失效原因,为采取相应的改进措施迅速提高产品的可靠性提供科学依据。
失效分析和失效物理立足于微观世界,从物理、化学的微观结构上对元器件进行仔细观察和分析研究,从外部影响和内部原因两方面探究元器件不可靠的因素,分析其工作条件、环境应力和时间等因素相互作用对器件发生失效所产生的影响。在分析过程中,可以获得元器件与相关因素和条件相互作用的丰富信息。因此,失效分析在可靠性设计、材料选择、工艺制造和使用维护等方面都能为有关人员提供各种有用的科学依据。
失效分析基本概念
定义:对失效电子元器件进行诊断过程。
1、进行失效分析往往需要进行电测量并采用先进的物理、冶金及化学的分析手段。
2、失效分析的目的是确定失效模式和失效机理,提出纠正措施,防止这种失效模式和失效机理的重复出现。
3、失效模式是指观察到的失效现象、失效形式,如开路、短路、参数漂移、功能失效等。
4、失效机理是指失效的物理化学过程,如疲劳、腐蚀和过应力等。
失效分析的一般程序对电子元器件失效机理、原因的诊断过程叫失效分析。进行失效分析往往需要进行电测量并采用先进的物理、冶金及化学的分析手段。失效分析的任务是确定失效模式和失效机理,提出纠正措施,防止这种失效模式和失效机理的重复出现。因此,失效分析的主要内容包括:明确分析对象,确定失效模式,判断失效原因,研究失效机理,提出预防措施(包括设计改进)。
1、明确分析对象及失效发生的背景,收集现场场数据
2、电测并确定失效模式
3、非破坏检查,失效原因判断
4、打开封装
5、镜验
6、进行失效定位。对失效部位进行物理、化学分析,确定失效机理。
7、综合分析,确定失效原因,提出纠正措施。
1、明确分析对象及失效发生的背景,收集现场场数据:
失效分析首先是要明确分析对象及失效发生的背景。在对失效样品进行具体的失效分析操作之前,失效分析人员应该与现场人员进行沟通,了解失效发生时的状况,确定在设计、生产、检测、储存、传送或使用哪个阶段发生的失效,如有可能,要求现场人员详细描述失效发生时的现象以及失效发生前后的操作过程。对现场人员提交的样品,需要查找产品手册,通过外观检查、电学检测以及显微镜光学观察等手段确认失效现象,在条件许可的情况下,尽可能地复现失效。另外经常会出现一些本身是好的元器件,结果由于测试错误而误判为失效,因此需要对提交的失效样品进行复验,以明确分析对象确实失效,避免无效的工作。
应力类型 | 试验方法 | 可能出现的主要失效模式 |
电应力 | 静电、过电、噪声 | MOS器件的栅击穿、双极型器件的pn结击穿、功率晶体管的二次击穿、CMOS电路的闩锁效应 |
热应力 | 高温储存 | 金属-半导体接触的Al-Si互溶,欧姆接触退化,pn结漏电、Au-Al键合失效 |
低温应力 | 低温储存 | 芯片断裂 |
低温电应力 | 低温工作 | 热载流子注入 |
高低温应力 | 高低温循环 | 芯片断裂、芯片粘接失效 |
热电应力 | 高温工作 | 金属电迁移、欧姆接触退化 |
机械应力 | 振动、冲击、加速度 | 芯片断裂、引线断裂 |
辐射应力 | X射线辐射、中子辐射 | 电参数变化、软错误、CMOS电路的闩锁效应 |
气候应力 | 高湿、盐雾 | 外引线腐蚀、金属化腐蚀、电参数漂移 |
器件极限温度承受能力是高压线,超过后失效率剧增,使用中不允许超过。在极限温度以内,器件失效率与温度仍然强相关,失效率随着温度升高而增加。
问题:是否存在一个安全温度点,只要不超过这个温度点,失效率与温度关系就不密切?
答案:理论与实际表明,多数情况下不存在这样的温度点。器件的失效率始终与温度相关,只是高于某个温度点之后,失效率会急剧上升,出现拐点。
降额设计就是使元器件或产品工作时承受的工作应力适当低于元器件或产品规定的额定值,从而达到降低基本失效率(故障率),提高使用可靠性的目的。20世纪50年代,日本的色摩亮次发现,温度降低10℃,元器件的失效率可降低一半以上。实践证明,对元器件的某些参数适当降额使用,就可以大幅度提高元器件的可靠性。因电子产品的可靠性对其电应力和温度应力比较敏感,故而降额设计技术和热设计技术对电子产品则显得尤为重要。
一款流量计的电源前期设计,未采用降额设计,其调整管仅按计算其功耗为0.8W(在常温20℃~25℃),选用额定功率为1W的晶体管。结果在调试时和在用户使用中发生故障频繁。分析其原因主要是该管额定功耗1W时的环境温度为25℃,而实际工作时该管处于的环境温度为60℃,此管此时实际最大功耗已达1W。经可靠性工程师分析和建议,选用同参数2W的晶体管,这时降额系数S≌0.5。因而产品的故障很快得到解决。
2、电测并确定失效模式
失效的表面现象或失效的表现形式就是失效模式。失效模式的确定通常采用两种方法,即电学测试和显微镜观察。根据测试、观察到的现象与效应进行初步分析,确定出现这些现象的可能原因,或者与失效样品的哪一部分有关。同时通过立体显微镜检查,观察失效样品的外观标志是否完整,是否存在机械损伤,是否有腐蚀痕迹等;通过电特性测试,判断其电参数是否与原始数据相符,分析失效现象可能与失效样品中的哪一部分有关;利用金相显微镜和扫描电子显微镜等设备观察失效部位的形状、大小、位置、颜色,机械和物理结构、物理特性等,准确的描述失效特征模式。
失效模式可以定位到电(如直流特性、漏电)或物理(如裂纹、侵蚀)失效特征根据失效发生时的条件(如老化、静电放电、环境),结合先验知识,区分失效位置,减少诊断失效机理要求的工作量。
电测失效可分为连接性失效、电参数失效和功能失效。
连接性失效包括开路、短路以及电阻值变化。这类失效容易测试,现场失效多数由静电放电(ESD)和过电应力(EOS)引起。
电参数失效,需进行较复杂的测量,主要表现形式有参数值超出规定范围(超差)和参数不稳定。
确认功能失效,需对元器件输入一个已知的激励信号,测量输出结果。如测得输出状态与预计状态相同,则元器件功能正常,否则为失效,功能测试主要用于集成电路。
三种失效有一定的相关性,即一种失效可能引起其它种类的失效。功能失效和电参数失效的根源时常可归结于连接性失效。在缺乏复杂功能测试设备和测试程序的情况下,有可能用简单的连接性测试和参数测试方法进行电测,结合物理失效分析技术的应用仍然可获得令人满意的失效分析结果。
3、非破坏检查
根据失效模式、失效元器件的材料性质、制造工艺理论和经验,结合观察到的相应失效部位的形状、大小、位置、颜色以及化学组成、物理结构、物理特性等因素,参照失效发生的阶段、失效发生时的应力条件和环境条件,提出可能的导致失效的原因。失效可能由一系列的原因造成,如设计缺陷、材料质量问题、制造过程问题、运输或储藏条件不当、在操作时的过载等,而大多数的失效包括一系列串行发生的事件。对一个复杂的失效,需要根据失效元器件和失效模式列出所有可能导致失效的原因,确定正确的分析次序,并且指出哪里需要附加的数据来支撑某个潜在性因素。失效分析时根据不同的可能性,逐个分析,最终发现问题的根源。
名称 | 应用优势 | 主要原理 |
X射线透视技术 | 以低密度区为背景,观察材料的高密度区的密度异常点 | 透视X光的被样品局部吸收后成象的异常 |
反射式扫描声学显微术(C-SAM) | 以高密度区为背景,观察材料内部空隙或低密度区 | 超声波遇空隙受阻反射 |
X-Ray检测,即为在不破坏芯片情况下,利用X射线透视元器件(多方向及角度可选),检测元器件的封装情况,如气泡、邦定线异常,晶粒尺寸,支架方向等。
适用情境:检查邦定有无异常、封装有无缺陷、确认晶粒尺寸及layout
优势:工期短,直观易分析
劣势:获得信息有限
局限性:
1、相同批次的器件,不同封装生产线的器件内部形状略微不同;
2、内部线路损伤或缺陷很难检查出来,必须通过功能测试及其他试验获得。
案例分析:
X-Ray 探伤----气泡、邦定线
X-Ray 真伪鉴别----空包弹(图中可见,未有晶粒)
“徒有其表”
下面这个才是货真价实的
X-Ray用于产地分析(下图中同品牌同型号的芯片)
X-Ray 用于失效分析(PCB探伤、分析)
(下面这个密密麻麻的圆点就是BGA的锡珠。下图我们可以看出,这个芯片实际上是BGA二次封装的)
4、打开封装
开封方法有机械方法和化学方法两种,按封装材料来分类,微电子器件的封装种类包括玻璃封装(二极管)、金属壳封装、陶瓷封装、塑料封装等。
机械开封
化学开封
5、显微形貌像技术
光学显微镜分析技术
扫描电子显微镜的二次电子像技术
电压效应的失效定位技术
6、进行失效定位。对失效部位进行物理、化学分析,确定失效机理。
对于失效机理的研究是非常重要的,需要更多的技术支撑。在确定失效机理时,需要选用有关的分析、试验和观测设备对失效样品进行仔细分析,验证失效原因的判断是否属实,并且能把整个失效的顺序与原始的症状对照起来.有时需要用合格的同种元器件进行类似的破坏性试验,观察是否产生相似的失效现象。通过反复验证,确定真实的失效原因,以电子元器件失效机理的相关理论为指导,对失效模式、失效原因进行理论推理,并结合材料性质、有关设计和工艺的理论及经验,提出在可能的失效条件下导致该失效模式产生的内在原因或具体物理化学过程,如有可能更应以分子、原子学观点加以阐明或解释。
电应力(EOD)损伤
静电放电(ESD)损伤
封装失效
引线键合失效
芯片粘接不良
金属半导体接触退化
钠离子沾污失效
氧化层针孔失效
7、综合分析,确定失效原因,提出纠正措施。
根据分析判断,提出消除产生失效的办法和建议,及时地反馈到设计、工艺、使用单位等各个方面,以便控制乃至完全消除失效的主要失效模式的出现失效。这需要失效工程师与可靠性、工艺、设计和测试工程师一起协作,发挥团队力量,根据失效分析结果,提出防止产生失效的设想和建议,包括材料、工艺、电路设计、结构设计、筛选方法和条件、使用方法和条件、质量控制和管理等方面。