Réduire les coûts de défaillance des systèmes dans le monde numériquement dépendant d'aujourd'hui

Whitepaper

À mesure que les systèmes électroniques deviennent de plus en plus petits, de plus en plus complexes et de plus en plus intégrés à notre quotidien, les conséquences d’une défaillance sont devenues de plus en plus graves. La découverte et la résolution de ces défaillances avant qu'elles ne provoquent des temps d'arrêt, des rappels de produits et des atteintes à la réputation coûteuses, requièrent une approche multidisciplinaire globale de l'analyse des défaillances des systèmes électroniques, qui inclut des outils et une expertise spécialisés.

UN DEFI DE PLUS EN PLUS DIFFICILE

Un certain nombre de facteurs contribuent à la difficulté croissante de analyse de défaillance de systèmes électroniques. Celles-ci incluent la complexité croissante des systèmes électroniques, le rythme rapide de la miniaturisation, les caractéristiques particulières des processus technologiques avancés, la nature intermittente des dysfonctionnements du système et les défis associés aux matériaux exotiques utilisés pour concevoir et fabriquer les composants actuels.

La complexité du système augmente au conseil, IC, empaqueter et mourir niveau. La technologie des procédés a évolué des procédés 10-micron des tout premiers 1970 aux nœuds 28-nanomètre actuels et inférieurs, permettant ainsi aux processeurs et aux systèmes sur puce (SoC) de passer de milliards de transistors à des millions de 1980 et 1990. Dans le même temps, des composants auparavant distincts et des sous-systèmes indépendants sont en cours d'intégration, et nous continuons à observer la miniaturisation rapide des composants électroniques à l'aide de FinFET, de grilles métalliques, de diélectriques à faible coefficient de diélectrique et d'autres noeuds de processus avancés. Les emballages sont également plus complexes, y compris SIP, MCM, SiSub, filière empilée, TSV et fil de cuivre, et nous constatons des matériaux plus complexes pour les emballages et les panneaux, ainsi que les revêtements et les composés de moulage. Enfin, nous constatons un nombre croissant d’échecs dont la nature intermittente les rend extrêmement difficiles à diagnostiquer, quelle que soit leur cause.

Considérez le système typique actuel dans un environnement réseau. Un système de réseau peut contenir des milliers de composants de complexité variable sur chacune des cartes, y compris de nombreux circuits intégrés complexes et SoC, ainsi qu’un large éventail de supports RF, d’alimentation, de supports de stockage numériques et haute vitesse, tous résidant sur un système unique. nécessitant des connaissances spécialisées du domaine.

Les systèmes automobiles sont tout aussi complexes et contiennent fréquemment 30 à 80 ordinateurs sous le capot, dont près de 20 unités de commande électroniques pour le verrouillage et le déverrouillage des portes, seules. Certains véhicules contiennent jusqu'à 100 ECU, ou plus, selon Frost & Sullivan. Chacun des systèmes ou appareils électroniques de la voiture peut être composé de 50 à 100 microprocesseurs et de plus de 100 capteurs. Les caméras de recul et les systèmes d'avertissement de changement de voie sont déjà largement utilisés, et les constructeurs automobiles envisagent également des systèmes de conduite assistée électronique et de pilote automatique guidé par capteur qui prendront le volant pour des tâches telles que la navigation de pare-chocs à pare-chocs, la conduite à péage. kiosques, reconnaître les limites de vitesse et les panneaux routiers, trouver une place dans un garage bondé ou se faufiler dans une place de stationnement étroite. Ces systèmes peuvent englober une douzaine de détecteurs à ultrasons et plusieurs caméras et capteurs radar.

La complexité augmente le risque d'échec, ce qui a des conséquences de plus en plus coûteuses. Vous trouverez ci-dessous des exemples illustrant le coût potentiel d'une défaillance dans un monde de plus en plus dépendant des systèmes électroniques:

  • Les pannes matérielles sont responsables de 72% du temps d'arrêt du réseau (source: «Comprendre les pannes de réseau dans les centres de données: mesure, analyse et conséquences», Microsoft et l'Université de Toronto, 2011).
  • Le coût d’une panne imprévue de centre de données peut atteindre 11,000 par minute pour les organisations dépendantes de la prestation de services, y compris les fournisseurs de télécommunications et les entreprises de commerce électronique (source: «Comprendre le coût des pannes de centre de données: analyse de l’impact financier de l’infrastructure Vulnerability, ”Institut Ponemon et Emerson Network Power, 2011).
  • Virgin Blue Holdings a annoncé dans 2010 qu’une panne totale de ses systèmes de réservation et d’enregistrement nuisait à son bénéfice jusqu’à concurrence de X millions de 20.
  • Consumer Report a interrogé les lecteurs sur la fiabilité du produit dans 2010 et a découvert que 36 pour cent des ordinateurs portables, 32 pour cent des ordinateurs de bureau, 15 pour cent des téléviseurs LCD et 10 pour cent des téléviseurs à plasma échouent avant leur quatrième année (source: «What Breaks, What Does not??», Consumer Reports, 2011).
  • La Consumer Product Safety Commission (CPSC) a rappelé des millions de produits 59 au cours de 2012.
  • Microsoft a annoncé dans 2007 qu'il débourserait environ 1 milliard de dollars 1.05 pour mettre en œuvre une garantie supplémentaire contre les défaillances de son Xbox 1.15 ainsi que pour les consoles précédemment expédiées et les nouveaux systèmes vendus à l'avenir.
  • L'électronique devrait représenter plus de 40% du coût de
    une voiture dans le futur, contre plus de 25% aujourd'hui (source: «Frost & Sullivan Analysis of the Automotive Test Industry», 7 août 2013).

Résoudre le problème

Il existe très peu d'options d'analyse et de résolution complètes des défaillances des causes premières - principalement des tests internes, ou des services tiers ne se concentrant que sur une partie du problème, sans méthodologie définie pour traiter l'analyse et la mise au point des défaillances au niveau du système. Les équipes internes ne disposent pas de l'expertise et des outils nécessaires pour effectuer une analyse causale complète des produits électroniques avancés actuels. Si le recours à des fournisseurs tiers est un meilleur choix, peu d’entre eux ont toujours été en mesure de mener une enquête superficielle, et encore moins d’entre eux ont été exposés à une gamme assez large d’échecs pour savoir par où commencer et pour poser les bonnes questions. . L'inspection optique et l'analyse transversale des tâches sont beaucoup plus faciles à faire - mais ne permettent pas d'identifier la cause première dans de nombreux cas et ne sont pas adaptées aux technologies de pointe utilisées dans les produits actuels.

Le seul moyen de résoudre le problème consiste à travailler avec un fournisseur qui adopte une approche globale et multidisciplinaire incluant des analyses électriques et physiques pour améliorer l'identification de la cause fondamentale, du mécanisme de défaillance associé et des moyens de prévenir les défaillances futures. L'accent doit être mis sur l'ensemble du système, de l'électronique aux matériaux, en passant par les mécanismes de défaillance se produisant au niveau du transistor IC. La figure 1 illustre les différents niveaux d'analyse nécessaires pour rechercher, analyser et résoudre les mécanismes de défaillance des systèmes électroniques et leurs causes profondes.

Figure 1 Une approche efficace en matière d'analyse des défaillances requiert une attention particulière pour chaque catégorie de causes profondes et de mécanismes de défaillance potentiels.

Figure 1 Une approche efficace d’analyse des défaillances requiert une attention particulière pour chaque catégorie de causes profondes et de mécanismes de défaillance potentiels.

De plus, une expertise et des équipements spécialisés sont nécessaires. L'expertise doit s'étendre du niveau composant au niveau système, avec un personnel hautement qualifié qui a fait ses preuves dans la conduite de toutes les enquêtes d'analyse des défaillances, de la conception à la production, en passant par les retours sur site (voir Fig. 2).

Figure 2 Méthodologie d'analyse des défaillances de bout en bout

Figure 2 Méthodologie d'analyse des pannes de bout en bout

Vous trouverez ci-dessous une liste des compétences en matière d’analyse requises dans le cadre d’enquêtes types:

  • Intégrité du joint de soudure
  • Défaillances des cartes et des circuits
  • Electromigration
  • Contamination et corrosion
  • Surtension électrique
  • Délamination du moule
  • Défauts de fabrication
  • Retour de champ / client
  • Échecs ESD
  • Contrôle aux rayons X et contrôle non destructif
  • inspection optique
  • Caractérisation des matériaux
  • Caractérisation électrique
  • Mesures de résistance thermique
  • Cartographie de la température
  • Vias résistifs
  • Défauts de motifs de lithographie
  • Taille d'attache de filet
  • Retourner la puce sous le remplissage
  • Répartition de l'oxyde de porte

L'équipement est un autre élément clé du puzzle. Cela inclut des ensembles d’outils avancés pouvant nécessiter jusqu’à X millions de dollars d’investissements en biens d’équipement. Il est essentiel de choisir un fournisseur doté d'un ensemble complet et exhaustif d'équipements afin de garantir la bonne solution au problème et de traiter en parallèle des projets volumineux avec la capacité d'évoluer en fonction de la portée et de la demande. Il existe également un besoin de redondance des systèmes et d’équipement hautement spécialisé tel que systèmes d'imagerie avancés de microscopie à haute résolution (SEM, TEMet FIB à double faisceau) qui facilitent l'analyse jusqu'au niveau du composant. De plus, il est essentiel de pouvoir caractériser les défaillances grâce à une détection au laser qui prend en charge l’acquisition de signaux en temps réel, sans charge et sans contact. La possibilité de localiser les pannes sur un seul périphérique nécessite également des capacités de nano-vérification pour les nœuds de processus avancés situés sous 28nm, ainsi que des outils logiciels spécialisés permettant la mesure de toute fonctionnalité présentant un intérêt sur les images TEM.

Une fois que l'expertise et les outils appropriés sont en place, une analyse optimale nécessite une méthodologie et un plan exhaustifs couvrant l'analyse des défaillances électriques et physiques. Fig 3. affiche les étapes et le flux de travail typiques, en commençant par une définition de la signature en cas de panne électrique et en terminant par l'identification du mécanisme de panne et la résolution du problème.

Figure 3 Un plan d'analyse doit couvrir l'ensemble du système, de l'électronique aux matériaux, en passant par les mécanismes de défaillance se produisant au niveau du transistor IC.

Figure 3 Un plan d'analyse doit couvrir l'ensemble du système, de l'électronique aux matériaux, en passant par les mécanismes de défaillance se produisant au niveau du transistor IC.

La personnalisation est également importante. Quatre-vingt-dix pour cent des problèmes de défaillance actuels peuvent être similaires d'un problème à l'autre, mais c'est le dernier pourcentage 10 qui fait toute la différence. Chaque situation, client, produit et mécanisme de défaillance a ses propres caractéristiques et problèmes. Il n'y a pas d'approche «taille unique». L'identification, l'analyse et la résolution des défaillances nécessitent une approche méthodique qui commence par poser les bonnes questions à l'avance, puis en personnalisant / concevant le flux de travail. Une fois le flux de travail identifié, la solution peut être rapidement exécutée.

La défaillance du système électronique coûte de plus en plus cher. Parallèlement, le processus de recherche et de correction de ces défaillances a rencontré des difficultés croissantes en raison de la tendance à la mise au point de systèmes plus petits et plus complexes construits à l'aide de matériaux exotiques et de processus technologiques avancés. Les échecs sont également devenus de plus en plus intermittents, mais les enjeux n’ont jamais été aussi importants pour les trouver et les réparer rapidement avant qu’ils ne provoquent des temps d’immobilisation coûteux, des rappels et une atteinte à la réputation. Cela nécessite une méthodologie d'analyse multidisciplinaire complète des pannes des systèmes électroniques et un flux de travail prenant en compte toutes les causes profondes possibles, du composant au système, tout en tirant parti d'une expertise étendue et spécialisée ainsi que de nombreux équipements et outils avancés.

Pour activer certaines fonctionnalités et améliorer votre expérience avec nous, ce site stocke des cookies sur votre ordinateur. Veuillez cliquer sur Continuer pour donner votre autorisation et supprimer définitivement ce message.

Pour en savoir plus, consultez notre Politique de confidentialité.