Vision 2016, des technologies qui en mettent plein les yeux

Tous les deux ans, Stuttgart redevient pour quelques jours, la capitale mondiale de la vision industrielle et des applications permettant de piloter les processus et les machines au moyen de la lumière dans un spectre qui s’étend du domaine visible à l’infrarouge. La cuvée 2016 a été une nouvelle fois à la hauteur des attentes.

Quiconque veut produire de manière connectée et entièrement automatisée ne peut s’affranchir de suivre le développement des technologies liées à la vision industrielle et au traitement de l’image. C’est à l’évidence ce qui explique la santé remarquable de ce marché qui a plus que doublé en dix ans. Dans toute l’Europe, il connaît cette année, une croissance située au alentour de 8 % selon l’étude réalisée par l’association allemande des industries de l’ingénierie mécanique, VDMA.

Dans le classement du marché mondial de la vision industrielle, la France arrive en sixième position loin derrière l’Allemagne, les Etats-Unis ou encore, la Chine et, faisant jeu égal avec l’Italie et le Royaume Unis. Les secteurs les plus largement engagés dans la vision industrielle en Europe sont la construction automobile, l’assemblage électronique et électrotechnique et la métallurgie, tandis que l’agro-alimentaire amorce une remontée.

Des applications extrêmement diversifiées

Parmi les technologies exposées, ce sont les caméras embarquées, l’imagerie hyperspectrale et la vision 3D qui ont tout spécialement attiré les 10 000 visiteurs ayant fait le déplacement à Stuttgart début novembre.

Certaines applications de la vision numérique atteignent aujourd’hui une forme de maturité puisque leurs applications sont parfaitement maîtrisées. C’est principalement le cas de l’imagerie exploitant la lumière infrarouge qui connaît de nombreux débouchés dans le domaine de la sécurité pour alerter de la présence de flammes bien sûr, mais aussi pour prévoir qu’un dispositif électrique comme un coupleur ou un disjoncteur va tomber en panne.

L’industrie automobile a aussi recours à des caméras fonctionnant dans l’infrarouge pour vérifier le fonctionnement effectif des équipements de dégivrage ou encore des sièges chauffants. Dans les industries de process (chimie, pharmaceutique, raffinage, etc.), les caméras infrarouges apportent une précision dans la surveillance des cuves et des réacteurs biologiques qui est inaccessible aux simples capteurs de températures.

Mais c’est aujourd’hui la convergence de technologies comme les caméras à haute définition, les systèmes de transmission de données à haut débit et les nouvelles approches algorithmiques mises en oeuvre dans les logiciels qui donnent naissance aux applications les plus spectaculaires.

Par exemple, si la persistance rétinienne limite l’oeil humain à une perception comprise entre 20 et 30 images par seconde selon les individus, une caméra numérique et un ordinateur peuvent aisément s’affranchir d’une telle barrière. Ainsi une caméra HD pourra délivrer jusqu’à 300 images/s pour peu qu’elle dispose d’un support de communication adapté au volume de données – immanquablement important – qu’elle génère.

Si différents systèmes de transmission se sont longtemps partagé le marché de la vision industrielle à haute performance (FireWire, CameraLink, etc.), deux technologies se démarquent aujourd’hui réellement : les interfaces USB 3.0 et GigE Vision.

On trouve ainsi que plus en plus communément, des caméras équipées d’un port USB 3.0 capable de supporter une bande passante théorique allant jusqu’à 5 Gbits/s. De tels équipements sont aujourd’hui proposés à des coûts qui les rendent largement accessibles à la fois à l’achat mais aussi, au niveau des systèmes auxquels ils sont raccordés puisque les ports USB 3.0 sont aujourd’hui largement présents jusque sur les PC industriels. Mais cette interface universelle souffre d’un défaut dans la cuirasse. Les liaisons USB 3.0 sont en effet, sensibles aux interférences dans la bande de 2,4 GHz utilisées notamment pour les liaisons sans-fil Wi-Fi et Bluetooth. De telles caméras trouvent leur place dans des applications où le système recevant les données est placé à leur proximité (moins de 5 m). Au-delà, il est prudent d’installer un convertisseur qui acheminera les images dans un signal d’une tout autre nature comme un flux optique.

L’autre standard de transmission de données adapté à la vision industrielle qui s’impose en force est le GigE Vision. Dérivé de Gigabit Ethernet, il voit sa bande passante – 1 Gbit/s – calée sur celle du standard qui lui a donné son nom. La liaison GigE Vision est très populaire auprès des intégrateurs car elle concentre des fonctionnalités indispensables dans les applications où la vidéo et les images sont transmises sans compression préalable : débit de données élevé compatible, le câblage standardisé donc à faible coût, support du plug-and-play et compatibilité avec le matériel informatique avec ou sans carte servant d’interface.

Du plan euclidien à l’espace orthonormé

De nombreuses applications de la vision industrielle occupent le créneau du contrôle de la qualité en fin de chaîne de fabrication ou d’assemblage. Une caméra permet d’automatiser tout ou partie des tests, sans connaître la lassitude qui au fil des heures affecte les opérateurs.

Partant, il est possible de systématiser les contrôles plutôt que de les réaliser sur un échantillon périodique, ce qui permet de garantir la qualité de tous produits. L’automatisation permet aussi de multiplier les points de contrôle en installant des dispositifs de vision industrielle à toutes les étapes critiques de la fabrication.

Pour tirer le maximum de cet apport, il est indispensable que les dispositifs de vision industrielle déployés, remplissent leur mission sans ralentir le cycle de fabrication. A cette fin, il est primordial que la vérification effectuée soit réalisée à la volée. Le traitement des images aboutit systématiquement au traitement d’importants volumes de données. On assiste à la naissance d’une nouvelle génération de caméra et de détecteurs optiques, embarquant dans leur électronique, des circuits programmables. Le traitement logiciel attendu peut être téléchargé dans le dispositif de vision industrielle, ce qui accroît généralement la vitesse de traitement. De telles caméras intéressent par exemple, les usines produisant au métrage, des tissus et des revêtements au rouleau. Une caméra va détecter à la volée, les défauts d’aspect (accrocs, rayures, tâches, etc.) ou de structure (noeuds, filés, etc.). Dans l’industrie agro-alimentaire, des systèmes de vision sont en mesure de reconnaître les plats préparés en fonction de leur forme ou de leur contenu sur les chaînes de conditionnement, permettant un traitement des batchs sans reprogrammation des équipements.

Les traitements d’images automatisés connaissent aussi un fort développement dans la reconnaissance de formes diverses par auto-apprentissage. Plusieurs pistes sont actuellement explorées avec l’objectif de créer des systèmes de guidage intelligents, capables de piloter tout type d’engins mobiles, le but ultime étant évidemment d’arriver à la voiture entièrement autonome.

Les caméras 3D intéressent plus spécialement les développeurs de systèmes de pilotage par des humains à distance. Il s’agit dans ce cas de fournir une image précise, chargée en détails de toutes sortes et sur laquelle peuvent être incrustées des données relatives au déplacement (vitesse, position, direction suivie, dérives, trajectoires attendues, etc.).

D’autres approches s’appuient sur la vision stéréoscopique ou multiscopique en installant deux ou plusieurs caméras à une distance significative les unes des autres. La vision stéréoscopique humaine par exemple, s’appuie sur deux images captées à une distance de 6 à 8 centimètres seulement. Il en résulte une parallaxe tendue qui rend la stéréoscopie anecdotique à seulement quelques mètres de l’observateur. Embarquées à bord d’un véhicule, les caméras peuvent aisément être éloignées d’une distance de 100 à 300 centimètres et délivrer une centaine d’images par seconde, voire plus. Traitées par des logiciels adaptés, les images stéréoscopiques ou multiscopiques apportent une batterie d’informations qui peuvent être corrélées ou non, avec les données issues d’autres types de capteurs. Un système de guidage ainsi équipé peut par exemple, déterminer si la trajectoire d’un objet en déplacement autour de sa position suit une trajectoire rectiligne, circulaire ou hyperbolique en deux ou trois dimensions significatives. Corrélées à des capteurs de proximité, ces informations délivrent des indications sur les risques de collision, de croisement de trajectoire, etc.

De nouvelles approches logicielles

Moins centrée sur l’industrie, l’autre direction dans laquelle se développe la vision numérique, est celle de la reconnaissance des individus avec des applications dans le domaine du contrôle d’accès automatisé et de la surveillance des lieux accueillant du public.

L’un des développements les plus intéressants qui était exposé à Stuttgart cette année, se trouvait sur le stand mis en place par le Laboratoire d’électronique et de technologie de l’information du CEA (CEA-Leti). Le Laboratoire d’Intégration des systèmes et des technologies (CEA List) a mis au point un logiciel capable de traiter des images à la volée et de déterminer en un temps record, si elles appartiennent à un échantillon donné par exemple, des visages.

Le logiciel a besoin au préalable d’être en quelque sorte éduqué, en lui fournissant une banque d’images au sein de laquelle il réalisera des identifications qui seront validées par un opérateur. A l’issue de cette étape, le programme est capable de filtrer un grand nombre d’échantillons par seconde. Selon les tests réalisés par le CEA List, un simple nano-ordinateur tel que le Raspberry Pi 2B peut filtrer plus de 300 échantillons/s alors qu’une carte Matrix équipée d’un GPU à haute performance peut en revanche exploiter des milliers d’échantillons. La technologie exploitée pour arriver à un tel niveau de performance, repose sur le principe des réseaux de neurones ; des choix élémentaires qui ne requièrent que quelques instructions, sont opérés en cascade pour arriver à une matrice de données complexes en un temps extrêmement réduit avec un risque d’erreur minime.

Sur ce même stand, le CEA Leti avait installé une caméra connectée à une application capable de déterminer le sexe des personnes situées dans son champ de vision et même…. leur humeur.

N’en doutons pas, la vision numérique et ses applications dans la vision industrielle n’ont pas fini de nous étonner !