Contrôle de la souris via la webcam
Cette application de traitement d'images permet de reconnaître les gestes de la main et de contrôler la souris à l'aide de ces gestes. Dans cette application, le mouvement du curseur est contrôlé par le mouvement de la main et les événements de clic sont déclenchés par les gestes de la main.
Détection des contours dans les images couleur
La détection des contours fait référence au processus d'identification et de localisation des discontinuités nettes dans une image. Les discontinuités sont des changements brusques dans l'intensité des pixels qui caractérisent les limites des objets dans une scène. Les méthodes classiques de détection des contours impliquent la convolution de l'image avec un opérateur (un filtre bidimensionnel), qui est conçu pour être sensible aux gradients importants de l'image tout en renvoyant des valeurs nulles dans les régions uniformes.
Cette application présente un algorithme de détection des contours pour les images générales en couleur ou monochromes. Cet algorithme utilise des lignes/fonctions/textures/images unidimensionnelles générées à partir de l'image d'entrée pour trouver les bords de l'image.
Par rapport aux résultats générés par certaines méthodes connues, cela a permis de marquer des points inédits. L'algorithme est adaptatif et paramétrable, ce qui permet d'augmenter ou de réduire les détails et la tolérance. Il s'agit d'une approche directe permettant d'affiner les contours de l'image avec une plus grande précision.
Les paramètres sont principalement visuels et observables sur la base de la perception psychologique humaine (à savoir l'angle, la densité des couleurs, la stratégie de soustraction et les détails) plutôt que sur la base des méthodes objectives et quantitatives existantes des transformations mathématiques.
Comme l'algorithme n'utilise pas de calculs matriciels lourds ni de transformations, il est plus performant. L'algorithme est progressif, car il peut être utilisé pour les signaux bruités. Il peut également être utilisé lors d'un chargement progressif ou d'une image partiellement reçue. L'algorithme peut fonctionner avec aussi peu d'échantillons linéaires que possible ou avec autant d'échantillons linéaires que possible.
Les méthodes existantes s'appliquent à l'image dans son ensemble et ne peuvent pas être appliquées à différentes parties de l'image avec différents paramètres sans diviser l'image en différentes parties et les recoller par la suite.
Reconnaissance d'images avec les réseaux neuronaux
Détection de la forme
Dans cette application, nous démontrons la détection des lignes et des cercles de Hough, ainsi que l'utilisation du traitement d'image pour détecter les triangles et les rectangles dans l'image.
Vision sur les commandes virtuelles
Cette application est utilisée pour montrer comment un ordinateur interagit avec un être humain et convertit ses mouvements en actions de commande. Il détecte les mouvements et les convertit en actions de commande correspondantes.
Pour détecter les mouvements, il utilise un algorithme simple de soustraction de deux images. Chaque image est composée de trois couches : rouge, bleu et vert. Ainsi, chacun des pixels d'une image possède trois valeurs correspondant à son RVB.
Vision par ordinateur : Boutons virtuels
Ne serait-ce pas génial si vous pouviez contrôler votre ordinateur avec vos mains ? Dans cette démonstration, vous verrez une petite application permettant de contrôler le lecteur Windows Media Player à l'aide des mouvements de ma main et d'une webcam ordinaire. Vous pouvez voir l'image ci-dessus ; cette application crée trois "points chauds" dans la vue de la webcam, et vous pouvez supposer que ces points chauds sont des boutons virtuels, et qu'ils s'activent lorsque vous faites un mouvement de clic dans ces points.
BotZilla
Une application de bavardage à laquelle ont été ajoutées la synthèse et la reconnaissance vocales. Démonstration de l'élaboration de règles de reconnaissance de plus en plus sophistiquées.
GN Dashboard - outil d'intelligence artificielle
GA Dashboard est un outil d'intelligence artificielle permettant d'appliquer les algorithmes génétiques et les réseaux neuronaux artificiels à la modélisation, à la prédiction, à l'optimisation et à la reconnaissance des formes. Avec GN Dashboard, vous pouvez résoudre divers problèmes d'ingénierie, de la régression classique et de l'approximation à la programmation linéaire, en passant par les problèmes de transport et de localisation et d'autres problèmes basés sur l'apprentissage automatique. En fournissant des algorithmes d'apprentissage, GN Dashboard utilise des données de recherche ou des mesures expérimentales pour apprendre à connaître le problème. Les résultats des algorithmes d'apprentissage sont des modèles analytiques qui peuvent décrire ou prédire l'état du problème, ou reconnaître le modèle. GN Dashboard est très facile à utiliser, même si vous n'avez pas de connaissances approfondies en GA, GP ou ANN, vous pouvez appliquer ces méthodes pour trouver des solutions. L'outil peut être utilisé pour modéliser tout type de processus d'ingénierie, qui peut être décrit avec des données discrètes, ainsi que dans l'éducation pour enseigner aux étudiants les méthodes évolutionnaires, principalement GP et GA, ainsi que l'apprentissage automatique, principalement les réseaux neuronaux artificiels.
Le processus typique de modélisation avec GN Dashboard peut être décrit en 5 étapes.
- Choix du type de solveur: La première étape consiste à choisir le type de solveur. Le choix du solveur que vous utiliserez dépend de ce que vous voulez faire. Par exemple, si vous souhaitez créer un modèle pour vos mesures expérimentales, vous avez plusieurs options qui dépendent de vos données expérimentales et de la méthode que vous souhaitez utiliser. Dans le tableau de bord GN, vous pouvez utiliser la programmation génétique ou les réseaux neuronaux pour modéliser et prédire des données expérimentales. Mais il n'y a pas de distinction stricte entre ces deux méthodes, comme le montre l'organigramme ci-dessous. Cela signifie que vous pouvez utiliser les réseaux neuronaux pour la prédiction, mais que l'algorithme d'apprentissage peut être basé sur l'algorithme génétique, l'optimisation des essaims de particules ou l'algorithme de rétropropagation.
- Chargement des données expérimentales: GN Dashboard utilise un outil puissant pour importer vos données expérimentales, quel que soit le type de données. Vous pouvez importer vos données numériques, binaires ou de classification. GN Dashboard peut définir automatiquement des classes, ou formater des données numériques avec des valeurs décimales flottantes ou séparées par des virgules.
- Réglage des paramètres d'apprentissage. Une fois les données chargées et préparées avec succès, vous devez définir les paramètres de la méthode sélectionnée. GN Dashboard fournit différents paramètres pour chaque méthode, de sorte que vous pouvez définir les paramètres qui peuvent fournir et générer le meilleur modèle de sortie.
- Recherche de la solution: GN Dashboard fournit une visualisation de la solution recherchée afin que vous puissiez suivre visuellement comment GN Dashboard trouve une meilleure solution en augmentant le nombre d'itérations. Si vous fournissez des données pour tester le modèle calculé, vous pouvez également voir la simulation de la prédiction.
- Sauvegarde et exportation des résultats: GN Dashboard offre plusieurs options que vous pouvez choisir lors de l'exportation de votre solution. Vous pouvez exporter votre solution dans un fichier Excel ou texte, ainsi que dans les langages de programmation Wolfram Mathematica ou R.
Comme on peut le constater, le travail dans le tableau de bord GN suit les mêmes procédures quel que soit le type de problème. Cela signifie que vous avez la même série d'étapes lorsque vous modélisez avec la programmation génétique ou les réseaux neuronaux. En fait, GN Dashboard contient le même ensemble de dialogues d'entrée lorsque vous essayez de résoudre le problème du voyageur de commerce avec l'algorithme génétique ou si vous essayez de résoudre la reconnaissance de l'écriture manuscrite en utilisant les réseaux neuronaux de rétropropagation. Tous les algorithmes d'apprentissage de GN Dashboard partagent la même interface utilisateur.
En plus des paramètres spécifiques à l'algorithme d'apprentissage, GN Dashboard fournit un ensemble de paramètres qui contrôlent la façon dont le processus d'itération doit se terminer ainsi que la façon dont le processus d'itération doit être traité au moyen de la parallélisation pour utiliser les processeurs multicœurs. Pendant la recherche d'un problème, GN Dashboard enregistre l'historique, ce qui permet de voir quand la meilleure solution a été trouvée, combien de temps s'est écoulé depuis le début du dernier processus d'itération, ou combien de temps il reste pour terminer le processus d'itération en cours d'exécution.
Étant donné que le GP est une méthode qui nécessite beaucoup de temps de traitement, GN Dashboard propose la parallélisation, qui accélère le processus de recherche. Il suffit de cliquer sur un bouton pour activer ou désactiver la parallélisation.