Qu’est-ce qu’un hyperplan?
En mathématiques, un hyperplan H est un sous-espace linéaire d’un espace vectoriel V tel que la base de H a une cardinalité inférieure de un à la cardinalité de la base de V. En d’autres termes, si V est un espace vectoriel à n dimensions, alors H est un sous-espace à (n-1)-dimensions. Des exemples d’hyperplans en 2 dimensions sont toute ligne droite passant par l’origine. En 3 dimensions, tout plan contenant l’origine. Dans les dimensions supérieures, il est utile de considérer un hyperplan comme un membre d’une famille affine de sous-espaces à (n-1)-dimensions (les espaces affines ressemblent beaucoup aux espaces linéaires, mais il n’est pas nécessaire qu’ils contiennent l’origine), de sorte que l’espace entier est divisé en ces sous-espaces affines. Cette famille sera empilée le long du vecteur unique (jusqu’au signe) qui est perpendiculaire à l’hyperplan d’origine. Cette « visualisation » permet de comprendre facilement qu’un hyperplan divise toujours l’espace vectoriel parent en deux régions.
En apprentissage automatique, il peut être utile d’employer des techniques telles que les machines à vecteurs de support pour apprendre des hyperplans afin de séparer l’espace des données pour la classification. L’exemple le plus courant d’hyperplans dans la pratique est celui des machines à vecteurs de support. Dans ce cas, l’apprentissage d’un hyperplan revient à apprendre un sous-espace linéaire (souvent après avoir transformé l’espace à l’aide d’un noyau non linéaire pour prêter une analyse linéaire) qui divise l’ensemble de données en deux régions pour la classification binaire. Si la dimensionnalité de l’ensemble de données est supérieure à 2, cette opération peut être effectuée plusieurs fois pour obtenir une classification multivoie.
Utilisations pratiques des hyperplans avec les machines à vecteurs de support
- Traitement du langage naturel – Les machines à vecteurs de support sont utiles à la fois pour la classification de textes et d’hypertextes, car elles réduisent la quantité d’instances d’apprentissage étiquetées nécessaires. Aussi bien pour les techniques inductives que transductives.
- Classification d’images – L’utilisation d’hyperplans augmente la précision de la reconnaissance et de la segmentation d’images.
- Biosciences
– Cette technique s’est avérée utile pour classer rapidement les protéines dans des substances inconnues avec une grande précision, ce qui réduit drastiquement le temps de recherche lors de l’étude de nouveaux composés pour des utilisations potentielles dans le domaine de la santé.