Wat is een hypervlak?
In de wiskunde is een hypervlak H een lineaire deelruimte van een vectorruimte V zo dat de basis van H kardinaliteit 1 minder heeft dan de kardinaliteit van de basis van V. Met andere woorden, als V een n-dimensionale vectorruimte is dan is H een (n-1)-dimensionale deelruimte. Voorbeelden van hypervlakken in 2 dimensies zijn alle rechte lijnen door de oorsprong. In 3 dimensies, elk vlak dat de oorsprong bevat. In hogere dimensies is het nuttig een hypervlak te beschouwen als lid van een affiene familie van (n-1)-dimensionale deelruimten (affiene ruimten lijken qua uiterlijk en gedrag sterk op lineaire ruimten, maar zij behoeven niet de oorsprong te bevatten), zodanig dat de gehele ruimte is verdeeld in deze affiene deelruimten. Deze familie wordt gestapeld langs de unieke vector (tot teken) die loodrecht staat op het oorspronkelijke hypervlak. Door deze “visualisatie” kan men gemakkelijk begrijpen dat een hypervlak de bovenliggende vectorruimte altijd in twee regio’s verdeelt.
In machinaal leren kan het nuttig zijn technieken zoals support vector machines te gebruiken om hypervlakken te leren om de dataruimte te scheiden voor classificatie. Het meest voorkomende voorbeeld van hypervlakken in de praktijk is dat met support vector machines. In dit geval komt het leren van een hypervlak neer op het leren van een lineaire (vaak na transformatie van de ruimte met behulp van een niet-lineaire kernel om een lineaire analyse mogelijk te maken) deelruimte die de gegevensreeks in twee regio’s verdeelt voor binaire classificatie. Als de dimensionaliteit van de gegevensverzameling groter is dan 2, kan dit meerdere malen worden uitgevoerd om een classificatie in meerdere richtingen te bereiken.
Praktische toepassingen van hypervlakken met Support Vector Machines
- Natuurlijke taalverwerking – Support vector machines zijn nuttig bij zowel tekst- als hypertekstclassificatie, omdat zij de benodigde hoeveelheid gelabelde trainingsinstanties verminderen. Zowel voor inductieve als transductieve technieken.
- Beeldclassificatie – Het gebruik van hypervlakken verhoogt de nauwkeurigheid van beeldherkenning en -segmentatie.
- Biowetenschappen
– Deze techniek is nuttig gebleken om eiwitten in onbekende stoffen snel te classificeren met hoge nauwkeurigheid, wat de onderzoekstijd drastisch verkort bij het bestuderen van nieuwe verbindingen voor mogelijk gebruik in de gezondheid.