Hvad er et hyperplan?
I matematikken er et hyperplan H et lineært underrum af et vektorrum V, således at grundlaget for H har en kardinalitet mindre end kortinaliteten af grundlaget for V. Med andre ord, hvis V er et n-dimensionelt vektorrum, så er H et (n-1)-dimensionelt underrum. Eksempler på hyperplaner i 2 dimensioner er enhver lige linje gennem oprindelsen. I 3 dimensioner er ethvert plan, der indeholder oprindelsen. I højere dimensioner er det nyttigt at betragte en hyperplan som et medlem af en affin familie af (n-1)-dimensionale underrum (affine rum ligner i udseende og adfærd meget lineære rum, men det er ikke nødvendigt, at de indeholder oprindelsen), således at hele rummet er opdelt i disse affine underrum. Denne familie vil blive stablet langs den unikke vektor (op til fortegn), der er vinkelret på den oprindelige hyperplan. Denne “visualisering” gør det let at forstå, at en hyperplan altid opdeler det overordnede vektorrum i to regioner.
I maskinindlæring kan det være nyttigt at anvende teknikker som supportvektormaskiner til at lære hyperplaner til at adskille datarummet med henblik på klassifikation. Det mest almindelige eksempel på hyperplaner i praksis er med støttevektormaskiner. I dette tilfælde svarer det at lære en hyperplan til at lære et lineært (ofte efter at have transformeret rummet ved hjælp af en ikke-lineær kerne for at give en lineær analyse) underrum, der opdeler datasættet i to regioner til binær klassifikation. Hvis datasættets dimensionalitet er større end 2, kan dette udføres flere gange for at opnå en flervejsklassifikation.
Praktisk anvendelse af hyperplaner med støttevektormaskiner
- Naturlig sprogbehandling – Støttevektormaskiner er nyttige i både tekst- og hypertekstklassifikation, da de reducerer mængden af nødvendige mærkede træningsinstanser. Både til induktive og transduktive teknikker.
- Billedklassifikation – Ved at bruge hyperplaner øges billedgenkendelsen og segmenteringsnøjagtigheden.
- Biovidenskab
– Denne teknik har vist sig nyttig til hurtigt at klassificere proteiner i ukendte stoffer med høj nøjagtighed, hvilket drastisk reducerer forskningstiden ved undersøgelse af nye forbindelser med henblik på potentielle anvendelser på sundhedsområdet.