Vad är ett hyperplan?
I matematiken är ett hyperplan H ett linjärt delområde i ett vektorrum V så att basen för H har en kardinalitet som är en mindre än kardinaliteten för basen för V. Med andra ord, om V är ett n-dimensionellt vektorrum så är H ett (n-1)-dimensionellt delområde. Exempel på hyperplan i två dimensioner är varje rak linje genom ursprunget. I 3 dimensioner, varje plan som innehåller ursprunget. I högre dimensioner är det användbart att betrakta ett hyperplan som en medlem av en affin familj av (n-1)-dimensionella underrum (affina rum ser ut och beter sig mycket likt linjära rum, men det krävs inte att de innehåller ursprunget), så att hela rummet är uppdelat i dessa affina underrum. Denna familj kommer att staplas längs den unika vektor (upp till tecken) som är vinkelrät mot det ursprungliga hyperplanet. Denna ”visualisering” gör att man lätt kan förstå att ett hyperplan alltid delar upp det överordnade vektorrummet i två regioner.
I maskininlärning kan det vara användbart att använda tekniker som stödvektormaskiner för att lära sig hyperplan för att separera datarummet för klassificering. Det vanligaste exemplet på hyperplan i praktiken är stödvektormaskiner. I detta fall innebär inlärning av ett hyperplan att man lär sig ett linjärt (ofta efter att ha transformerat utrymmet med hjälp av en icke-linjär kärna för att ge en linjär analys) underutrymme som delar upp datamängden i två regioner för binär klassificering. Om datamängdens dimensionalitet är större än 2 kan detta utföras flera gånger för att uppnå en flervägsklassificering.
Praktiska användningsområden för hyperplan med stödvektormaskiner
- Behandling av naturligt språk – Stödvektormaskiner är användbara i både text- och hypertextklassificering, eftersom de minskar mängden märkta träningsinstanser som behövs. Både för induktiva och transduktiva tekniker.
- Bildklassificering – Användning av hyperplanes ökar noggrannheten vid bildigenkänning och segmentering.
- Biovetenskap
– Den här tekniken har visat sig vara användbar för att snabbt klassificera proteiner i okända substanser med hög noggrannhet, vilket drastiskt förkortar forskningstiden när man studerar nya föreningar för potentiell användning i hälsovården.