O que é um Hiperplano?
Em matemática, um hiperplano H é um subespaço linear de um espaço vectorial V tal que a base de H tem uma cardinalidade inferior à cardinalidade da base de V. Por outras palavras, se V é um espaço vectorial n-dimensional que H é um subespaço (n-1)-dimensional. Exemplos de hiperplanos em 2 dimensões são qualquer linha reta através da origem. Em 3 dimensões, qualquer plano que contenha a origem. Em dimensões superiores, é útil pensar num hiperplano como membro de uma família afim de subespaços (n-1)-dimensionais (os espaços afins têm um aspecto e um comportamento muito semelhantes aos espaços lineares mas não são necessários para conter a origem), de tal forma que todo o espaço é dividido nestes subespaços afins. Esta família será empilhada ao longo do vector único (até ao sinal) que é perpendicular ao hiperplano original. Esta “visualização” permite compreender facilmente que um hiperplano divide sempre o espaço vetorial pai em duas regiões.
Na aprendizagem de máquinas, pode ser útil empregar técnicas como as máquinas vetoriais de suporte para aprender hiperplanos para separar o espaço de dados para classificação. O exemplo mais comum de hiperplanos na prática é com máquinas de suporte vectorial. Neste caso, aprender um hiperplano equivale a aprender um subespaço linear (frequentemente após transformar o espaço usando um kernel não-linear para emprestar uma análise linear) que divide o conjunto de dados em duas regiões para classificação binária. Se a dimensionalidade do conjunto de dados for maior que 2, isto pode ser feito várias vezes para se obter uma classificação multidirecional.
Usos Práticos de Hiperplanos com Máquinas Vetoriais de Suporte
- Processamento de Linguagem Natural – Máquinas Vetoriais de Suporte são úteis tanto na classificação de texto quanto na classificação de hipertexto, pois reduzem a quantidade de instâncias de treinamento rotuladas necessárias. Tanto para técnicas indutivas como transdutivas.
- Classificação de Imagens – O uso de hiperplanos aumenta a precisão de reconhecimento e segmentação de imagens.
- Biociências
– Esta técnica provou ser útil para classificar rapidamente proteínas em substâncias desconhecidas com alta precisão, o que reduz drasticamente o tempo de pesquisa ao estudar novos compostos para potenciais usos de saúde.