Inteligência Artficial - Aprendizado Semi-supervisionado
- Nesky

- 13 de jan. de 2025
- 3 min de leitura

Aprendizado semi-supervisionado
O aprendizado semi-supervisionado é uma técnica dentro do campo da inteligência artificial (IA) e aprendizado de máquina, que combina características do aprendizado supervisionado e não supervisionado.
Essa abordagem é particularmente útil quando se tem um grande conjunto de dados, mas apenas uma parte dele é rotulada (ou seja, possui as respostas ou categorias associadas), enquanto a maior parte não é.
Aprendizado Supervisionado
Nesse tipo de aprendizado, o algoritmo é treinado com um conjunto de dados que já inclui as respostas (rótulos).

Por exemplo, se estamos tentando classificar imagens de animais, cada imagem de treinamento já teria um rótulo indicando qual animal é. O modelo aprende a partir dessas associações.
Aprendizado Não Supervisionado
Aqui, o algoritmo trabalha com dados não rotulados e tenta encontrar padrões ou estruturas nos dados.

Por exemplo, se tivermos muitas imagens de animais sem rótulos, o modelo pode agrupar as imagens com base em características semelhantes, mas sem saber exatamente qual é cada animal.
Como o Aprendizado Semi-supervisionado funciona?
O aprendizado semi-supervisionado aproveita o melhor dos dois mundos. Em vez de usar apenas dados rotulados (como no aprendizado supervisionado) ou apenas dados não rotulados (como no aprendizado não supervisionado), ele utiliza uma combinação de ambos.

O modelo é treinado com um número limitado de dados rotulados e uma grande quantidade de dados não rotulados.
Exemplo: Imagine que você tem 1.000 imagens de animais, mas apenas 100 delas estão rotuladas. Usando aprendizado semi-supervisionado, o modelo pode aprender a partir das 100 imagens rotuladas, enquanto usa as outras 900 imagens não rotuladas para melhorar sua capacidade de identificar padrões e realizar previsões mais precisas.
Vantagens do Aprendizado Semi-supervisionado
Economia de recursos: Rotular dados pode ser caro e demorado. O aprendizado semi-supervisionado permite que você aproveite um grande volume de dados não rotulados, o que pode ser mais acessível e rápido.
Melhoria de desempenho: Mesmo com um pequeno conjunto de dados rotulados, o modelo pode alcançar um desempenho significativamente melhor se puder aprender com muitos dados não rotulados.
Algoritmos Aprendizado Semi-supervisionado
1 – ALGORITMOS DE AUTO-TREINAMENTO (SELF-TRAINING)
2 – PROPAGAÇÃO DE RÓTULOS (LABEL PROPAGATION)
3 - APRENDIZADO DE CONSISTÊNCIA (CONSISTENCY-BASED LEARNING)
4 - MÉTODOS DE DENSIDADE CONDICIONAL (CONDITIONAL DENSITY ESTIMATION)
5 - CO-TREINAMENTO (CO-TRAINING)
6 - APRENDIZADO SEMI-SUPERVISIONADO BASEADO EM GRAFO
1 – ALGORITMOS DE AUTO-TREINAMENTO (SELF-TRAINING)
Algoritmos de auto-treinamento, também conhecidos como métodos de aprendizado semi-supervisionado, são técnicas que combinam elementos de aprendizado supervisionado e não supervisionado.
Esses métodos são úteis quando temos um conjunto limitado de dados rotulados (dados com exemplos em que a saída desejada já é conhecida) e um grande conjunto de dados não rotulados (dados sem exemplos em que a saída desejada é desconhecida).
2 – PROPAGAÇÃO DE RÓTULOS (LABEL PROPAGATION)
A Propagação de Rótulos (Label Propagation) é uma técnica de aprendizado semi-supervisionado usada para atribuir rótulos a dados não rotulados com base em um conjunto inicial de dados rotulados.
Esse método é especialmente útil quando temos um conjunto pequeno de dados rotulados e um grande conjunto de dados não rotulados, sendo uma alternativa eficiente para expandir o conjunto de dados rotulados sem a necessidade de rotulação manual extensiva.
3 - APRENDIZADO DE CONSISTÊNCIA (CONSISTENCY-BASED LEARNING)
O aprendizado de consistência (consistency-based learning) é uma abordagem no campo de aprendizado semi-supervisionado que utiliza princípios de consistência entre diferentes visões dos dados para melhorar a eficácia do modelo de aprendizado.
Esta técnica é particularmente útil quando há múltiplas fontes de dados ou múltiplos modelos que podem oferecer informações complementares sobre os mesmos dados, visando melhorar a generalização e robustez do modelo final.
4 - MÉTODOS DE DENSIDADE CONDICIONAL (CONDITIONAL DENSITY ESTIMATION)
Métodos de densidade condicional (Conditional Density Estimation, CDE) são técnicas usadas para estimar a distribuição condicional de uma variável de interesse dado um conjunto de variáveis explicativas.
Em outras palavras, eles modelam a distribuição da variável resposta condicionalmente às variáveis preditoras, sem assumir uma forma funcional específica para essa distribuição.
5 - CO-TREINAMENTO (CO-TRAINING)
O co-treinamento (co-training) é uma técnica de aprendizado semi-supervisionado onde dois ou mais modelos são treinados simultaneamente usando diferentes vistas ou representações dos mesmos dados.
A idéia principal é que cada modelo aprenda algo diferente sobre o conjunto de dados e que eles possam melhorar uns aos outros ao compartilhar informações.
6 - APRENDIZADO SEMI-SUPERVISIONADO BASEADO EM GRAFO
O aprendizado semi-supervisionado baseado em grafo é uma abordagem que utiliza grafos para modelar relações entre dados rotulados e não rotulados, aproveitando a estrutura do grafo para melhorar o aprendizado.
Essa técnica é especialmente útil em situações onde há poucos dados rotulados disponíveis e uma grande quantidade de dados não rotulados.









Comentários