Como a IA Aprende

#braziliandevs #github #ai #newbie

No primeiro post a gente viu os termos básicos: IA, Machine Learning, Deep Learning e Redes Neurais. Mas como essa mágica acontece de verdade? Como a IA aprende a gerar código, sugerir soluções ou detectar fraudes?

Hoje vamos falar de quatro conceitos que são a base desse aprendizado: modelo, dados de treinamento, tokens e tipos de aprendizado.

A ideia dessa série de artigos é trazer alguns termos por vez para facilitar no fixação do aprendizado. Eu até podia trazer tudo de uma vez, mas o artigo ia ficar grande e meio confuso, então decidi separar por partes.
Bora? 🚀

Modelo

Pensa no modelo como o cérebro da IA.
Ele é o “produto final” de todo o treinamento, quem realmente vai executar a tarefa. Mas ele não é criado sabendo, precisa aprender com exemplos.

💡 Exemplo: o GitHub Copilot é um modelo treinado para completar e sugerir código, então ele é treinado especificamente com dados de código.

Dados de Treinamento

Se o modelo é o cérebro, os dados de treinamento são a escola.
Quanto melhores e mais diversos os dados, mais inteligente e preciso o modelo fica.
🐈‍⬛ Exemplo: se você treinar um modelo só com fotos de gatos brancos, ele pode falhar na hora de reconhecer um gato preto. (Provavelmente por isso a gente ainda vê tanto bias em IA quando vamos criar imagens).

Tokens

Quando a IA trabalha com texto, ela não lê palavra por palavra. O texto é quebrado em tokens, que são pedaços menores (podem ser sílabas, partes de palavras ou palavras inteiras).

Assim, o modelo aprende a prever qual token vem a seguir.
Exemplo: a frase “Eu amo programar” pode virar Eu | amo | pro | gramar.

O ponto principal é: o modelo não pensa em palavras, mas em tokens. E tokens podem ser palavras inteiras ou pedaços delas.

Tipos de Aprendizado

Nem todo aprendizado de máquina funciona igual. Os dois principais são:

Supervisionado

Quando damos os exemplos já com as respostas corretas. Ex: ensinar um modelo a identificar spam mostrando e-mails já classificados como “spam” ou “não spam”.

Não supervisionado

Quando entregamos os dados sem respostas e o modelo precisa achar padrões sozinho. Ex: agrupar músicas por estilo sem dizer previamente o gênero de cada uma.

Agora você já sabe o que é um modelo, como ele aprende com dados, como tokens funcionam e os principais tipos de aprendizado.
Na Parte 3, vamos mergulhar em como as máquinas entendem a linguagem: LLMs, NLP e contexto.

Obrigada por ler,
Pachi 🥑

Top comments (0)

Some comments may only be visible to logged-in visitors. Sign in to view all comments.