No primeiro post a gente viu os termos båsicos: IA, Machine Learning, Deep Learning e Redes Neurais. Mas como essa mågica acontece de verdade? Como a IA aprende a gerar código, sugerir soluçÔes ou detectar fraudes?
Hoje vamos falar de quatro conceitos que sĂŁo a base desse aprendizado: modelo, dados de treinamento, tokens e tipos de aprendizado.
A ideia dessa série de artigos é trazer alguns termos por vez para facilitar no fixação do aprendizado. Eu até podia trazer tudo de uma vez, mas o artigo ia ficar grande e meio confuso, então decidi separar por partes.
Bora? đ
Modelo
Pensa no modelo como o cérebro da IA.
Ele Ă© o âproduto finalâ de todo o treinamento, quem realmente vai executar a tarefa. Mas ele nĂŁo Ă© criado sabendo, precisa aprender com exemplos.
đĄ Exemplo: o GitHub Copilot Ă© um modelo treinado para completar e sugerir cĂłdigo, entĂŁo ele Ă© treinado especificamente com dados de cĂłdigo.
Dados de Treinamento
Se o modelo é o cérebro, os dados de treinamento são a escola.
Quanto melhores e mais diversos os dados, mais inteligente e preciso o modelo fica.
đâ⏠Exemplo: se vocĂȘ treinar um modelo sĂł com fotos de gatos brancos, ele pode falhar na hora de reconhecer um gato preto. (Provavelmente por isso a gente ainda vĂȘ tanto bias em IA quando vamos criar imagens).
Tokens
Quando a IA trabalha com texto, ela nĂŁo lĂȘ palavra por palavra. O texto Ă© quebrado em tokens, que sĂŁo pedaços menores (podem ser sĂlabas, partes de palavras ou palavras inteiras).
Assim, o modelo aprende a prever qual token vem a seguir.
Exemplo: a frase âEu amo programarâ pode virar Eu | amo | pro | gramar.
O ponto principal é: o modelo não pensa em palavras, mas em tokens. E tokens podem ser palavras inteiras ou pedaços delas.
Tipos de Aprendizado
Nem todo aprendizado de mĂĄquina funciona igual. Os dois principais sĂŁo:
Supervisionado
Quando damos os exemplos jĂĄ com as respostas corretas. Ex: ensinar um modelo a identificar spam mostrando e-mails jĂĄ classificados como âspamâ ou ânĂŁo spamâ.
NĂŁo supervisionado
Quando entregamos os dados sem respostas e o modelo precisa achar padrĂ”es sozinho. Ex: agrupar mĂșsicas por estilo sem dizer previamente o gĂȘnero de cada uma.
Agora vocĂȘ jĂĄ sabe o que Ă© um modelo, como ele aprende com dados, como tokens funcionam e os principais tipos de aprendizado.
Na Parte 3, vamos mergulhar em como as mĂĄquinas entendem a linguagem: LLMs, NLP e contexto.
Obrigada por ler,
Pachi đ„
Top comments (0)
Some comments may only be visible to logged-in visitors. Sign in to view all comments.