Alinhamento de LLMs: O Que É e Principais Técnicas
Como fazer uma LLM responder o que queremos? Exploraremos as técnicas existentes como treinamento, fine-tuning, RAG, guardrails, prompt engineering, entre outros.
Apesar dos óbvios benefícios dos LLMs, pode ser difícil de conseguir respostas consistentes mesmo as mais poderosas, como GPT4. Existem diversas técnicas para uma LLM responder o que se deseja e é isso que essa palestra vai explorar: desde métodos de engenharia de Prompt, passando por métodos mais complexos como fine tuning e métodos externos como RAG e guardrails.
A palestra será uma abordagem expositiva sobre o que é o problema de alinhamento das LLMs (e IAs generativas em geral), por que isso é de fato um problema e alguns exemplos reais de repostas catastróficas de IAs recentes, e uma explicação em alto nível sobre as principais técnicas para solucionar esse problema.
Criei essa palestra inicialmente para um evento do Google Developer Group e PyData por ser um tema que trabalhei e estudei bastante no último ano e ainda é um problema ainda recente, não totalmente solucionado e que estão surgindo novas técnicas o tempo todo. Sendo assim, acredito ser um tema de muito interesse para quem gosta de IA generativa e a palestra foi bem elogiada.