Skip to main content

Tokens em Modelos de Linguagem e sua Importância para Agentes de IA

1. O que são tokens

Tokens são as menores unidades de texto que um modelo de linguagem consegue processar.

Um texto como:

"Aprender IA é incrível!"

Pode ser transformado em algo como:

["Aprender", " IA", " é", " incrível", "!"]

Ou até em pedaços menores, dependendo do modelo.

Importante:
O modelo não entende palavras diretamente — ele entende tokens.


2. Tipos de tokens

2.1 Tokens comuns (tokens de texto)

São os tokens que representam conteúdo normal:

  • palavras
  • partes de palavras
  • pontuação

Exemplo:

"inteligência"→ ["inteli", "gência"]

2.2 Tokens especiais

São tokens que não representam texto comum, mas sim estrutura ou controle.

Eles funcionam como instruções internas para o modelo.


3. Principais tipos de tokens especiais

3.1 BOS (Beginning Of Sequence)

Indica o início da entrada.

<bos>

Serve para avisar ao modelo:

"Aqui começa o conteúdo"


3.2 EOS (End Of Sequence)

Indica o fim da geração.

<eos>

Função:

  • Diz ao modelo quando parar
  • Evita geração infinita

Analogia:
É como o ponto final de uma frase, mas com poder de encerrar completamente a resposta.


3.3 PAD (Padding)

Usado para completar sequências até um tamanho fixo.

<pad>

Muito usado em treinamento.


3.4 Tokens de papel (role tokens)

Usados em chats:

<user><assistant><system>

Servem para indicar:

  • quem está falando
  • contexto da conversa

3.5 Tokens delimitadores

Alguns modelos usam formatos próprios:

[INST] ... [/INST]

ou

<s> ... </s>

Eles delimitam blocos de instrução.


4. Como isso funciona em um modelo de chat

Por trás de uma conversa simples, o modelo recebe algo como:

<system> Você é um assistente útil </system><user> O que é IA? </user><assistant>

O modelo então completa:

IA é o campo da computação que... <eos>

5. Por que tokens especiais são importantes

5.1 Estrutura da conversa

Sem tokens especiais:

Usuário: Oi Assistente: Olá Usuário: Tudo bem?

Para o modelo isso vira um texto confuso.

Com tokens:

<user> Oi </user><assistant> Olá </assistant><user> Tudo bem? </user>

Agora há estrutura clara.


5.2 Controle da geração

O token <eos> permite:

  • parar respostas automaticamente
  • evitar loops infinitos
  • melhorar performance

5.3 Definição de comportamento

O token <system> pode mudar completamente o modelo:

<system> Seja formal </system>

Isso altera o estilo da resposta.


5.4 Compatibilidade entre modelos

Cada modelo tem seu próprio formato.

Exemplo:

  • Llama → usa [INST]
  • OpenAI → usa roles (system/user/assistant)
  • Outros → usam JSON interno

Por isso existem chat templates:

eles adaptam a entrada para o formato correto do modelo


6. Importância para agentes de IA

Agentes de IA dependem fortemente desses tokens porque:

6.1 Mantêm contexto

Permitem separar:

  • instruções
  • histórico
  • respostas

6.2 Controlam comportamento

O agente pode:

  • mudar personalidade
  • seguir regras
  • executar tarefas específicas

Tudo via estrutura de tokens.


6.3 Evitam ambiguidade

Sem tokens especiais, o modelo pode:

  • confundir quem está falando
  • responder de forma incoerente

6.4 Permitem automação

Ferramentas, memória e raciocínio estruturado dependem de:

  • delimitação clara
  • início/fim de blocos
  • controle de geração

7. Insight avançado

Tokens especiais são uma forma de:

"programar o modelo usando texto"

Eles funcionam como uma camada de controle sem precisar alterar o código do modelo.


8. Conclusão

  • Tokens são a base do funcionamento dos LLMs
  • Tokens especiais organizam e controlam o comportamento
  • O token EOS é essencial para indicar o fim da resposta
  • Em agentes de IA, eles são fundamentais para:
    • contexto
    • estrutura
    • controle
    • previsibilidade