A pilha de contexto manda mais do que a tua mensagem

Quem começa a usar IA generativa trata a prompt como sinónimo do que se escreve no campo de texto. No entanto, a tua mensagem é apenas um andar dos quatro que o modelo lê em cada chamada.

Prompting é a prática de escrever instruções para um modelo de linguagem, desde uma pergunta rápida no ChatGPT até uma prompt de sistema estruturada com papel, restrições e formato de saída. A qualidade da prompt determina a qualidade da resposta, porque a prompt é o único canal pela qual controlas o que um LLM gera. E o que se chama prompt na prática é maior do que parece.

Janela de contexto

  1. prompt de sistema instruções persistentes da interface ou do produto
  2. memória notas que a interface guardou e injeta sem te mostrar
  3. prompt de utilizador a tua mensagem (e o histórico desta conversa)
  4. resultados de ferramentas o que voltou de pesquisas, APIs ou servidores MCP

Os outros três andares vêm da interface ou da aplicação. O modelo lê os quatro em cada chamada, antes de gerar uma palavra.

Tu só escreves a prompt de utilizador, mas o modelo lê os quatro andares da pilha em cada chamada. Controlar a pilha é controlar a resposta.

O que entra na chamada divide-se em quatro andares.

  • A prompt de sistema vem da interface ou da aplicação e raramente a vês, mas está sempre lá.
  • A memória é o conjunto de notas que a interface guardou em conversas anteriores e injeta sem te mostrar.
  • A prompt de utilizador é a tua mensagem, mais o histórico da conversa.
  • Os resultados de ferramentas são o que voltou de ferramentas que o modelo invocou (pesquisa web, ficheiros anexados, servidores MCP).

Tudo isto compete pelo mesmo “orçamento de tokens” na janela de contexto que cobrimos no guia de funcionamento dos LLM.

O trabalho é simples de descrever e exigente de praticar: aprender a ler a pilha, decidir o que vai em cada andar e escrever o que controlas (a tua prompt de utilizador e, conforme a interface, parte da prompt de sistema) para fechar o resto.

Onde se define a prompt de sistema

Não escreves a prompt de sistema no campo de chat. Cada ferramenta dá-te várias camadas para a definir, desde a conta (afeta todas as conversas) à API (cada chamada). As camadas acumulam-se: a interface junta-as antes de o modelo ler.

Onde se define uma prompt de sistema em cada ferramenta, da conta (afeta todas as conversas) à API (cada chamada). As camadas acumulam-se: a interface junta-as antes de o modelo ler. Cada cartão liga à documentação do fornecedor.

Quatro registos de prompting, com controlo crescente

Quase toda a gente usa um único registo: escrever uma pergunta natural e ver o que sai. Funciona para muitas tarefas, e há outros três registos que ganham consistência à medida que pedes mais ao modelo. Saber qual usar para que tarefa é metade do trabalho.

  1. 1 Ad-hoc

    conversa, sem estrutura explícita

    "Podes resumir isto?"
  2. 2 Zero-shot

    pedido explícito com restrições, sem exemplos

    "Resume em 3 pontos, máx. 50 palavras cada, tom formal."
  3. 3 Few-shot

    2 a 5 exemplos demonstrativos antes do pedido

    "Eis 3 resumos no estilo certo. Aplica o mesmo estilo a este texto."
  4. 4 Prompt de sistema

    cabeçalho persistente com papel, restrições e formato

    sistema: "És editor sénior. Resumes sempre em 3 pontos formais." utilizador: "Aqui está o artigo."
A mesma tarefa, resumir um artigo, em quatro registos. Da esquerda para a direita ganhas controlo e consistência; o esforço inicial sobe na mesma direção.

A progressão vai de ad-hoc a prompt de sistema por controlo crescente.

  • No nível ad-hoc, escreves uma pergunta natural e aceitas a primeira resposta razoável. É barato, rápido e bom para exploração; a consistência é baixa, porque dependes da interpretação que o modelo faz da tua frase.
  • No zero-shot, és explícito sobre formato, tom, restrições e comprimento, e o modelo costuma cumprir.
  • No few-shot, juntas dois a cinco exemplos antes do pedido para ensinar por analogia: usa mais tokens e ganha consistência de formato.
  • Na prompt de sistema, fixas o papel, as restrições e o formato num cabeçalho persistente que se aplica a todas as conversas seguintes; é o nível com mais esforço inicial e o melhor retorno em tarefas recorrentes.

Para uma pergunta única que vais fazer hoje e nunca mais, ad-hoc chega. Para um relatório semanal de vendas, vale a pena gastar 20 minutos a escrever uma prompt de sistema e nunca mais repetir as restrições.

NívelQuando usarExemplo curtoCompromisso principal
Ad-hocExploração, conversa, curiosidade”Podes resumir isto?”Máxima rapidez; mínimo controlo
Zero-shotTarefas pontuais com contexto claro”Resume o texto abaixo em 3 pontos, tom formal, máx. 50 palavras por ponto.”Bom equilíbrio rapidez/controlo; depende da clareza da instrução
Few-shotTarefas com formato específico que convém ensinar3 pares (email bruto → resumo) + o email a resumirMais tokens usados; maior consistência de formato
Prompt de sistemaTarefa recorrente, equipa, produtoCabeçalho persistente com papel, restrições, exemplo e formatoMaior esforço inicial; melhor consistência a longo prazo

Cinco hábitos que separam uma prompt vaga de uma útil

Se uma prompt não te está a funcionar, percorre esta lista antes de investir em soluções mais complexas. O problema está quase sempre aqui.

Sê explícito

A vagueza é o maior inimigo de respostas úteis. O modelo preenche o que não pediste com predefinições, e as predefinições raramente são o que querias. Substitui adjetivos por restrições numéricas, formatos e exemplos sempre que possível.

Mau: “Faz-me um resumo curto deste contrato.”

Bom: “Resume este contrato em 5 pontos de máximo 25 palavras cada, em português de Portugal, agrupados por tema (objeto, prazo, valor, denúncia, foro).”

Tens esta tarefa como prompt pronta a usar em Resumo de contrato.

Dá contexto suficiente

O modelo não tem como adivinhar quem vai ler o que estás a pedir, em que canal, com que tom. Diz-lhe. Três peças resolvem a maior parte dos casos: público-alvo, canal e registo. As outras (domínio, restrições legais, terminologia da casa) entram quando aplicáveis.

Mau: “Escreve uma resposta a este cliente.”

Bom: “Escreve uma resposta a este cliente para enviar por email. É um cliente B2B numa PME de logística, frustrado com um atraso de entrega. Tom: direto, sem desculpas vazias, com uma ação concreta nas primeiras duas linhas.”

A versão pronta a usar está em Resposta a cliente.

Estrutura a saída antes de pedir

Especifica o formato no fim da prompt, mesmo que tenhas estruturado o pedido em prosa. Um modelo bem instruído sobre conteúdo e mal instruído sobre formato dá-te uma resposta utilizável que precisa de ser reformatada à mão. Quase sempre é evitável.

Mau: “Diz-me se este texto está bem escrito.”

Bom: “Avalia este texto em três dimensões (clareza, tom, erros). Para cada uma, devolve uma linha no formato dimensão: nota /5, comentário curto. Lista os erros encontrados em seguida, um por linha, no formato linha N: descrição.”

Tens este padrão de avaliação como prompt pronta em Avaliar um texto.

Mostra com exemplos

Quando uma característica é difícil de descrever em palavras (estilo, voz, granularidade), um exemplo vale mais do que três adjetivos. Mesmo um único exemplo (one-shot) costuma melhorar muito a aderência ao estilo. Dois ou três (few-shot) cimentam.

Mau: “Escreve no nosso tom de voz.”

Bom: “Escreve no nosso tom de voz. Eis dois exemplos do que consideramos bom: [exemplo 1]; [exemplo 2]. Repara em três coisas: frases curtas, nada de superlativos, e sempre uma chamada à ação concreta no fim.”

Itera rápido

A tentação de escrever a prompt perfeita antes da primeira chamada é forte. Resiste-lhe. Dois ou três ciclos rápidos de “prompt → resposta → ajuste” produzem quase sempre um resultado melhor do que uma única hora de redação cuidada. O modelo é barato, o teu tempo de pensar é caro. Começa simples, lê a primeira resposta com olhos críticos, e ajusta o que falhou. A versão final emerge depressa.

Estas cinco posturas multiplicam o efeito de qualquer padrão técnico abaixo. Sem elas, os padrões dão resultados marginais. Com elas, a maioria das tarefas resolve-se com dois ou três padrões bem aplicados.

Padrões de prompting para usar no dia a dia

A literatura sobre prompting cresceu muito nos últimos três anos, e há listas com 60 ou 80 “técnicas”. Vinte padrões agrupados em seis categorias cobrem a maior parte das situações em trabalho real. Esta secção é o catálogo de referência: lê de fio a pavio uma vez, depois volta como dicionário quando estiveres a montar uma prompt específica.

A anatomia de uma prompt estruturada dá o esqueleto. Cada bloco aceita os padrões abaixo; clica num para ver um exemplo aplicado.

Papel

Prompt de papel fixar a especialização

"És advogado especializado em arrendamento, em Lisboa."

Persona / audiência adaptar ao leitor final

"Escreve para um CTO técnico, não para um cliente leigo."

Tom e registo controlar a voz

"Tom formal, sem superlativos nem pontos de exclamação."
Objetivo

Chain-of-thought problemas multi-passo

"Pensa passo a passo antes de dares a resposta final."

Step-back reformular antes de resolver

"Primeiro, diz qual é a verdadeira pergunta por trás deste pedido."

Plan-then-execute tarefas longas

"Planeia os passos numa lista, depois executa um de cada vez."

Crítica / auto-revisão caçar erros próprios

"Revê a tua resposta e aponta 2 falhas antes de a dares por final."
Contexto

Delimitadores isolar o teu texto das instruções

"Coloca o contrato entre <contrato> e </contrato>; tudo fora disso são instruções."

Decomposição tarefa grande em sub-pedidos

"Divide a análise em 3 subtarefas e trata uma de cada vez."
Exemplos

Few-shot ensinar por analogia

"Eis 3 emails e o resumo certo de cada um. Resume o quarto no mesmo estilo."

One-shot quando 1 exemplo chega

"Eis um resumo no estilo que quero: [exemplo]. Faz igual para este texto."

Exemplo negativo delimitar o que evitar

"Evita aberturas como 'Esperamos que este email o encontre bem'. Vai direto ao assunto."
Formato

Formato de saída resultado num formato fixo

"Responde só em Markdown, com 3 pontos."

Modelo de resposta fixar o esqueleto

"Usa este molde: Problema / Causa / Ação."

Limite de comprimento travar a verbosidade

"No máximo 100 palavras, em 3 pontos."

Schema JSON integração programática

"Responde só com JSON: {"nif": "...", "total": 0, "iva": 0}."

XML tags separação clara (idiomático no Claude)

"Põe a resposta em <resposta> e a justificação em <justificacao>."
Restrições

Cláusula de recusa + citar travar invenção

"Se não souberes, diz 'não sei'. Nunca inventes URLs nem citações."

Iteração progressiva começar curto e crescer

"Dá-me primeiro uma versão em 50 palavras; depois expande para 200."

ReAct alternar raciocínio e ação (agentes)

"A cada passo, escreve o raciocínio, depois a ação (ex.: uma pesquisa), lê o resultado e só então responde."
Os seis blocos de uma prompt de sistema. Cada bloco mostra o exemplo de um padrão; clica noutro chip para o trocar. É um menu: um pedido rápido usa um ou dois blocos, uma prompt de equipa usa todos.

Sete anti-padrões a evitar

Sete falhas estragam prompts com frequência:

  1. Prompt gigante sem estrutura. Um parágrafo de 600 palavras a misturar contexto, restrições e exemplos. O modelo perde-se, e tu também. Quebra em secções com cabeçalhos (“Contexto”, “Restrições”, “Exemplos”).
  2. Instruções contraditórias. “Sê conciso mas detalhado”, “formal mas amigável”. Decide ou aceita que o modelo vai escolher por ti.
  3. “Sê criativo” sem limitação. A criatividade emerge contra restrições. Pede 5 variações com tons diferentes, três soluções com um orçamento máximo, ou uma resposta em estilo de António Lobo Antunes; pedir “criatividade” abstrata é convite a banalidade.
  4. Pedir a coisa errada. O resumo de um documento quando o que querias era a recomendação. A pergunta é a metade que mais influencia a resposta; reformula até estar a pedir mesmo o que precisas.
  5. Esquecer contexto relevante. Público, canal, restrições legais, terminologia da casa. Sem isso, o modelo gera versões médias do que viu durante o treino.
  6. Não pedir formato de saída. Resultado: tens de pedir o mesmo conteúdo outra vez “em pontos” ou “em tabela”, e desperdiças uma chamada.
  7. Few-shot com exemplos inconsistentes. Se os três exemplos têm tons diferentes, comprimentos diferentes, estruturas diferentes, o modelo aprende “qualquer coisa serve”. Os exemplos do few-shot têm de ser o mais parecidos possível entre si, exceto na parte que o modelo deve variar.

Markdown é o formato partilhado entre ti e o modelo

Os LLMs comerciais “falam” Markdown com fluência. Foram treinados em quantidades enormes de texto da web e do GitHub, onde Markdown é a língua franca. Aproveitando isso, ganhas duas coisas: prompts mais fáceis de ler para ti, e respostas mais consistentes do modelo.

O mínimo a dominar

Há muitos recursos onde aprender sobre Markdown. Deixamos aqui só os básicos:

  • Cabeçalhos começam por #, ##, ### (em que cada # adicional significa um nível de cabeçalho inferior).
  • Listas de pontos com - ou *.
  • Ênfase com **negrito** e *itálico*.
  • Blocos de código com triplas crase (```) para colar texto literal.
  • Tabelas em barra vertical (| coluna | coluna |).
  • Ligações com [texto](url).

Com isto chega para escrever a maior parte das prompts úteis.

Porque é que os LLMs respondem bem a Markdown

Três razões:

  • Treino: documentação técnica, READMEs do GitHub, artigos do Substack, posts do Medium, tudo em Markdown. O modelo viu milhões de exemplos.
  • Não-ambiguidade: ## Contexto é inequivocamente um cabeçalho; “Contexto:” no meio de um parágrafo é uma frase qualquer. Para o modelo, a diferença é grande.
  • Economia de tokens: a sintaxe Markdown é leve em tokens, comparada com XML ou JSON envolventes.

Na tua prompt

Usa Markdown para três coisas:

  • separar secções (## Contexto, ## Restrições, ## Formato de saída),
  • enumerar restrições em pontos,
  • e delimitar texto literal com blocos de código ou triplas crase. Quando colas um contrato, um email do cliente, ou um trecho que o modelo deve resumir, mete-o entre blocos de código. Reduz a probabilidade de o modelo confundir o teu input com instruções.
## Contexto
És assistente jurídico de uma firma em Lisboa, especializada em arrendamento.

## Tarefa
Resume o contrato abaixo nas cláusulas críticas (objeto, prazo, valor, denúncia, foro).

## Formato
3 a 5 pontos em Markdown, máx. 30 palavras cada. Nada antes ou depois.

## Contrato
```contrato
[cola aqui o texto do contrato]
```

Na resposta do modelo

Pedir Markdown explícito no resultado é útil para a nossa interpretação (e a do modelo, em interações subsequentes). “Responde em Markdown, com cabeçalhos de nível 2 para cada secção e pontos dentro de cada uma” produz respostas estruturadas e fáceis de copiar.

O modelo fala português do Brasil até lhe dizeres o contrário

A maior parte do conteúdo em português nos dados de treino é brasileiro. Quando escreves em português de Portugal e o modelo responde com “você”, “celular” e “tela”, está a reproduzir a distribuição do que viu mais. É estatística, e a tarefa prática é controlar a variante que queres.

Porque é que acontece

Três causas, em ordem de impacto.

  1. Distribuição dos dados: o Brasil tem mais utilizadores online em português do que Portugal, mais conteúdo publicado, mais código com comentários em português, mais Wikipedia em português. O modelo amostra do que viu.
  2. Falta de instrução explícita: sem pedido para uma variante específica, o modelo escolhe a mais provável, e a mais provável é a brasileira.
  3. Prompts de papel não ancoradas em variante: dizer “és um redator” não fixa nada; dizer “és um redator português de Lisboa” fixa.

Três técnicas que funcionam

Em ordem crescente de eficácia:

  1. Instrução de variante explícita na prompt de sistema: “Responde sempre em português de Portugal, pós-Acordo Ortográfico.” Resolve a maior parte dos casos sozinha.
  2. Prompt de papel ancorada em variante: “És editor de um jornal português, em Lisboa, com 10 anos de experiência.” Sobe a probabilidade da variante pretendida de forma consistente.
  3. Dicionário preferido com 10 a 15 termos sensíveis: “Em particular, usa: ficheiro (não arquivo), ecrã (não tela), utilizador (não usuário), telemóvel (não celular).”

Combinando as três, a aderência à variante fica robusta na maioria das chamadas.

Mesmas técnicas, outras direções

Estas três técnicas servem para qualquer variante de língua. Forçar português do Brasil para uma audiência brasileira, inglês britânico, um registo formal: o padrão é o mesmo. Instrução explícita, papel ancorado e dicionário de termos.

Bloco pronto a copiar

És [papel] para [audiência].

Responde sempre em português de Portugal, pós-Acordo Ortográfico, com diacríticos.
Em particular, usa estes termos: ficheiro (não arquivo), ecrã (não tela), utilizador (não usuário),
telemóvel (não celular), equipa (não time), fatura (não nota fiscal), morada (não endereço).
Trata o leitor por "tu" / "vós", não por "você".
Se não souberes uma palavra na variante portuguesa, escreve-a em inglês entre parênteses
e nunca inventes um termo numa variante diferente.

Cola isto no campo de prompt de sistema da tua ferramenta e a maior parte do problema fica resolvida. Tens este bloco como prompt pronta a copiar em Prompt de sistema: português de Portugal. Para adaptar um texto que já recebeste noutra variante, usa Reescrever em português europeu.

Exemplo de uma prompt de sistema completa

Junta as peças das secções anteriores numa prompt de sistema que podes colar e reutilizar. Este exemplo serve um redator de uma fintech, mas a estrutura aplica-se a qualquer tarefa recorrente.

## Papel
És redator sénior para uma fintech portuguesa B2B. Trabalhas com o diretor de marketing,
que quer mensagens claras e diretas, sem jargão financeiro além do essencial.

## Restrições
- Responde sempre em português de Portugal, pós-Acordo Ortográfico.
- Tom direto, sem superlativos nem clichês de marketing.
- Respostas até 200 palavras, salvo pedido explícito de mais.
- Se faltar contexto crítico, faz uma pergunta em vez de inventar.
- Nunca uses dados de clientes reais; usa nomes fictícios.

## Exemplo
Pergunta: "Explica em três pontos a vantagem do plano premium."
Resposta:
- Preço fixo: sabes ao cêntimo o que pagas todos os meses.
- Sem letras pequenas: cancelas com um clique, quando quiseres.
- Suporte humano em Lisboa: respondemos em menos de 4 horas em dias úteis.

## Formato
Três pontos em Markdown, máximo 30 palavras cada. Sem introdução nem fecho.

Cada secção mapeia para a anatomia da secção anterior: Papel fixa quem o modelo é, Restrições declaram o que pode e não pode fazer, Exemplo ensina por demonstração, Formato trava a verbosidade. Repara que não puseste tudo no campo de chat: este bloco vive na prompt de sistema (Custom Instructions, um Projeto, um GPT ou Gem), e a tua prompt de utilizador fica só com a pergunta do momento. Para reutilizares esta estrutura em qualquer tarefa, copia o modelo de prompt de sistema e preenche cada bloco.

Falta o quinto passo, e é o que separa uma prompt que parece boa de uma que funciona: testa antes de confiar. Define três entradas (uma fácil, uma típica, uma adversarial), gera duas respostas para cada, e compara por critérios que fixas à partida: precisão, formato, tom, comprimento. Ajusta o bloco que falhar. Três iterações resolvem quase tudo.

Para ir mais fundo (recursos em inglês)

Material em inglês, ordenado grosso modo do mais aplicado ao mais académico.

Próximos passos

A tua mensagem é um andar dos quatro. Quem domina os outros três domina a resposta, e o que está acima é a caixa de ferramentas para o fazer.

Para onde a seguir

Para continuar

Perguntas Frequentes

Qual é a diferença entre prompt de sistema e prompt de utilizador?
A prompt de utilizador é a mensagem que escreves em cada interação. A prompt de sistema é uma instrução persistente que fixa o comportamento do modelo antes de qualquer mensagem: papel, tom, restrições, formato de saída. Tudo chega ao modelo dentro da mesma janela de contexto. A prompt de sistema é a âncora, a prompt de utilizador é o pedido específico. Em Claude Projects, ChatGPT Custom Instructions ou Gemini Gems é lá que se define.
Preciso de saber 'prompt engineering' para usar o ChatGPT, o Claude ou o Gemini?
Para tarefas pontuais, uma pergunta clara chega. A partir do momento em que usas o mesmo tipo de pedido várias vezes, precisas de consistência entre utilizadores ou queres integrar o modelo num fluxo de trabalho, vale a pena investir 30 minutos neste guia. A qualidade da resposta depende em grande parte da qualidade da prompt e do contexto que a acompanha.
O que é um few-shot prompt e quando é que devo usar?
É uma prompt que inclui 2 a 5 exemplos de input/output antes do pedido real, para ensinar o modelo por analogia. Usa-a quando a forma da resposta importa tanto como o conteúdo: classificar tickets, escrever em estilo consistente, extrair campos de texto. Para tarefas simples, um exemplo só (one-shot) ou nenhum (zero-shot) costuma chegar. O custo são tokens a mais na prompt.
Porque é que o modelo responde em português do Brasil quando escrevo em português de Portugal?
Porque a maior parte do conteúdo em português nos dados de treino reflete a variante brasileira, a que tem mais falantes e mais presença online. O modelo responde no que viu mais, sem juízo de valor sobre variantes. Para fixar a tua: dá instrução explícita na prompt de sistema ("Responde sempre em português de Portugal, pós-Acordo Ortográfico"), usa uma prompt de papel ancorada ("És editor de um jornal português") e inclui um dicionário de termos preferidos.
Como testo se uma prompt está a melhorar ou a piorar o resultado?
Nunca avalies com uma única resposta. A geração é probabilística, e o ruído da amostragem encobre a diferença real. Define 3 a 5 inputs representativos (fácil, típico, adversarial) e gera 2 a 3 respostas para cada. Compara por critérios explícitos que fixas antes: precisão, formato, tom, comprimento. Para resultados reprodutíveis, usa a API com temperatura baixa.
Quando devo usar uma prompt de sistema em vez de pôr tudo na prompt de utilizador?
Sempre que o mesmo enquadramento se repete. Se as restrições, o papel ou o formato vão aplicar-se a múltiplas perguntas, põe-nos na prompt de sistema; a prompt de utilizador fica focada no pedido específico. No ChatGPT, isto corresponde às Custom Instructions ou a um GPT dedicado; no Claude, é o campo system ou o Projeto; no Gemini, um Gem.
O 'chain-of-thought' (pensa passo a passo) funciona mesmo ou é marketing?
Funciona, com limites. Pedir ao modelo para raciocinar em voz alta antes da resposta final melhora tarefas multi-passo, cálculo e extração, porque usa a geração intermédia como espaço de trabalho. Em modelos de raciocínio mais recentes, esse thinking já corre internamente. Para tarefas simples de uma só etapa, o ganho é marginal e só consome tokens.
A mesma prompt funciona em qualquer modelo (ChatGPT, Claude, Gemini)?
Os princípios sim, os detalhes variam. O Claude responde particularmente bem a XML tags (<contexto>…</contexto>); o ChatGPT aceita bem Markdown estruturado; o Gemini agradece exemplos bem demarcados. A duração da janela de contexto, o comportamento perante cláusulas de recusa e a tendência para respostas longas mudam entre modelos. Trata cada um como um colaborador com tiques próprios.
Preciso de saber Markdown para escrever boas prompts?
O mínimo (pontos, cabeçalhos com #, code fences com triplas crase, ênfase com **) é suficiente para subir de patamar imediatamente. Os LLMs foram treinados com muito Markdown (web, GitHub, documentação), por isso interpretam-no bem. Usa-o para delimitar secções da tua prompt e para pedir resultado estruturado.