A pilha de contexto manda mais do que a tua mensagem
Quem começa a usar IA generativa trata a prompt como sinónimo do que se escreve no campo de texto. No entanto, a tua mensagem é apenas um andar dos quatro que o modelo lê em cada chamada.
Prompting é a prática de escrever instruções para um modelo de linguagem, desde uma pergunta rápida no ChatGPT até uma prompt de sistema estruturada com papel, restrições e formato de saída. A qualidade da prompt determina a qualidade da resposta, porque a prompt é o único canal pela qual controlas o que um LLM gera. E o que se chama prompt na prática é maior do que parece.
Janela de contexto
- prompt de sistema instruções persistentes da interface ou do produto
- memória notas que a interface guardou e injeta sem te mostrar
- prompt de utilizador a tua mensagem (e o histórico desta conversa)
- resultados de ferramentas o que voltou de pesquisas, APIs ou servidores MCP
Os outros três andares vêm da interface ou da aplicação. O modelo lê os quatro em cada chamada, antes de gerar uma palavra.
O que entra na chamada divide-se em quatro andares.
- A prompt de sistema vem da interface ou da aplicação e raramente a vês, mas está sempre lá.
- A memória é o conjunto de notas que a interface guardou em conversas anteriores e injeta sem te mostrar.
- A prompt de utilizador é a tua mensagem, mais o histórico da conversa.
- Os resultados de ferramentas são o que voltou de ferramentas que o modelo invocou (pesquisa web, ficheiros anexados, servidores MCP).
Tudo isto compete pelo mesmo “orçamento de tokens” na janela de contexto que cobrimos no guia de funcionamento dos LLM.
O trabalho é simples de descrever e exigente de praticar: aprender a ler a pilha, decidir o que vai em cada andar e escrever o que controlas (a tua prompt de utilizador e, conforme a interface, parte da prompt de sistema) para fechar o resto.
Onde se define a prompt de sistema
Não escreves a prompt de sistema no campo de chat. Cada ferramenta dá-te várias camadas para a definir, desde a conta (afeta todas as conversas) à API (cada chamada). As camadas acumulam-se: a interface junta-as antes de o modelo ler.
Claude
ChatGPT
Gemini
Quatro registos de prompting, com controlo crescente
Quase toda a gente usa um único registo: escrever uma pergunta natural e ver o que sai. Funciona para muitas tarefas, e há outros três registos que ganham consistência à medida que pedes mais ao modelo. Saber qual usar para que tarefa é metade do trabalho.
- 1 Ad-hoc
conversa, sem estrutura explícita
"Podes resumir isto?" - 2 Zero-shot
pedido explícito com restrições, sem exemplos
"Resume em 3 pontos, máx. 50 palavras cada, tom formal." - 3 Few-shot
2 a 5 exemplos demonstrativos antes do pedido
"Eis 3 resumos no estilo certo. Aplica o mesmo estilo a este texto." - 4 Prompt de sistema
cabeçalho persistente com papel, restrições e formato
sistema: "És editor sénior. Resumes sempre em 3 pontos formais." utilizador: "Aqui está o artigo."
A progressão vai de ad-hoc a prompt de sistema por controlo crescente.
- No nível ad-hoc, escreves uma pergunta natural e aceitas a primeira resposta razoável. É barato, rápido e bom para exploração; a consistência é baixa, porque dependes da interpretação que o modelo faz da tua frase.
- No zero-shot, és explícito sobre formato, tom, restrições e comprimento, e o modelo costuma cumprir.
- No few-shot, juntas dois a cinco exemplos antes do pedido para ensinar por analogia: usa mais tokens e ganha consistência de formato.
- Na prompt de sistema, fixas o papel, as restrições e o formato num cabeçalho persistente que se aplica a todas as conversas seguintes; é o nível com mais esforço inicial e o melhor retorno em tarefas recorrentes.
Para uma pergunta única que vais fazer hoje e nunca mais, ad-hoc chega. Para um relatório semanal de vendas, vale a pena gastar 20 minutos a escrever uma prompt de sistema e nunca mais repetir as restrições.
| Nível | Quando usar | Exemplo curto | Compromisso principal |
|---|---|---|---|
| Ad-hoc | Exploração, conversa, curiosidade | ”Podes resumir isto?” | Máxima rapidez; mínimo controlo |
| Zero-shot | Tarefas pontuais com contexto claro | ”Resume o texto abaixo em 3 pontos, tom formal, máx. 50 palavras por ponto.” | Bom equilíbrio rapidez/controlo; depende da clareza da instrução |
| Few-shot | Tarefas com formato específico que convém ensinar | 3 pares (email bruto → resumo) + o email a resumir | Mais tokens usados; maior consistência de formato |
| Prompt de sistema | Tarefa recorrente, equipa, produto | Cabeçalho persistente com papel, restrições, exemplo e formato | Maior esforço inicial; melhor consistência a longo prazo |
Cinco hábitos que separam uma prompt vaga de uma útil
Se uma prompt não te está a funcionar, percorre esta lista antes de investir em soluções mais complexas. O problema está quase sempre aqui.
Sê explícito
A vagueza é o maior inimigo de respostas úteis. O modelo preenche o que não pediste com predefinições, e as predefinições raramente são o que querias. Substitui adjetivos por restrições numéricas, formatos e exemplos sempre que possível.
Mau: “Faz-me um resumo curto deste contrato.”
Bom: “Resume este contrato em 5 pontos de máximo 25 palavras cada, em português de Portugal, agrupados por tema (objeto, prazo, valor, denúncia, foro).”
Tens esta tarefa como prompt pronta a usar em Resumo de contrato.
Dá contexto suficiente
O modelo não tem como adivinhar quem vai ler o que estás a pedir, em que canal, com que tom. Diz-lhe. Três peças resolvem a maior parte dos casos: público-alvo, canal e registo. As outras (domínio, restrições legais, terminologia da casa) entram quando aplicáveis.
Mau: “Escreve uma resposta a este cliente.”
Bom: “Escreve uma resposta a este cliente para enviar por email. É um cliente B2B numa PME de logística, frustrado com um atraso de entrega. Tom: direto, sem desculpas vazias, com uma ação concreta nas primeiras duas linhas.”
A versão pronta a usar está em Resposta a cliente.
Estrutura a saída antes de pedir
Especifica o formato no fim da prompt, mesmo que tenhas estruturado o pedido em prosa. Um modelo bem instruído sobre conteúdo e mal instruído sobre formato dá-te uma resposta utilizável que precisa de ser reformatada à mão. Quase sempre é evitável.
Mau: “Diz-me se este texto está bem escrito.”
Bom: “Avalia este texto em três dimensões (clareza, tom, erros). Para cada uma, devolve uma linha no formato
dimensão: nota /5, comentário curto. Lista os erros encontrados em seguida, um por linha, no formatolinha N: descrição.”
Tens este padrão de avaliação como prompt pronta em Avaliar um texto.
Mostra com exemplos
Quando uma característica é difícil de descrever em palavras (estilo, voz, granularidade), um exemplo vale mais do que três adjetivos. Mesmo um único exemplo (one-shot) costuma melhorar muito a aderência ao estilo. Dois ou três (few-shot) cimentam.
Mau: “Escreve no nosso tom de voz.”
Bom: “Escreve no nosso tom de voz. Eis dois exemplos do que consideramos bom: [exemplo 1]; [exemplo 2]. Repara em três coisas: frases curtas, nada de superlativos, e sempre uma chamada à ação concreta no fim.”
Itera rápido
A tentação de escrever a prompt perfeita antes da primeira chamada é forte. Resiste-lhe. Dois ou três ciclos rápidos de “prompt → resposta → ajuste” produzem quase sempre um resultado melhor do que uma única hora de redação cuidada. O modelo é barato, o teu tempo de pensar é caro. Começa simples, lê a primeira resposta com olhos críticos, e ajusta o que falhou. A versão final emerge depressa.
Estas cinco posturas multiplicam o efeito de qualquer padrão técnico abaixo. Sem elas, os padrões dão resultados marginais. Com elas, a maioria das tarefas resolve-se com dois ou três padrões bem aplicados.
Padrões de prompting para usar no dia a dia
A literatura sobre prompting cresceu muito nos últimos três anos, e há listas com 60 ou 80 “técnicas”. Vinte padrões agrupados em seis categorias cobrem a maior parte das situações em trabalho real. Esta secção é o catálogo de referência: lê de fio a pavio uma vez, depois volta como dicionário quando estiveres a montar uma prompt específica.
A anatomia de uma prompt estruturada dá o esqueleto. Cada bloco aceita os padrões abaixo; clica num para ver um exemplo aplicado.
Prompt de papel fixar a especialização
"És advogado especializado em arrendamento, em Lisboa." Persona / audiência adaptar ao leitor final
"Escreve para um CTO técnico, não para um cliente leigo." Tom e registo controlar a voz
"Tom formal, sem superlativos nem pontos de exclamação." Chain-of-thought problemas multi-passo
"Pensa passo a passo antes de dares a resposta final." Step-back reformular antes de resolver
"Primeiro, diz qual é a verdadeira pergunta por trás deste pedido." Plan-then-execute tarefas longas
"Planeia os passos numa lista, depois executa um de cada vez." Crítica / auto-revisão caçar erros próprios
"Revê a tua resposta e aponta 2 falhas antes de a dares por final." Delimitadores isolar o teu texto das instruções
"Coloca o contrato entre <contrato> e </contrato>; tudo fora disso são instruções." Decomposição tarefa grande em sub-pedidos
"Divide a análise em 3 subtarefas e trata uma de cada vez." Few-shot ensinar por analogia
"Eis 3 emails e o resumo certo de cada um. Resume o quarto no mesmo estilo." One-shot quando 1 exemplo chega
"Eis um resumo no estilo que quero: [exemplo]. Faz igual para este texto." Exemplo negativo delimitar o que evitar
"Evita aberturas como 'Esperamos que este email o encontre bem'. Vai direto ao assunto." Formato de saída resultado num formato fixo
"Responde só em Markdown, com 3 pontos." Modelo de resposta fixar o esqueleto
"Usa este molde: Problema / Causa / Ação." Limite de comprimento travar a verbosidade
"No máximo 100 palavras, em 3 pontos." Schema JSON integração programática
"Responde só com JSON: {"nif": "...", "total": 0, "iva": 0}." XML tags separação clara (idiomático no Claude)
"Põe a resposta em <resposta> e a justificação em <justificacao>." Cláusula de recusa + citar travar invenção
"Se não souberes, diz 'não sei'. Nunca inventes URLs nem citações." Iteração progressiva começar curto e crescer
"Dá-me primeiro uma versão em 50 palavras; depois expande para 200." ReAct alternar raciocínio e ação (agentes)
"A cada passo, escreve o raciocínio, depois a ação (ex.: uma pesquisa), lê o resultado e só então responde." Sete anti-padrões a evitar
Sete falhas estragam prompts com frequência:
- Prompt gigante sem estrutura. Um parágrafo de 600 palavras a misturar contexto, restrições e exemplos. O modelo perde-se, e tu também. Quebra em secções com cabeçalhos (“Contexto”, “Restrições”, “Exemplos”).
- Instruções contraditórias. “Sê conciso mas detalhado”, “formal mas amigável”. Decide ou aceita que o modelo vai escolher por ti.
- “Sê criativo” sem limitação. A criatividade emerge contra restrições. Pede 5 variações com tons diferentes, três soluções com um orçamento máximo, ou uma resposta em estilo de António Lobo Antunes; pedir “criatividade” abstrata é convite a banalidade.
- Pedir a coisa errada. O resumo de um documento quando o que querias era a recomendação. A pergunta é a metade que mais influencia a resposta; reformula até estar a pedir mesmo o que precisas.
- Esquecer contexto relevante. Público, canal, restrições legais, terminologia da casa. Sem isso, o modelo gera versões médias do que viu durante o treino.
- Não pedir formato de saída. Resultado: tens de pedir o mesmo conteúdo outra vez “em pontos” ou “em tabela”, e desperdiças uma chamada.
- Few-shot com exemplos inconsistentes. Se os três exemplos têm tons diferentes, comprimentos diferentes, estruturas diferentes, o modelo aprende “qualquer coisa serve”. Os exemplos do few-shot têm de ser o mais parecidos possível entre si, exceto na parte que o modelo deve variar.
Markdown é o formato partilhado entre ti e o modelo
Os LLMs comerciais “falam” Markdown com fluência. Foram treinados em quantidades enormes de texto da web e do GitHub, onde Markdown é a língua franca. Aproveitando isso, ganhas duas coisas: prompts mais fáceis de ler para ti, e respostas mais consistentes do modelo.
O mínimo a dominar
Há muitos recursos onde aprender sobre Markdown. Deixamos aqui só os básicos:
- Cabeçalhos começam por
#,##,###(em que cada#adicional significa um nível de cabeçalho inferior). - Listas de pontos com
-ou*. - Ênfase com
**negrito**e*itálico*. - Blocos de código com triplas crase (
```) para colar texto literal. - Tabelas em barra vertical (
| coluna | coluna |). - Ligações com
[texto](url).
Com isto chega para escrever a maior parte das prompts úteis.
Porque é que os LLMs respondem bem a Markdown
Três razões:
- Treino: documentação técnica, READMEs do GitHub, artigos do Substack, posts do Medium, tudo em Markdown. O modelo viu milhões de exemplos.
- Não-ambiguidade:
## Contextoé inequivocamente um cabeçalho; “Contexto:” no meio de um parágrafo é uma frase qualquer. Para o modelo, a diferença é grande. - Economia de tokens: a sintaxe Markdown é leve em tokens, comparada com XML ou JSON envolventes.
Na tua prompt
Usa Markdown para três coisas:
- separar secções (
## Contexto,## Restrições,## Formato de saída), - enumerar restrições em pontos,
- e delimitar texto literal com blocos de código ou triplas crase. Quando colas um contrato, um email do cliente, ou um trecho que o modelo deve resumir, mete-o entre blocos de código. Reduz a probabilidade de o modelo confundir o teu input com instruções.
## Contexto
És assistente jurídico de uma firma em Lisboa, especializada em arrendamento.
## Tarefa
Resume o contrato abaixo nas cláusulas críticas (objeto, prazo, valor, denúncia, foro).
## Formato
3 a 5 pontos em Markdown, máx. 30 palavras cada. Nada antes ou depois.
## Contrato
```contrato
[cola aqui o texto do contrato]
```
Na resposta do modelo
Pedir Markdown explícito no resultado é útil para a nossa interpretação (e a do modelo, em interações subsequentes). “Responde em Markdown, com cabeçalhos de nível 2 para cada secção e pontos dentro de cada uma” produz respostas estruturadas e fáceis de copiar.
O modelo fala português do Brasil até lhe dizeres o contrário
A maior parte do conteúdo em português nos dados de treino é brasileiro. Quando escreves em português de Portugal e o modelo responde com “você”, “celular” e “tela”, está a reproduzir a distribuição do que viu mais. É estatística, e a tarefa prática é controlar a variante que queres.
Porque é que acontece
Três causas, em ordem de impacto.
- Distribuição dos dados: o Brasil tem mais utilizadores online em português do que Portugal, mais conteúdo publicado, mais código com comentários em português, mais Wikipedia em português. O modelo amostra do que viu.
- Falta de instrução explícita: sem pedido para uma variante específica, o modelo escolhe a mais provável, e a mais provável é a brasileira.
- Prompts de papel não ancoradas em variante: dizer “és um redator” não fixa nada; dizer “és um redator português de Lisboa” fixa.
Três técnicas que funcionam
Em ordem crescente de eficácia:
- Instrução de variante explícita na prompt de sistema: “Responde sempre em português de Portugal, pós-Acordo Ortográfico.” Resolve a maior parte dos casos sozinha.
- Prompt de papel ancorada em variante: “És editor de um jornal português, em Lisboa, com 10 anos de experiência.” Sobe a probabilidade da variante pretendida de forma consistente.
- Dicionário preferido com 10 a 15 termos sensíveis: “Em particular, usa: ficheiro (não arquivo), ecrã (não tela), utilizador (não usuário), telemóvel (não celular).”
Combinando as três, a aderência à variante fica robusta na maioria das chamadas.
Mesmas técnicas, outras direções
Estas três técnicas servem para qualquer variante de língua. Forçar português do Brasil para uma audiência brasileira, inglês britânico, um registo formal: o padrão é o mesmo. Instrução explícita, papel ancorado e dicionário de termos.
Bloco pronto a copiar
És [papel] para [audiência].
Responde sempre em português de Portugal, pós-Acordo Ortográfico, com diacríticos.
Em particular, usa estes termos: ficheiro (não arquivo), ecrã (não tela), utilizador (não usuário),
telemóvel (não celular), equipa (não time), fatura (não nota fiscal), morada (não endereço).
Trata o leitor por "tu" / "vós", não por "você".
Se não souberes uma palavra na variante portuguesa, escreve-a em inglês entre parênteses
e nunca inventes um termo numa variante diferente.
Cola isto no campo de prompt de sistema da tua ferramenta e a maior parte do problema fica resolvida. Tens este bloco como prompt pronta a copiar em Prompt de sistema: português de Portugal. Para adaptar um texto que já recebeste noutra variante, usa Reescrever em português europeu.
Exemplo de uma prompt de sistema completa
Junta as peças das secções anteriores numa prompt de sistema que podes colar e reutilizar. Este exemplo serve um redator de uma fintech, mas a estrutura aplica-se a qualquer tarefa recorrente.
## Papel
És redator sénior para uma fintech portuguesa B2B. Trabalhas com o diretor de marketing,
que quer mensagens claras e diretas, sem jargão financeiro além do essencial.
## Restrições
- Responde sempre em português de Portugal, pós-Acordo Ortográfico.
- Tom direto, sem superlativos nem clichês de marketing.
- Respostas até 200 palavras, salvo pedido explícito de mais.
- Se faltar contexto crítico, faz uma pergunta em vez de inventar.
- Nunca uses dados de clientes reais; usa nomes fictícios.
## Exemplo
Pergunta: "Explica em três pontos a vantagem do plano premium."
Resposta:
- Preço fixo: sabes ao cêntimo o que pagas todos os meses.
- Sem letras pequenas: cancelas com um clique, quando quiseres.
- Suporte humano em Lisboa: respondemos em menos de 4 horas em dias úteis.
## Formato
Três pontos em Markdown, máximo 30 palavras cada. Sem introdução nem fecho.
Cada secção mapeia para a anatomia da secção anterior: Papel fixa quem o modelo é, Restrições declaram o que pode e não pode fazer, Exemplo ensina por demonstração, Formato trava a verbosidade. Repara que não puseste tudo no campo de chat: este bloco vive na prompt de sistema (Custom Instructions, um Projeto, um GPT ou Gem), e a tua prompt de utilizador fica só com a pergunta do momento. Para reutilizares esta estrutura em qualquer tarefa, copia o modelo de prompt de sistema e preenche cada bloco.
Falta o quinto passo, e é o que separa uma prompt que parece boa de uma que funciona: testa antes de confiar. Define três entradas (uma fácil, uma típica, uma adversarial), gera duas respostas para cada, e compara por critérios que fixas à partida: precisão, formato, tom, comprimento. Ajusta o bloco que falhar. Três iterações resolvem quase tudo.
Para ir mais fundo (recursos em inglês)
Material em inglês, ordenado grosso modo do mais aplicado ao mais académico.
- Anthropic, Prompt Engineering Overview. Referência do vendor, organizada por técnica. Os exemplos são idiomáticos para o Claude (XML tags em particular), as ideias transferem-se.
- Google, Prompt Engineering (Google Skills). Curso interativo gratuito, bom para quem aprende melhor com exercícios.
- OpenAI, Prompt Engineering Guide. Referência do vendor orientada à API.
- Anthropic, Prompt Library. Coleção curada de prompts úteis, organizada por caso de uso.
- Lilian Weng, Prompt Engineering. Long-read excecional, com análise técnica das principais técnicas.
- dair.ai, Prompt Engineering Guide. Guia open-source abrangente, atualizado pela comunidade.
- OpenAI Cookbook, Techniques to improve reliability. Receitas práticas de engenharia, com código.
- Wei et al., Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. O paper fundador do chain-of-thought; denso, é a fonte original.
Próximos passos
A tua mensagem é um andar dos quatro. Quem domina os outros três domina a resposta, e o que está acima é a caixa de ferramentas para o fazer.