
A maioria das pessoas que usa Claude nunca foi apresentada formalmente à ferramenta. Chegou por curiosidade, tentou algumas perguntas, achou razoável e ficou. O problema é que operar uma IA sem entender o vocabulário por trás dela é como dirigir um carro sem saber o que fazem a embreagem e a relação de marchas, você chega em algum lugar, mas nunca onde deveria.
Esse glossário não é um dicionário técnico. Não é uma lista de definições copiadas da documentação da Anthropic com linguagem de engenharia. É o conjunto de termos que, uma vez entendidos com profundidade, muda a forma como você pensa antes de acionar qualquer instrução. Cada conceito aqui carrega uma camada estratégica: o que é, por que importa na prática e onde a maioria erra ao usar, ou ao ignorar completamente.
O ponto de partida obrigatório de qualquer conversa sobre IA, e talvez o mais mal interpretado. Um prompt é a instrução que você envia ao modelo, o texto que diz o que você quer, como quer, com qual contexto e dentro de qual lógica. O problema não está na palavra. Está no que as pessoas entendem por ela.
O mercado criou uma obsessão em torno de “prompts perfeitos”, como se existisse uma frase mágica que destravasse o potencial total da IA. Essa ideia é sedutora e completamente equivocada. Um prompt não é uma senha. É uma instrução, e como qualquer instrução, ela é tão boa quanto a clareza de quem a formula. Prompt vago entrega resultado vago. Prompt com direção estratégica entrega resultado com direção estratégica. A ferramenta amplifica o que você traz, e não existe prompt que compense ausência de raciocínio por trás dele.
Na prática, a maioria dos prompts falha não por falta de técnica, mas por falta de especificidade. “Escreva um post sobre branding” é uma instrução que pode gerar mil resultados diferentes, nenhum deles necessariamente útil. “Você é um estrategista de branding, analise os erros mais comuns de empresas pequenas ao construir identidade e produza um texto crítico com aplicação prática” é outra coisa. Não é magia, é clareza.
Se o prompt é o que você pede, o contexto é tudo o que você fornece antes e ao redor do pedido para que ele seja executado com precisão. É a diferença entre pedir uma análise de mercado e pedir uma análise de mercado explicando quem você é, para qual setor, com qual objetivo, para qual audiência e dentro de qual restrição de formato.
O contexto é o componente mais subestimado de toda operação com IA. Existe uma crença persistente de que prompts curtos são prompts inteligentes, que a brevidade indica domínio. Em tarefas simples, tudo bem. Em operações complexas, contexto não é excesso, é combustível. Sem ele, o modelo interpreta da forma mais provável, que geralmente é a mais genérica.
O custo de construir um prompt com contexto completo é alguns minutos. O custo de receber cinco respostas erradas consecutivas e precisar refinar do zero é uma tarde. Profissionais que entenderam isso pararam de tratar contexto como enrolação e passaram a tratá-lo como investimento operacional. E quando o contexto está bem documentado, em briefings, blocos de instrução, arquivos de referência, ele vira um ativo reutilizável, não um trabalho a ser refeito toda vez.
Um dos recursos mais poderosos e menos utilizados de forma consciente. Role prompting é a prática de definir uma função ou identidade para o modelo antes de qualquer tarefa, instruir Claude a operar como um especialista específico, dentro de uma perspectiva específica, com um conjunto de prioridades específico.
Quando você diz “você é um editor-chefe especializado em SEO e conteúdo estratégico”, não está fazendo uma instrução decorativa. Está calibrando o modelo para priorizar padrões compatíveis com aquele papel: linguagem, nível de profundidade, estrutura lógica, tipo de referências, critério de qualidade. O output muda de forma mensurável, não porque Claude “vira outra pessoa”, mas porque o ponto de partida cognitivo da resposta é outro.
O erro mais comum é usar personas genéricas. “Você é um especialista em marketing” entrega resultados de uso geral. “Você é um estrategista de posicionamento de marca com foco em mercados competitivos de serviço B2B, que prioriza diferenciação real em vez de linguagem de commodity” é outra operação. Quanto mais precisa a persona, mais preciso o resultado. A definição de função não é etapa opcional, é a primeira calibração.
Quando você precisa que o modelo entenda exatamente o que você considera bom, no seu tom, na sua estrutura, no seu nível de profundidade, descrição abstrata raramente chega lá. Few-shot é a prática de mostrar exemplos concretos dentro da instrução, em vez de apenas descrever o que você quer.
Em vez de “escreva no meu tom editorial”, você fornece um ou dois trechos que representam esse tom e diz “esse é o padrão de referência”. Claude aprende por referência de forma muito mais precisa do que por definição. A razão é simples: qualidade é difícil de descrever, mas fácil de reconhecer. Mostrar o que você considera bom elimina a margem de interpretação sobre o que “bom” significa naquele contexto.
Few-shot funciona especialmente bem para tom de voz, nível de sofisticação, estrutura de raciocínio e densidade de escrita. Se você tem textos que representam o padrão que busca, seus próprios artigos, referências do mercado, exemplos de comunicação da marca, usá-los como âncora é uma das práticas mais rentáveis que existe. O modelo não está adivinhando. Está calibrando a partir de evidência real.
Uma das mudanças de mentalidade mais importantes para quem quer operar IA com qualidade. Iteração é o processo de refinamento progressivo, tratar o primeiro resultado não como entrega final, mas como rascunho a ser ajustado, aprofundado e corrigido por meio de instruções complementares.
O mercado ainda trata a IA como aposta única: você dispara o prompt e torce para o resultado ser bom. Operadores avançados não fazem isso. Eles sabem que “mais crítico”, “menos genérico”, “mais profundo nesse ponto específico”, “refaça o segundo parágrafo com esse ângulo” são ajustes, não sinal de falha. É o processo funcionando. A primeira resposta é o ponto de partida, não o destino.
Isso muda completamente a relação com os resultados. Quando o output é fraco, a primeira pergunta não deveria ser “a IA não funciona?” — deveria ser “o que eu preciso ajustar na instrução?” E quando o output é razoável mas não é excelente, a pergunta é “o que estou pedindo para refinar?” Iteração é o processo, não o plano B. Quem trata refinamento como parte natural da operação chega a resultados substancialmente melhores do que quem espera excelência na primeira tentativa.
Quando uma tarefa é complexa o suficiente para ter múltiplas fases, tentar resolver tudo em um único comando longo e ambíguo costuma produzir resultados inconsistentes. Prompt chaining é a prática de quebrar uma operação em etapas sequenciais, onde o output de cada instrução alimenta a próxima.
Na prática: diagnóstico antes de estratégia, estrutura antes de produção, revisão crítica antes de entrega final. Cada fase tem seu próprio prompt, sua própria função, seu próprio critério de qualidade. O modelo não precisa resolver tudo de uma vez — ele resolve uma etapa com precisão, e aquela precisão vira o contexto da etapa seguinte. O resultado final costuma ser substancialmente mais consistente do que qualquer tentativa de compressão em um único comando.
Prompt chaining é especialmente valioso em tarefas editoriais complexas, planejamento estratégico, análise de posicionamento e qualquer operação que exija raciocínio progressivo em vez de geração direta. É também a base para construir sistemas em vez de pedidos avulsos, que é a diferença entre usar IA para produzir pontualmente e usar IA para escalar operações inteiras.
Um parâmetro que controla o nível de aleatoriedade e criatividade nas respostas do modelo. Temperatura baixa = respostas mais previsíveis, precisas e conservadoras. Temperatura alta = respostas mais variadas, criativas e, em alguns casos, mais arriscadas.
A maioria dos usuários de interface nunca tocou nesse parâmetro diretamente, e na maior parte dos contextos de uso cotidiano, não precisa. Mas entender o conceito muda a forma de interpretar os resultados. Quando Claude entrega algo mais convencional e seguro, parte disso é temperatura. Quando você pede “seja mais criativo” ou “quebre o padrão” em uma instrução, está essencialmente pedindo para o modelo operar com uma temperatura mais alta dentro daquele escopo.
O erro comum é não entender que temperatura alta não significa qualidade mais alta, significa variação maior. Em tarefas que exigem precisão técnica, análise de dados ou estrutura lógica rígida, temperatura baixa é o que você quer. Em tarefas criativas, brainstorming ou exploração conceitual, algum grau de variação amplia o campo de possibilidades. Saber o que a tarefa exige permite instruir o modelo de forma mais alinhada com o resultado esperado.
A camada que existe antes de qualquer conversa, um bloco de instrução que define o comportamento padrão do modelo dentro de um contexto específico. É onde você configura persona, tom de voz, restrições, formato esperado, regras editoriais e qualquer outra diretriz que deve permanecer constante ao longo de toda a operação.
Na prática de uso cotidiano no claude.ai, o system prompt funciona como briefing permanente: você não precisa repetir a cada nova mensagem que quer respostas densas, sem fragmentação, com raciocínio contínuo e sem bullet points desnecessários, isso fica definido uma vez no sistema e vale para toda a sessão ou configuração. Quem constrói fluxos de trabalho mais avançados usa o system prompt para criar contextos especializados: o Claude como editor de conteúdo com padrões específicos, o Claude como analista estratégico com critérios definidos, o Claude como revisor com um checklist fixo.
O sistema de instruções é o que separa o uso casual do uso operacional. Sem ele, você reconfigura o modelo a cada nova tarefa. Com ele, você tem um ambiente calibrado que mantém consistência independentemente de quantas interações aconteçam dentro daquele contexto.
A unidade de processamento que a IA usa para ler e gerar texto. Tokens não são equivalentes a palavras, são fragmentos de texto que podem ser partes de palavras, palavras inteiras ou pontuação. Em português, onde as palavras tendem a ser mais longas, uma frase de 100 palavras pode gerar mais de 130 tokens com facilidade.
Na maior parte do uso cotidiano, você não precisa pensar em tokens diretamente. Mas o conceito importa por uma razão prática: o modelo tem um limite de quantos tokens consegue processar de uma vez, tanto no que recebe quanto no que gera. Quando você fornece muito contexto de uma vez, pode estar comprimindo espaço que deveria ser usado para a resposta. Quando você pede uma entrega muito longa, pode estar chegando no limite de geração antes de o raciocínio ser completado com qualidade.
Entender tokens ajuda a dimensionar melhor as tarefas. Contextos densos pedem respostas mais curtas. Tarefas longas pedem divisão em etapas. Não é limitação, é gestão de recurso.
A memória ativa do modelo durante uma conversa. Tudo o que foi dito, suas instruções, as respostas do Claude, os exemplos que você forneceu, os documentos que você colou, fica dentro da janela de contexto. Quando a conversa fica longa o suficiente para extrapolar esse limite, as informações mais antigas começam a ser descartadas para dar espaço ao que é novo.
Esse é um dos pontos mais críticos para quem constrói operações com IA e ainda não entendeu que Claude não tem memória entre sessões por padrão. Quando você fecha uma conversa e abre outra, começa do zero. O histórico não persiste. O tom que você calibrou, o contexto que você forneceu, o briefing que você construiu, tudo fica na sessão anterior.
A solução prática não é rezar para o modelo lembrar. É documentar. Briefings estruturados, blocos de instrução reutilizáveis, arquivos de referência de tom de voz, checklists de qualidade, tudo isso pode ser inserido no início de qualquer nova sessão e recria o contexto em segundos. Quem trata esse tipo de documentação como ativo operacional tem uma vantagem crescente sobre quem reconstrói o contexto do zero a cada nova tarefa.
Esses dez termos não são vocabulário técnico pelo prazer de saber vocabulário técnico. Cada um deles representa uma alavanca real de operação, algo que, quando entendido com profundidade, muda uma decisão prática sobre como você estrutura uma tarefa, formula uma instrução ou interpreta um resultado.
O mercado vai continuar empurrando templates prontos, “prompts que desbloqueiam tudo” e listas de comandos mágicos. E parte disso tem valor para quem está começando. Mas existe um teto para quem opera dentro desse framework, e ele aparece cedo, no momento em que a tarefa fica complexa o suficiente para que nenhum template resolva.
Profissionais que entendem os fundamentos chegam a resultados melhores porque pensam diferente antes de acionar qualquer instrução. Eles sabem o que estão pedindo, por que estão pedindo dessa forma e o que ajustar quando o resultado não está certo. Isso não é privilégio de quem tem formação técnica. É consequência de quem parou para entender a ferramenta que está usando todos os dias.
A parte 2 do glossário cobre os termos de operação avançada: embeddings, RAG, agentic behavior, function calling e os conceitos que estão redefinindo o que é possível fazer com IA em fluxos de trabalho reais.
Receba conteúdos sobre presença digital, inteligência artificial, marketing e negócios criativos. Sem fórmulas mágicas, sem hype e sem spam.
1 e-mail por semana. Cancele quando quiser.