Resumo do SuperWhisper
O SuperWhisper é um aplicativo de ditado por IA que prioriza o uso local para Mac, Windows e iPhone. Ele transforma sua voz em texto em qualquer lugar do seu sistema, com uma camada opcional de correção por IA e um modo de reunião.
É ideal para usuários individuais que desejam um serviço de ditado rápido, privado e, em grande parte, offline, além de, ocasionalmente, gravar reuniões para suas próprias anotações. Não é indicado para equipes que precisam de transcrições compartilhadas, bibliotecas com identificação de locutores, sincronização com CRM ou qualquer tarefa que uma pessoa precise repassar para outra.
A versão básica é gratuita. A versão Pro custa US$ 8,49 por mês, US$ 84,99 por ano ou US$ 249,99 por uma licença vitalícia válida para as três plataformas.
Ele pode funcionar offline, mas apenas com dois modelos instalados no dispositivo. Todo o restante utiliza a nuvem.
Resumindo, o SuperWhisper é uma ferramenta de ditado eficiente que também permite gravar reuniões. Não se trata de um assistente completo para reuniões, e é justamente essa diferença que esta análise vem abordar.
Escrevi esta avaliação do SuperWhisper após semanas de testes, já que muitas pessoas o recomendaram. Normalmente, testo aplicativos para gravar reuniões e assistentes de IA para reuniões. O SuperWhisper possui um modo de reunião, mas a maioria das pessoas está certa: ele é, principalmente, um aplicativo de ditado.
No começo, eu estava cético. Sou digitador desde jovem, quando já conversava no MSN e programava no MySpace. Minha velocidade de digitação é de 93 palavras por minuto, então admito que tenho um certo orgulho disso. Escrevo da mesma forma que falo, então seria de se esperar que o ditado fosse ideal para mim, mas demorei um tempo para me convencer.
O que é o SuperWhisper?
O SuperWhisper é um aplicativo de ditado desenvolvido inicialmente para Mac que transforma fala em texto em qualquer lugar do seu sistema. Pode ser no Slack, no Gmail; você pode até mesmo falar com ele em um editor de código. Eu o usei para escrever no Google Docs e para me ajudar a gerar sugestões com o Claude. Basta pressionar um atalho, falar, e o texto aparece exatamente onde o cursor estiver. Ele também tem uma seção para gravar reuniões, na qual o marketing se mostra bastante ambicioso, e foi nela que concentrei grande parte dos meus testes.
Portanto, ao ler esta resenha, tenha em mente que o SuperWhisper é uma ferramenta de ditado pessoal que também pode gravar reuniões. Não se trata de uma plataforma para equipes em que o ditado seja apenas um recurso secundário.
Como funciona o SuperWhisper
O SuperWhisper não transcreve sua voz usando apenas um modelo. Ele utiliza dois, e você pode ver os dois na biblioteca de modelos.
A primeira camada é o mecanismo de síntese de voz. Essa é a parte que transforma seu som em palavras. O SuperWhisper permite que você escolha entre uma longa lista: a própria S1 Voice, o Scribe da ElevenLabs, os modelos Nova, o Deepgram, o Parakeet da NVIDIA, a família Whisper e muito mais.
A segunda camada é opcional. Trata-se de um modelo de linguagem. “Super” é a predefinição marcada como recomendada, que pega a transcrição bruta e a reescreve em um texto mais limpo. Ela remove os “ums”, corrige começos errados e aprimora a gramática. Você pode ignorá-la e manter a versão bruta, mas a limpeza está ativada por padrão.
Essa configuração padrão faz diferença. O modelo de linguagem reescreve o que você disse antes mesmo de chegar à página; para algumas pessoas, esse é justamente o grande atrativo. Tenho um cliente que acha difícil escrever e-mails, e isso permite que ele fale com fluidez e consiga um texto claro o suficiente para reler e enviar. É útil.
Mas há duas maneiras diferentes pelas quais um aplicativo de ditado pode interpretar mal o que você diz, e a segunda é mais sorrateira do que a primeira.
O primeiro é um erro do mecanismo. Ele interpreta mal uma palavra. Quando o testei pela primeira vez, ele transformou o próprio nome em algo relacionado a gaivotas. Você percebe esse tipo de erro porque parece errado.
O segundo é o modelo de “limpeza”, e ele não interpreta mal o que você diz; ele reescreve o que você diz. Ele pode pegar uma frase que você realmente disse e transformá-la em uma frase mais organizada que você não disse, porque decidiu o que você quis dizer. Eu vi isso acontecer com a entrada mais simples possível. Eu ditei “começar antes de verificar meu e-mail”, e a limpeza transformou isso em “começar sem verificar meu e-mail”. É uma mudança bem pequena, e a frase fica perfeita, mas altera completamente o significado, e nada indica isso.
Você pode voltar e ouvir a mensagem de voz original. Eu descobri isso mais tarde. Mas um recurso que tem como objetivo economizar seu tempo não é algo em que eu confiaria para verificar se a ferramenta está funcionando corretamente.
Então, se você costuma fazer isso com frequência, mude a predefinição de “Super” para “Voz para Texto” simples. Você obtém a transcrição bruta, sem reescrita. A maioria das pessoas não se dá ao trabalho, porque a configuração recomendada já faz grande parte do trabalho por elas, sem que percebam.
Qual é o nível de precisão do SuperWhisper?
A precisão do SuperWhisper depende inteiramente do que você inserir nele.
Fiz vários pequenos testes. O primeiro foi com um script bruto no modelo S1 Voice, sem nenhum processamento de limpeza, e a taxa de precisão ficou em torno de 88% em discurso técnico e complexo. Depois, testei um parágrafo simples do dia a dia, e a taxa subiu para 98%. A mesma ferramenta, o mesmo modelo, a mesma sala; a única coisa que mudou foi o nível de tecnicidade do texto.
O texto difícil foi criado para causar erros: nomes próprios, um preço, uma data, algumas expressões técnicas. O parágrafo fácil consistia apenas em frases normais sobre minhas manhãs. Quase sem erros no texto fácil, e no texto difícil ele falhou exatamente onde eu imaginava que falharia.
É nos nomes que o sistema realmente falha. Eu tinha uma personagem chamada Priya Venkatesan no roteiro e li o texto três vezes, sempre da mesma maneira. O sistema sugeriu Katasan, depois Venkatasan e, por fim, Verkatasen. Nenhum desses é o nome dela. O nome de um lugar foi identificado corretamente uma vez, mas na tentativa seguinte virou Ashland. Portanto, o nome próprio que o sistema sugere é basicamente uma questão de sorte, e ler a mesma coisa duas vezes não leva à mesma resposta.
O número era o mais perigoso. O valor da fatura no meu roteiro era de €4.217. Ele apareceu correto duas vezes, mas, na terceira vez, discretamente passou a ser €4.270. Você perceberia um nome distorcido, porque parece errado na página. Um número invertido como esse, porém, parece correto à primeira vista, e você nunca o identificaria a menos que tivesse o documento original bem ao seu lado. Esse é o tipo de erro que acaba aparecendo no e-mail enviado ao cliente.
Não são as palavras técnicas, por si só, que causam erros. Eu incluí “Kubernetes” no texto, e o resultado saiu perfeito nas três vezes. Termos comuns nos dados de treinamento funcionam bem. Nomes de pessoas raros e números específicos são o ponto fraco; esse é o padrão que observo em muitos motores de reconhecimento de fala que testo.
Há uma solução que vale a pena conhecer. O SuperWhisper possui um painel de vocabulário personalizado onde você pode adicionar nomes e termos, para que o nome de um cliente não acabe sendo escrito de três maneiras diferentes. A maioria das pessoas não se dá ao trabalho de fazer isso. É assim que você acaba tendo três formas diferentes de escrever o nome do seu próprio cliente em um único documento.
| O que eu dei de comer para ele | Resultado | Entendeu? |
|---|---|---|
| Um parágrafo simples para o dia a dia | ~98% de precisão | Quase impecável |
| Roteiro técnico complexo | ~88% de precisão | Caiu, como era de se esperar |
| “Kubernetes” (jargão) | Perfeito, todas as três foram lidas | É um termo comum, não há problema |
| “Priya Venkatesan” (nome) | 3 erros ortográficos em 3 leituras | Quando você percebe, já parece errado |
| Nome do local | Certo uma vez, errado depois | Você entende |
| €4.217 (valor da fatura) | Ficou em €4.270 na série intermediária | Não. A leitura está correta. |
Outros idiomas?
Uma breve observação sobre idiomas, já que testo a transcrição em vários deles. O SuperWhisper lista mais de 100, então testei meu francês, italiano, espanhol, japonês e alemão — todos com sotaque bem ruim — no programa.
O francês e o italiano se saíram bem, o espanhol ficou aceitável, e o japonês foi exibido em romaji em vez da escrita correta. Considere isso como um teste preliminar, não como uma referência, já que li esses textos como falante não nativo. É em coisas como essa que “suportar um idioma” e “ser bom nisso” se diferenciam. É para isso que servem nosso teste de transcrição em alemão e o próximo teste de transcrição em japonês.
O Superwhisper funciona sem conexão com a internet?
O Superwhisper se apresenta como uma plataforma que prioriza o âmbito local e é privada. Isso se confirma, mas somente se você escolher o modelo certo. Abra a biblioteca de modelos e observe a coluna “offline” (veja a imagem abaixo).
Os motores que você escolheria em primeiro lugar — o Scribe, os modelos Nova, as opções Gemini GPT — funcionam todos na nuvem, o que significa que seu áudio sai do seu computador.
Apenas três modelos têm um tamanho de download e são executados no próprio dispositivo: Parakeet (476 MB, apenas em inglês), Parakeet Multilinguistic (494 MB) e Mistral 7B (4,37 GB para a camada de limpeza).
Portanto, o uso offline de verdade segue uma única fórmula: o Parakeet para a transcrição, o Mistral para o refinamento, e nada sai do aparelho. Se você escolher qualquer outra opção, seu áudio vai parar no servidor de alguém.
Eu testei, no modo avião, com a conexão totalmente desativada, e o Parakeet funcionou perfeitamente. Portanto, a promessa de funcionamento offline é real; só que é mais limitada do que o marketing sugere, e funciona melhor em um Mac com Apple Silicon.
Preços do SuperWhisper em 2026
O SuperWhisper é gratuito no início e, depois, oferece a opção de uma assinatura ou de uma licença vitalícia única.
A versão gratuita é realmente útil para se ter uma ideia geral. Reconhecimento de voz para texto, o aplicativo, gravações de reuniões e mais de 100 idiomas. O problema é que ela limita o usuário aos modelos menores, por isso não é suficiente para avaliar a ferramenta de forma justa.
- A versão Pro custa US$ 8,49 por mês, US$ 84,99 por ano ou US$ 249,99 por uma licença vitalícia ( mais impostos locais).
- Uma licença vale para Mac, Windows e iPhone.
- Os estudantes têm 40% de desconto, e há uma garantia de reembolso de 30 dias em todos os planos.
- O plano Enterprise tem preço personalizado (a certificação SOC 2 Tipo II está disponível apenas no plano Enterprise).
O preço divide as pessoas, e os dois lados têm razão.
Alguns contestam veementemente o valor total ao longo da vida útil do produto, já que o custo inicial é maior do que o de dois anos de um concorrente. Outros fazem o cálculo inverso: que um pagamento único, que você ainda estará usando daqui a três anos, supera qualquer plano mensal.
A sua opinião depende inteiramente de você. Os usuários diários tendem a defendê-la, enquanto os usuários ocasionais tendem a recusá-la.
Acabei assinando o plano Pro mensal, o que não fazia parte do meu plano original. Eu tinha testado bastante o recurso de ditado, mas não tinha usado a seção de reuniões, e acabei esgotando os minutos do plano gratuito. Tentei sair do aplicativo para desktop para reiniciar, mas não consegui. Então, por causa desses US$ 10, resolvi me arriscar.
O SuperWhisper é privado?
A privacidade é o verdadeiro foco do SuperWhisper, e isso nos leva novamente ao modelo de duas camadas.
No modo local, com o Parakeet responsável pela transcrição e um modelo local fazendo o refinamento, o áudio nunca sai do seu computador. Sem servidor, nada é armazenado em nenhum lugar fora do seu próprio disco. Isso representa o máximo de privacidade possível na conversão de voz em texto, e é um motivo real para as pessoas continuarem usando o serviço. Se você lida com números ou informações confidenciais, do tipo que se enquadram no GDPR ou na CCPA.
As gravações ficam na pasta “SuperWhisper”, na pasta “Documentos”, e você pode alterar o local. Apagá-las é um trabalho manual e, em um computador com pouca capacidade, isso pode ocupar rapidamente o espaço em disco.
Mais uma coisa que o aplicativo faz e que vale a pena destacar. Ele basicamente consegue gravar chamadas, mas não há nenhum aviso de consentimento, nenhum banner e nenhum bot se identificando. Dependendo de onde você e os outros participantes estejam, pode ser exigido por lei que você os avise antes de iniciar a gravação. Já escrevi separadamente sobre os aspectos legais dos gravadores de reuniões, e há processos judiciais em andamento no momento.
O SuperWhisper grava reuniões?
O SuperWhisper possui um modo de reunião. Ele grava a ligação, transcreve-a e, em seguida, elabora um resumo para você.
Fiz um teste para ver como funcionava. Inseri 10 minutos de uma sessão do conselho municipal de Salt Lake City sobre o orçamento, uma reunião com vários oradores, que começou com a abertura do presidente e a apresentação do diretor executivo do conselho. Comparei o resultado com a transcrição real da reunião.
O resumo ficou bom. O modo “Reunião” fornece um resumo como resultado, e não a transcrição completa; no entanto, a transcrição bruta e uma versão segmentada estão disponíveis se você procurar no histórico. Ele também grava o áudio, então você pode reproduzir a gravação quando quiser.
O resumo mencionou um aumento do imposto sobre a propriedade, cortes correspondentes e um lembrete para analisar o orçamento da CRA na terça-feira. Todas as informações estavam corretas e condiziam com o que foi discutido na reunião.
A transcrição no histórico também estava correta. Ela registrou nomes, siglas e até mesmo um número de telefone. Mas não indicava, em nenhuma das três visualizações, quem disse o quê. Não havia indicação de quem falava, nem identificação dos interlocutores. Devido à forma como grava, é assim que o sistema sempre funcionará.
Se você estiver sozinho, tudo bem. Mas, no momento em que uma segunda pessoa precisar de alguma coisa, a atribuição vai por água abaixo. Não há biblioteca compartilhada para pesquisar entre chamadas, não há como enviar uma transcrição a um colega, não há notificação no CRM, não há clip no Slack, nem bot que participe da chamada. O programa grava o áudio no computador em que está instalado, e o arquivo fica lá, a menos que você o mova manualmente.
Então, como gravador de reuniões, ele grava a reunião e faz um bom resumo, mas simplesmente não é tão útil quanto outras ferramentas.
SuperWhisper x tl;dv
A verdade é que o SuperWhisper e tl;dv , na real, concorrentes, pois foram criados para públicos diferentes, que realizam tarefas distintas e têm necessidades diferentes. O SuperWhisper foi projetado para uma única pessoa e seu laptop. Ele faz a transcrição, registra notas particulares e mantém o áudio armazenado localmente. Sim, ele pode gravar reuniões, mas isso parece mais um recurso adicional acrescentado às pressas para entrar em outro mercado.
tl;dv desenvolvido para facilitar o repasse. O momento da gravação se transforma em algo que outras pessoas podem utilizar: uma biblioteca compartilhada, transcrições atribuídas a cada interlocutor, pesquisa em todas as chamadas, trechos que você pode enviar a um colega, um envio direto para o seu CRM. Todos esses são recursos documentados. O SuperWhisper não oferece nada disso.
Portanto, escolher entre os dois provavelmente não é a pergunta certa. Se a gravação for apenas você falando sozinho, o SuperWhisper é mais do que suficiente. Se a gravação precisar ser localizável, compartilhável, enviada para suas outras ferramentas e fazer parte do histórico de reuniões da sua empresa, é aí que tl;dv cena.
| O emprego | Melhor ajuste | Por que |
|---|---|---|
| Ditar um rascunho ou um e-mail | SuperWhisper | Ditado local rápido com uma etapa de revisão |
| Notas particulares que nunca saem do seu Mac | SuperWhisper | O áudio no modo local permanece no seu disco |
| Um relato individual de uma reunião | SuperWhisper | Registra e resume bem, considerando que é feito por uma única pessoa |
| Uma transcrição que um colega possa usar | tl;dv | Atribuído ao palestrante, compartilhável, pesquisável |
| Chamadas encaminhadas para o seu CRM ou Slack | tl;dv | Integrações documentadas e um bot que se conecta |
| A memória compartilhada das reuniões de uma equipe | tl;dv | Biblioteca pesquisável em todas as classes de classificação |
Conclusão. Sim, ele tem um modo de reunião, mas eu não o recomendaria para reuniões.
No entanto, ele conquistou um lugar na minha pilha de ferramentas, seja para discutir um rascunho ou simplesmente para colocar no papel o que está na minha cabeça. O fato de eu poder ditar para ele, pedir que ele organize o texto e obter a transcrição bruta no modo “uma pessoa” é mais útil do que eu esperava e algo que eu havia subestimado antes.
SuperWhisper x Wispr Flow, MacWhisper
A comparação que a maioria das pessoas realmente procura não é com uma ferramenta de reuniões. É com coisas como o Wispr Flow.
O Wispr Flow é bem parecido. Um conhecido meu que usa o programa o opera praticamente da mesma forma que eu faria e já enfrentou algumas falhas de desempenho com ele. Isso se encaixa no panorama geral, e a avaliação recorrente no Reddit é consistente: o Flow é elogiado pela velocidade, facilidade de uso e uma experiência mais fluida logo de cara, especialmente no desktop.
O SuperWhisper é bem recebido tanto por quem se preocupa com a privacidade quanto por quem se preocupa com os custos, graças ao processamento local e ao preço vitalício. Nenhum dos dois grupos é unânime, e ambas as ferramentas recebem reclamações sobre confiabilidade e configuração, mas essa é a divisão.
O MacWhisper é uma ferramenta totalmente diferente. Ele transcreve arquivos de áudio e vídeo em lotes com separação de falantes, algo que o modo de reunião do SuperWhisper não faz. Portanto, se eu fosse processar gravações, optaria pelo MacWhisper. Para ditado ao vivo, o SuperWhisper.
| Ferramenta | Melhor em | Eu o pegaria quando |
|---|---|---|
| SuperWhisper | Ditado ao vivo, privado e local no Mac | Estou falando de enviar mensagens diretamente para aplicativos e quero que elas fiquem armazenadas no meu próprio computador |
| Wispr Flow | Velocidade e acabamento (segundo relatos dos usuários) | Quero uma experiência de ditado mais fluida e não me importo tanto com a privacidade restrita ao ambiente local |
| MacWhisper | Transcrição de arquivos em lote com separação de falantes | Estou processando arquivos de áudio ou vídeo já existentes, não estou ditando ao vivo |
Onde o SuperWhisper deixa a desejar
O principal ponto fraco do SuperWhisper é o tratamento que dá aos nomes próprios.
Nos meus testes, ele distorceu um nome, gerando três grafias diferentes em três leituras. Ele transcreveu seu próprio nome como “Seagull Whisper”. Gaivotas não sussurram. Se você ditar muitos nomes, terá que treinar o painel de vocabulário ou corrigi-los manualmente.
O segundo problema é a falta de identificação dos palestrantes nas reuniões.
O restante é menor. Por padrão, a gravação funciona no modo “manter pressionado para gravar”, o que é incômodo para gravações mais longas até você encontrar a opção “mãos livres”. (Dica: escolha uma tecla de atalho que você não use com frequência!)
O modelo Parakeet travou uma vez, no meio da gravação, simplesmente parou de funcionar e precisei reiniciá-lo. Isso coincide com o que os usuários relatam: ele é um pouco instável. Outra coisa é que a precisão oscila mais em áudios longos e confusos, então eu levaria isso em conta antes de confiar nele para qualquer coisa que realmente importe.
Eu não diria que nenhum desses pontos seja um impedimento para o uso individual. Mas todos eles são motivos para você testá-lo com seu próprio trabalho antes de confiar nele. E se o que você realmente precisa é de uma ferramenta para reuniões, opte por uma ferramenta específica para isso, em vez de um aplicativo de ditado que decidiu incluir um modo de reunião.
Vale a pena comprar o SuperWhisper em 2026?
Para a pessoa certa, sim. A pessoa certa talvez seja eu, o que eu não esperava.
Comecei a usar essa ferramenta como um digitador experiente. As pessoas sempre comentam sobre a minha velocidade ao digitar; é um dos meus truques de festa, e o teste de digitação oculto da ferramenta registrou 93 palavras por minuto, o que é rápido. Ele também registrou minha velocidade de ditado em 111. Portanto, mesmo para alguém rápido no teclado, há uma diferença de velocidade. Mas não foi a velocidade que me fez mudar de ideia.
O motivo são as minhas mãos. Escritores sofrem de lesões por esforço repetitivo (LER) e, com tudo o que escrevo, digito muito. Às vezes, meu cérebro quer seguir em frente, mas minhas mãos não concordam. Se o ditado aliviar um pouco dessa carga, mesmo que não seja todos os dias, já vale a pena. Eu faria isso usando a conversão direta de voz para texto e corrigiria à medida que edito, em vez de confiar na versão já polida.
Então, eis o teste sincero ao qual o submeti. Tentei escrever toda essa resenha por ditado. Não as frases bem elaboradas que vocês veem aqui; essas acabei digitando, por causa das minhas dúvidas quanto à confiabilidade da etapa de revisão que tenho agora. Mas o rascunho bruto, falado em voz alta — a parte em que vou definindo o que realmente penso —, esse eu falei.
E a gravação ao vivo deu errado. Vinte e cinco minutos de mim falando, e o SuperWhisper exibiu a mensagem: “Nenhuma voz encontrada na gravação”. Exatamente a falha em áudios longos sobre a qual eu tinha acabado de escrever, acontecendo comigo, justamente na matéria sobre o assunto. Consegui, no entanto, vasculhar os arquivos de origem e extrair o que eu havia trabalhado, então, embora a interface tenha falhado de certa forma, não foi um caso perdido.
Então, não, isso não vai substituir totalmente a digitação. Ainda não, pelo menos não para um artigo inteiro. Mas talvez eu nem precise disso. Talvez eu use essa função para rascunhos e para pensar em voz alta, e continue digitando o resto.
Vim para discutir com o programa. Ele perdeu a gravação e, mesmo assim, me convenceu a fazer uma assinatura.
Ah, e se você precisar de algo para transcrever uma reunião, eu sempre usaria tl;dv !
Perguntas frequentes sobre o SuperWhisper
O SuperWhisper usa seu áudio para treinar a IA?
Não, não de acordo com a política declarada. Ela afirma que seus dados não são usados para treinar modelos de IA e, no modo local, a questão nem se coloca, já que nada sai do seu computador. Vale a pena saber que a política estabelece isso de maneira geral e não especifica separadamente como o modo nuvem é tratado.
É possível desativar a reescrita por IA no SuperWhisper?
Sim. Acesse as configurações e altere a predefinição de “Super” para “Voz para Texto” simples. Você receberá a transcrição bruta, sem qualquer correção.
O SuperWhisper identifica quem disse o quê nas reuniões?
Não. Nos meus testes, o sistema transcreveu uma reunião com dois participantes sem identificar os interlocutores em nenhuma das três visualizações.
O SuperWhisper funciona no Windows e no iPhone?
Sim. Uma licença cobre Mac, Windows e iPhone. Não há versão para Android, e não há planos para lançá-la até 2026.
O plano vitalício do SuperWhisper é realmente um pagamento único?
Sim. Trata-se de um pagamento único de US$ 249,99 que abrange Mac, Windows e iPhone, e o fornecedor informa que ele inclui atualizações futuras ilimitadas.
SuperWhisper x Dictation da Apple: qual é o melhor?
O SuperWhisper se destaca em precisão, vocabulário personalizado e na função de correção. O Dictation da Apple é gratuito e serve para um uso ocasional.



