tl;dr О SuperWhisper

SuperWhisper — это приложение для диктовки с искусственным интеллектом, ориентированное на локальное использование, для Mac, Windows и iPhone. Оно преобразует ваш голос в текст в любой части системы, а также предлагает дополнительный уровень очистки с помощью ИИ и режим проведения встреч.

Это решение лучше всего подходит для индивидуальных пользователей, которым нужна быстрая, конфиденциальная и в основном автономная диктовка, а также возможность время от времени записывать встречи для личных заметок. Оно не подходит для команд, которым требуются общие стенограммы, библиотеки с пометками о говорящих, синхронизация с CRM или любые другие функции, связанные с передачей данных от одного человека другому.

Базовая версия бесплатна. Версия Pro стоит 8,49 доллара в месяц, 84,99 доллара в год или 249,99 доллара за пожизненную лицензию, действующую на всех трех платформах.

Он может работать в автономном режиме, но только с двумя моделями, установленными на устройстве. Во всех остальных случаях используется облако.

Одним словом, SuperWhisper — это мощный инструмент для диктовки, который также может записывать встречи. Это не полноценный помощник для проведения встреч, и именно этому различию посвящен данный обзор.

Я написал этот обзор SuperWhisper после нескольких недель тестирования, так как многие люди его рекомендовали. Обычно я тестирую приложения для записи встреч и ИИ-помощников для встреч. В SuperWhisper действительно есть режим «Встреча», но большинство людей правы: в основном это приложение для диктовки.

Сначала я относилась к этому скептически. Я печатаю с юных лет — общалась в MSN и писала код на MySpace. Моя скорость набора составляет 93 слова в минуту, и, признаюсь, я этим немного горжусь. Я пишу так же, как говорю, поэтому можно было бы подумать, что диктовка мне подойдет, но мне потребовалось некоторое время, чтобы убедиться в этом.

Оглавление

Что такое SuperWhisper?

SuperWhisper — это приложение для диктовки, разработанное в первую очередь для Mac, которое преобразует речь в текст в любой части вашей системы. Это может быть как Slack, так и Gmail; вы даже можете говорить с ним прямо в редакторе кода. Я использовал его для написания текстов в Google Docs и в качестве подсказки при работе с Claude. Нажимаете сочетание клавиш, говорите — и текст появляется там, где находится курсор. В приложении также есть раздел для записи встреч, в рекламе которого разработчики довольно амбициозно позиционируют эту функцию, и именно на ней я провел большую часть тестирования.

Поэтому, читая этот обзор, имейте в виду, что SuperWhisper — это инструмент для личного диктовки, который также может записывать встречи. Это не командная платформа, в которой функция диктовки является лишь дополнительной.

Как работает SuperWhisper

SuperWhisper не использует для транскрибирования вашего голоса одну модель. Он запускает две модели, и вы можете увидеть обе в библиотеке моделей.

Первый уровень — это движок речи. Это та часть, которая преобразует ваш голос в слова. SuperWhisper позволяет выбирать из обширного списка: собственный голос S1, Scribe от ElevenLabs, модели Nova, Deepgram, Parakeet от NVIDIA, семейство Whisper и многое другое.

Второй уровень является необязательным. Это языковая модель. «Super» — это предустановка, помеченная как «рекомендуемая», которая принимает исходную стенограмму и преобразует её в более чистый текст. Она удаляет «э-э», исправляет неудачные начала предложений и приводит грамматику в порядок. Вы можете пропустить этот этап и оставить исходную версию, но по умолчанию функция очистки включена.

Это поведение по умолчанию имеет значение. Языковая модель переформулирует то, что вы сказали, ещё до того, как текст попадает на страницу; для некоторых людей именно в этом и заключается вся привлекательность. У меня есть клиент, которому трудно писать электронные письма, и эта функция позволяет ему говорить свободно и получать текст, достаточно четкий, чтобы его можно было перечитать и отправить. Очень полезно.

Однако существует два разных способа, которыми приложение для диктовки может неправильно распознать ваши слова, и второй из них более коварный, чем первый.

Первая — это ошибка движка. Он неправильно распознает слово. Когда я впервые тестировал его, он превратил своё собственное название в что-то про чаек. Такие ошибки сразу бросаются в глаза, потому что выглядят нелепо.

Второй вариант — это модель «очистки», и она не просто неправильно вас понимает; она переписывает ваши слова. Она может взять предложение, которое вы действительно сказали, и превратить его в более «аккуратное» предложение, которого вы не произносили, потому что сама решила, что вы имели в виду. Я наблюдал, как это происходило на самом простом из возможных примеров. Я продиктовал: «Начни, прежде чем я проверю почту», а функция очистки преобразовала это в «Начни, не проверяя почту». Разница совсем небольшая, и фраза читается отлично, но смысл полностью меняется, и ничто не сигнализирует об этом.

Вы можете вернуться и прослушать исходную голосовую запись. Я узнал об этом позже. Но на функцию, призванную сэкономить ваше время, я бы не стал полагаться, чтобы перепроверить работу самого инструмента.

Так что, если вы часто этим занимаетесь, переключите предустановку с «Super» на обычный режим «Voice to Text». Вы получите исходную стенограмму без каких-либо правок. Большинство людей не станут этим заниматься, поскольку рекомендуемая настройка сама выполняет за них большую часть работы.

Насколько точен SuperWhisper?

Точность SuperWhisper полностью зависит от того, какими данными вы его снабжаете.

Я провёл несколько небольших тестов. Первый — это тест с исходным скриптом на модели S1 Voice без какой-либо очистки данных, и показатель составил около 88 % при обработке сложной технической речи. Затем я протестировал обычный повседневный абзац, и показатель подскочил до 98 %. Тот же инструмент, та же модель, та же комната — изменилось только то, насколько техническим был текст.

«Сложный» текст был специально составлен так, чтобы система дала сбой: собственные имена, цена, дата, некоторые жаргонные выражения. «Легкий» абзац состоял из обычных предложений о моих утрах. С «легким» текстом система справилась практически безупречно, а в «сложном» тексте она дала сбой именно там, где я и предполагал.

Самая большая проблема — это имена. В сценарии у меня была персонаж по имени Прия Венкатесан, и я прочитал это три раза, каждый раз одинаково. Сначала получилось «Катасан», потом «Венкатасан», а затем «Веркатасен». Ни одно из этих имен не является её именем. Название одного места сначала было распознано правильно, а при следующем прохождении превратилось в «Эшленд». Так что то, какое собственное имя будет распознано, зависит в основном от удачи, и даже при повторном прочтении одного и того же текста результат может отличаться.

Проблема была именно в цифре. В моем сценарии сумма в счете составляла 4 217 евро. Два раза она была указана верно, а затем, в середине текста, незаметно превратилась в 4 270 евро. Искаженное имя вы бы заметили, потому что на странице оно выглядит неправильно. А вот такая перестановка цифр читается совершенно естественно, и вы бы никогда её не заметили, если бы исходный текст не лежал прямо у вас под рукой. Именно такие ошибки в конечном итоге попадают в письма клиентам.

Дело не в самих технических терминах. Я вводил слово «Kubernetes», и все три раза оно распознавалось идеально. Обычные термины из обучающего набора данных не вызывают проблем. Слабым местом являются редкие имена людей и конкретные цифры — такую закономерность я наблюдаю во многих системах распознавания речи, которые тестирую.

Есть один способ решения проблемы, о котором стоит знать. В SuperWhisper есть панель настраиваемого словаря, куда можно добавлять имена и термины, чтобы имя клиента не превращалось в три разных варианта. Большинство людей не будут этим заниматься. Вот так и получается, что в одном документе появляются три разных варианта написания имени вашего собственного клиента.

Чем я его кормилРезультатПоняли?
Простой абзац на каждый деньточность ~98 %Практически безупречный
Сложный технический сценарийточность ~88 %Упал, как и ожидалось
«Kubernetes» (жаргон)Отлично, все 3 прочитанОбычное выражение, никаких проблем
«Прия Венкатесан» (имя)3 орфографические ошибки за 3 прочтенияЕсли ты это заметишь, то поймешь, что что-то не так
Географическое названиеСначала правильно, потом неправильноТы это поймаешь
4 217 евро (сумма по счету-фактуре)В среднем за пробег получилось 4 270 евроНет. Все в порядке.

Есть другие языки?

Небольшое замечание по поводу языков, поскольку я тестирую транскрипцию на нескольких из них. В SuperWhisper перечислено более 100 языков, поэтому я проверил с его помощью свои записи на французском, итальянском, испанском, японском и немецком языках с сильным акцентом.

Французский и итальянский языки прошли нормально, испанский — тоже, а японский вышел в ромадзи, а не в надлежащем написании. Рассматривайте это как пробный тест, а не как эталон, поскольку я читал их как человек, для которого эти языки не являются родными. Именно в таких случаях понятия «поддерживает язык» и «хорошо с ним справляется» начинают расходиться. Именно для этого и нужны наш тест по транскрипции немецкого языка и предстоящий тест по транскрипции японского.

Работает ли Superwhisper в автономном режиме?

Superwhisper позиционирует себя как сервис, ориентированный на локальный рынок и обеспечивающий конфиденциальность. Это действительно так, но только если выбрать подходящую модель. Откройте библиотеку моделей и обратите внимание на столбец «Офлайн» (см. изображение ниже).

Движки, к которым вы, скорее всего, обратитесь в первую очередь — Scribe, модели Nova, а также варианты Gemini GPT — все они работают в облаке, а это значит, что аудиопоток покидает ваш компьютер.

Только три модели имеют размер файла для скачивания и запускаются на устройстве: Parakeet (476 МБ, только на английском языке), Parakeet Multilanguage (494 МБ) и Mistral 7B (4,37 ГБ для очищенного слоя).

Офлайн-облачная колонка SuperWhisper
Модели и доступность в автономном режиме

Таким образом, для реального использования в автономном режиме есть один вариант: Parakeet для транскрипции, Mistral для очистки данных — и никакая информация не покидает устройство. Выберите что-либо другое — и ваши аудиозаписи окажутся на чьем-то сервере. 

Я проверил это в режиме «в самолете», когда подключение было полностью отключено, и Parakeet работал без проблем. Таким образом, обещание об автономной работе действительно выполняется; просто его возможности оказались более ограниченными, чем предполагает реклама, и наиболее стабильно приложение работает на Mac с процессором Apple Silicon.

Цены на SuperWhisper в 2026 году

SuperWhisper можно начать использовать бесплатно, а затем выбрать между подпиской и одноразовой пожизненной лицензией.

Бесплатный тариф действительно позволяет составить первое впечатление: преобразование речи в текст, мобильное приложение, записи встреч и поддержка более 100 языков. Но есть один нюанс: доступны только модели меньшего размера, поэтому этого недостаточно, чтобы объективно оценить инструмент. 

  • Тариф «Pro» стоит 8,49 доллара в месяц, 84,99 доллара в год или 249,99 доллара за пожизненную лицензию ( плюс местные налоги).
  • Одна лицензия действует на Mac, Windows и iPhone.
  • Студентам предоставляется скидка 40 %, а на каждый тарифный план распространяется 30-дневная гарантия возврата средств.
  • Для тарифного плана «Enterprise» цена устанавливается индивидуально (сертификация SOC 2 Type II указана только в рамках тарифного плана «Enterprise»).
Стоимость услуги SuperWhisper: единовременный платеж

Цена вызывает разногласия, и обе стороны правы.

Некоторые резко критикуют стоимость за весь срок службы, поскольку первоначальные затраты на неё превышают стоимость двухлетнего абонемента у конкурента. Другие приводят противоположные расчёты: одноразовый взнос, который вы всё ещё будете использовать через три года, выгоднее любого ежемесячного тарифа.

То, к какому мнению вы придете, зависит исключительно от вас. Постоянные пользователи, как правило, его поддерживают, а те, кто пользуется им время от времени, — скорее скептически относятся к нему.

В итоге я перешел на тарифный план «Pro monthly», хотя изначально этого не планировал. Я тщательно протестировал функцию диктовки, но к разделу «Встречи» так и не прикоснулся, и у меня закончились минуты в бесплатной версии. Я попытался выйти из настольного приложения, чтобы сбросить счетчик, но у меня не получилось. Поэтому ради 10 долларов я решился на этот шаг.

Является ли SuperWhisper конфиденциальным?

Конфиденциальность — это главный приоритет SuperWhisper, и здесь снова речь заходит о двухуровневой модели.

В локальном режиме, когда Parakeet занимается транскрипцией, а локальная модель — очисткой данных, аудиозапись никогда не покидает ваш компьютер. Никаких серверов, никаких данных не сохраняется нигде за пределами вашего диска. Это максимально возможный уровень конфиденциальности при преобразовании речи в текст, и именно это является реальной причиной, по которой люди продолжают пользоваться сервисом. Если вы работаете с цифрами или конфиденциальной информацией, подпадающей под действие GDPR или CCPA.

Записи хранятся в папке «SuperWhisper» в папке «Документы», и вы можете изменить место их хранения. Их удаление требует ручной работы, и на маломощном компьютере они могут быстро занять много места на диске.

Еще одна особенность приложения, на которую стоит обратить внимание. Оно фактически может записывать звонки, но при этом не отображается ни запрос на согласие, ни баннер, ни сообщение от бота, предупреждающее о записи. В зависимости от того, где находитесь вы и другие участники, по закону вы можете быть обязаны предупредить их перед началом записи. Я уже писал отдельно о правовых аспектах использования программ для записи встреч, и в настоящее время в судах рассматриваются соответствующие дела.

Записывает ли SuperWhisper встречи?

В SuperWhisper есть режим «Встреча». Он записывает разговор, транскрибирует его и затем составляет для вас краткое резюме. 

Режим встречи

Я провёл тест, чтобы проверить, как это работает. Я загрузил в систему 10 минут записи заседания городского совета Солт-Лейк-Сити, посвящённого обсуждению бюджета — это было заседание с участием нескольких докладчиков, которое началось с вступительного слова председателя и выступления исполнительного директора совета. Я сравнил полученный результат с фактической стенограммой заседания.

Краткое изложение получилось хорошим. Режим «Встреча» выдает в качестве результата именно краткое изложение, а не полную стенограмму, хотя исходная стенограмма и сегментированная версия доступны, если покопаться в истории. Кроме того, в этом режиме ведётся запись звука, так что у вас есть возможность воспроизвести запись.

В сводке были отмечены повышение налога на недвижимость, соответствующие сокращения расходов, а также напоминание о необходимости рассмотрения бюджета CRA во вторник. Все утверждения соответствовали действительности и полностью отражали ход заседания. 

Краткий отчет о встрече «Superwhisper»

Транскрипция в истории событий также была точной. В ней были зафиксированы имена, аббревиатуры и даже номер телефона. Однако ни в одном из трёх режимов просмотра не было указано, кто что сказал. Никаких пометок о говорящем, никакой идентификации говорящего. Из-за особенностей записи система всегда будет вести себя именно так.

Если вы работаете в одиночку, это не проблема. Но как только второму человеку что-то понадобится, система теряет свою эффективность. Нет общей библиотеки, в которой можно было бы искать записи звонков, нет возможности передать коллеге стенограмму, нет уведомлений в CRM, нет clip в Slack, нет бота, который подключается к звонку. Программа записывает аудио на том компьютере, на котором она установлена, и запись остается там, пока вы не перенесете её вручную.

Так что в качестве средства записи встреч оно довольно хорошо записывает ход встречи и составляет по ней краткий отчет, но просто не так полезно, как другие инструменты. 

SuperWhisper против tl;dv

Дело в том, что SuperWhisper и tl;dv на самом деле tl;dv , поскольку они созданы для разных людей, выполняющих разные задачи и имеющих разные требования. SuperWhisper разработан для одного человека и его ноутбука. Он диктует, ведет личные заметки и хранит аудиозаписи локально. Да, он может записывать встречи, но эта функция выглядит как наспех добавленная, чтобы завоевать другой рынок.

tl;dv для передачи информации. Запись превращается в ресурс, которым могут воспользоваться другие: общая библиотека, стенограммы с указанием говорящего, поиск по всем звонкам, фрагменты, которые можно отправить коллеге, автоматическая синхронизация с вашей CRM. Все эти функции официально задокументированы. SuperWhisper этого не делает.

Поэтому, вероятно, вопрос о том, что из них выбрать, поставлен неверно. Если запись нужна только для того, чтобы вы могли поговорить сами с собой, то SuperWhisper вполне подойдет. Если же запись должна быть доступна для поиска, делиться с другими, интегрироваться в ваши другие инструменты и становиться частью архива встреч вашей компании, то именно в этом случае tl;dv свою полезность.

ВакансияОптимальный вариантПочему
Диктовка черновика или электронного письмаSuperWhisperБыстрая локальная диктовка с этапом очистки
Личные заметки, которые никогда не покидают ваш MacSuperWhisperАудиозаписи в локальном режиме сохраняются на вашем диске
Отчет об одной встречеSuperWhisperХорошо ведет учет и составляет сводки, учитывая, что это делает один человек
Стенограмма, которую может использовать коллегаtl;dvС указанием автора, доступны для публикации, доступны для поиска
Звонки, перенаправленные в вашу CRM или Slacktl;dvДокументированные интеграции и бот, который присоединяется
Общие воспоминания команды о встречеtl;dvПоиск по библиотеке по всем разделам

Итог. Да, в нем есть режим «совещание», но я бы не рекомендовал использовать его для проведения совещаний.

Тем не менее, это приложение заслужило место в моей коллекции приложений, поскольку позволяет мне обсуждать черновой вариант текста или просто изложить то, что у меня на уме. Возможность диктовать текст, просить приложение его отредактировать и получать исходную стенограмму в режиме «один пользователь» оказалась более полезной, чем я ожидал, и я раньше упускал это из виду.

SuperWhisper против Wispr Flow, MacWhisper

На самом деле большинство людей ищут не сравнение с инструментом для проведения встреч, а сравнение с такими сервисами, как Wispr Flow.

Wispr Flow очень похож на него. Один мой знакомый, который им пользуется, использует его примерно так же, как и я, и тоже сталкивался с некоторыми перебоями в работе. Это вписывается в общую картину, и повторяющиеся отзывы на Reddit подтверждают эту тенденцию: Flow заслуживает похвалы за скорость, простоту и более плавную работу «из коробки», особенно на настольных компьютерах.

SuperWhisper пользуется популярностью как у тех, кто заботится о конфиденциальности, так и у тех, кто ориентируется на стоимость, благодаря локальной обработке данных и пожизненной подписке. Ни в одной из этих групп мнения не единодушны, и оба инструмента подвергаются критике за надежность и сложность настройки, но именно в этом и заключается различие.

MacWhisper — это совсем другое дело. Он выполняет пакетную транскрипцию аудио- и видеофайлов с разделением речи по говорящим, чего не делает режим «Встреча» в SuperWhisper. Поэтому, если бы мне нужно было обрабатывать записи, я бы выбрал MacWhisper. А для диктовки в режиме реального времени — SuperWhisper.

ИнструментЛучше всего вЯ бы взял его, когда
SuperWhisperЧастный локальный диктовка в режиме реального времени на MacЯ хочу вводить текст прямо в приложения и хочу, чтобы он сохранялся на моем собственном компьютере
Wispr FlowПроизводительность и отлаженность (по отзывам пользователей)Мне хочется, чтобы диктовка работала более плавно, а вопрос конфиденциальности при использовании только локальных данных меня не так волнует
MacWhisperРаспознавание текста из пакетного файла с разделением речи по говорящимЯ обрабатываю уже имеющиеся аудио- или видеофайлы, а не диктую в режиме реального времени

В чём «SuperWhisper» уступает

Основным слабым местом SuperWhisper является его работа с именами собственными.

В ходе моих тестов программа исказила одно имя, написав его тремя разными способами за три прогона. Свое собственное название она записала как «Seagull Whisper». Чайки не шепчут. Если вы диктуете много имен, вам придется либо обучить систему с помощью панели словарного запаса, либо исправлять их вручную.

«Шепот чайки»

Вторая проблема заключается в отсутствии указателей имен выступающих на заседаниях

Остальные кнопки меньше. По умолчанию запись включается при удержании кнопки, что неудобно при длительной записи, пока вы не найдёте переключатель режима «без рук». (Совет: выберите клавишу быстрого доступа, которой вы редко пользуетесь!)

Модель «Parakeet» однажды зависла у меня прямо во время записи — просто перестала работать, и пришлось перезапустить ее. Это соответствует отзывам пользователей: она работает нестабильно. Еще один момент: точность результатов больше всего страдает при обработке длинных и зашумленных аудиозаписей, поэтому я бы учел это, прежде чем доверять ей что-то действительно важное.

Я бы не назвал ни один из этих моментов «критическим» при использовании в одиночку. Но все они являются поводом для того, чтобы протестировать приложение на собственной работе, прежде чем полагаться на него. А если вам на самом деле нужен инструмент для проведения встреч, то лучше приобретите именно его, а не приложение для диктовки, в которое просто добавили режим проведения встреч.

Стоит ли покупать SuperWhisper в 2026 году?

Если это подходящий человек, то да. И этим человеком могу оказаться я, чего я не ожидал.

Я подошла к этому как опытный машинист. Люди часто отмечают, как быстро я печатаю; это один из моих «фирменных трюков», и встроенный в приложение тест на скорость набрал у меня 93 слова в минуту, что довольно быстро. При этом скорость диктовки составила 111. Так что даже для того, кто быстро печатает на клавиатуре, разница в скорости ощутима. Но скорость — не то, что заставило меня передумать.

Причина в моих руках. У писателей бывают репетитивные стрессовые травмы, а учитывая, как много я пишу, я очень очень много. Иногда мой мозг хочет продолжать, а руки не соглашаются. Если диктовка снимает часть этой нагрузки, пусть даже не каждый день, это уже что-то значит. Я бы использовал функцию «голос в текст» без обработки и приводил текст в порядок при редактировании, а не полагался на готовую версию.

Итак, вот какой честный тест я для него устроил. Я попытался написать весь этот обзор под диктовку. Не те отполированные предложения, которые вы здесь видите; их я в итоге набрал на клавиатуре из-за проблем с доверием к этапу доработки, которые у меня сейчас возникли. Но черновой вариант, как будто я говорю вслух, — та часть, где я формулирую свои мысли, — я действительно проговорил вслух.

И запись в реальном времени не удалась. Двадцать пять минут моей речи — и SuperWhisper выдал сообщение: «Голос в записи не найден». Именно та самая слабость длинных аудиозаписей, о которой я только что писал, произошла со мной — при работе над материалом, посвящённым именно этому. Однако мне удалось покопаться в исходных файлах и извлечь то, над чем я работал, так что, хотя интерфейс и подвёл, всё же не всё было потеряно. 

Так что нет, это не заменит набор текста полностью. Пока нет, по крайней мере, для целой статьи. Но, возможно, мне и не нужно, чтобы это заменило. Возможно, я буду использовать эту функцию для черновых набросков и «мыслей вслух», а для всего остального по-прежнему буду печатать.

Я зашел, чтобы поспорить с ним. Он потерял запись и всё равно уговорил меня оформить подписку.

Ах tl;dv , и если вам нужно что-то для расшифровки встречи, я всегда использую tl;dv !

Часто задаваемые вопросы о SuperWhisper

Нет, судя по официальной политике компании. В ней указано, что ваши данные не используются для обучения моделей искусственного интеллекта, а в локальном режиме этот вопрос и так не актуален, поскольку никакие данные не покидают ваше устройство. Стоит отметить, что в политике это прописано в общем плане, а конкретно о том, как обстоят дела в облачном режиме, отдельно не говорится.

Да. Зайдите в настройки и переключите предустановку с «Super» на обычный режим «Голос в текст». Вы получите необработанную стенограмму без корректировки.

Нет. В ходе моих тестов система транскрибировала встречу с участием двух собеседников, при этом ни в одном из трёх режимов просмотра не отображались метки собеседников.

Да. Одна лицензия действует на Mac, Windows и iPhone. Версии для Android нет, и в планах на период до 2026 года её выпуск не предусмотрен.

Да. Это единовременный платеж в размере 249,99 долларов, который покрывает версии для Mac, Windows и iPhone, и, как указывает поставщик, включает в себя неограниченное количество будущих обновлений.

SuperWhisper превосходит другие приложения по точности, возможности настройки словарного запаса и функции очистки. Apple Dictation — бесплатное приложение, которое вполне подойдет для нечастого использования.