Wispr Flow — ИИ, который транскрибирует вашу речь прямо с клавиатуры iPhone

Это немного трюк, но и довольно круто. Я не напечатал ни слова из того, что вы собираетесь прочитать. Я продиктовал весь этот текст в Wispr Flow, классную клавиатуру для диктовки, которую я пробовал последние несколько недель. Вот как она себя показала: со всеми недостатками.

Когда Wispr связался со мной, чтобы предложить свою клавиатуру с ИИ для преобразования речи в текст, я отнесся со скепсисом. Даже Apple пыталась внедрить встроенную функцию диктовки с расстановкой знаков препинания, но это оказалось весьма переменчиво.

Также не помогло то, что поначалу рабочий процесс использования клавиатуры казался немного сложным. Но оказалось, что то, как они обошли ограничения iOS и предложили самое близкое к клавиатуре транскрипции на основе ИИ, что сейчас возможно, довольно умно.

Как это работает.

Wispr Flow работает на основе того, что они называют «сеансами потока» (Flow Sessions) — это окна времени, в течение которых приложение получает доступ к микрофону. В настройках можно настроить автоматическое завершение сеансов потока через 5 минут, 15 минут, 1 час или никогда.

Как только вы нажмете «Start Flow» на сторонней клавиатуре приложения, оно перенесет вас в полнофункциональное приложение Wispr Flow, активирует сеанс потока, а затем вернет вас туда, где вы были. С этого момента вы можете нажать кнопку микрофона, и он начнет записывать то, что вы говорите. Когда вы закончите, нажмите кнопку с галочкой, чтобы завершить сеанс транскрипции. Вы также можете нажать кнопку меню слева, чтобы вручную отключить сеанс потока.

В приложении вы найдете:

– Всю историю вашей диктовки

– Функцию быстрых заметок

– Вкладку для создания пользовательского словаря конкретных слов, которые вы хотите, чтобы приложение научилось писать и заменять в сеансах диктовки

В настройках вы также можете установить предпочитаемые языки, на случай если вы хотите, чтобы приложение работало с языками, отличными от тех, которые вы установили в качестве стандартных на своем устройстве.

Обеспокоены конфиденциальностью? Я тоже. Поэтому я спросил их.

Wispr Flow использует смесь моделей Llama от Meta и Whisper от OpenAI. Компания сообщила мне, что по мере расширения набора функций они могут привлекать других поставщиков моделей. Тем не менее, они всегда будут тщательно проверять их на доверие, безопасность и соответствие требованиям и работать только с поставщиками, которые согласны с тем же стандартом нулевого хранения данных. Они также заверили меня, что Wispr не хранит и не передает личные данные набора текста OpenAI или каким-либо третьим сторонам для целей обучения, если пользователь явно не дал на это согласие.

Я также спросил их, могут ли недавние анонсы WWDC25 помочь уменьшить сложность использования приложения, и они ответили, что исследуют способы использования новых API для интеграции Flow с такими функциями, как «Быстрые команды» и «Кнопка действия». Что касается недавно анонсированных Apple локальных моделей, они держат их в поле зрения, но пока остаются с текущими поставщиками моделей.

В целом, Wispr Flow кажется приложением, которое изо всех сил старается предложить хорошую, надежную и конфиденциальную транскрипцию на основе ИИ, несмотря на технические ограничения iOS. Точность меня очень впечатлила, и если бы я пользовался голосовыми заметками или зависел от этого для доступности, я бы полностью его использовал. Оно также работает на MacOS и Windows, и имеет список ожидания для Android, Linux и веб-версии. Есть бесплатный тариф с 2000 слов в неделю, а также тарифы Pro и Teams со скидкой 20% на годовую подписку. Также предлагаются корпоративные тарифы, и вы можете ознакомиться со всеми подробностями на их веб-сайте

Лучшие предложения на AirPods на Amazon