MacWhisper теперь поддерживает невероятно быструю модель транскрипции Parakeet от Nvidia

MacWhisper долгое время был одним из лучших и самых простых способов транскрибировать что угодно на Mac. Я активно пользовался им с момента его запуска и не могу не рекомендовать его. Сегодня он стал еще лучше благодаря обновлению, которое добавило поддержку чрезвычайно быстрой модели Parakeet от Nvidia. И я имею в виду *быстрой*.

По мере того как OpenAI отказывается от Whisper, MacWhisper получает ускорение Parakeet

Когда OpenAI выпустила свои модели транскрипции на основе искусственного интеллекта семейства Whisper, они казались волшебством. Они были по крайней мере на порядок быстрее и точнее, чем все остальное на рынке, особенно в сегменте с открытым исходным кодом.

Однако, поскольку OpenAI сместила фокус на более коммерчески выгодные gpt-4o-transcribe модели, Whisper начал устаревать. Вскоре новые модели транскрипции сделали с Whisper то, что он когда-то сделал с его предшественниками.

Nvidia Parakeet — одна из них. Анонсированная в прошлом месяце, она обещала транскрибировать «60 минут аудио всего за 1 секунду», при условии наличия соответствующего оборудования, такого как GPU A100, H100, T4 или V100.

Parakeet был доступен через инструменты с открытым исходным кодом. В чем подвох? Не все чувствуют себя комфортно, работая с интерфейсами командной строки или управляя развертыванием пользовательских моделей.

К счастью, сегодня это меняется: MacWhisper только что добавил поддержку модели Parakeet от Nvidia, и она действительно невероятно, немыслимо быстра. Вот что говорит разработчик приложения Джорди Брюин:

«Благодаря нашему сотрудничеству с командой Argmax, MacWhisper теперь поддерживает модели Parakeet. Чтобы показать вам, насколько это важно, посмотрите на GIF ниже, где мы транскрибируем и разделяем 30-минутный подкаст менее чем за 8 секунд!»

Я протестировал его на своем MacBook Pro M2 Pro, используя недавний 3-часовой выпуск 9to5Mac Happy Hour, и он справился с задачей всего за 1 минуту 22 секунды, включая распознавание говорящих.

Стоит отметить, что модель Parakeet доступна для Pro-пользователей и в настоящее время поддерживает транскрипцию только на английском языке. Брюин говорит, что многоязычная версия скоро появится.

Лучшие предложения на аксессуары на Amazon