
Новый отчет Bloomberg рассказывает о команде людей, которых Amazon нанимает для прослушивания и мониторинга голосовых записей Alexa. В отчете поясняется, что Amazon нанимает «тысячи людей по всему миру» для прослушивания голосовых записей, сделанных с помощью ее устройств Echo.
Некоторые из сотрудников работают в Amazon полный рабочий день, а другие — независимые подрядчики. В любом случае, Amazon требует, чтобы эти люди подписывали соглашения о неразглашении, чтобы детали программы оставались закрытыми от общественности. Эти люди работают по всему миру, включая Бостон, Коста-Рику, Индию и Румынию.
Цель этой тактики Amazon — «устранить пробелы в понимании Alexa человеческой речи и помочь ей лучше реагировать на команды», — поясняется в отчете. Однако неизбежно возникают опасения по поводу конфиденциальности.
Каждый рецензент работает по девять часов, обрабатывая до 1000 аудиоклипов за смену. В некоторых случаях записи довольно скучны и заключаются в простой выборке «накопленных голосовых данных для конкретных фраз, таких как «Taylor Swift». Если сотрудникам нужна «помощь в расшифровке неразборчивого слова», они могут поделиться аудиофайлами в чате с другими сотрудниками.
Процесс рассмотрения Amazon данных речи начинается, когда Alexa выбирает случайную, небольшую выборку клиентских голосовых записей и отправляет аудиофайлы сотрудникам и подрядчикам, расположенным в разных уголках мира, согласно человеку, осведомленному о дизайне программы.
Однако в других случаях все гораздо интереснее. Например, в отчете описывается, что происходит, когда сотрудник Amazon слышит что-то, что может считаться тревожным или даже преступным. В любом случае, однако, Amazon не считает своей задачей вмешиваться:
Иногда они слышат записи, которые считают тревожными или, возможно, преступными. Двое из работников сказали, что они услышали то, что, по их мнению, было сексуальным насилием. Когда такое происходит, они могут поделиться этим опытом во внутреннем чате, чтобы снять стресс.
Amazon заявляет, что у них есть процедуры для работников на случай, если они услышат что-то тревожное, но два сотрудника из Румынии сказали, что после запроса руководства по таким случаям им ответили, что вмешательство не является задачей Amazon.
В своем заявлении Amazon пояснил, что серьезно относится к безопасности и конфиденциальности и аннотирует лишь «крайне малую часть» голосовых записей Alexa. Компания объясняет, что эти случайные выборки помогают ей обучать системы понимания речи и языка, что, в свою очередь, улучшает способность Alexa понимать запросы.
«Мы серьезно относимся к безопасности и конфиденциальности личной информации наших клиентов», — заявил представитель Amazon в электронном письме. «Мы аннотируем лишь крайне малую часть голосовых записей Alexa, чтобы улучшить клиентский опыт. Например, эта информация помогает нам обучать наши системы распознавания речи и понимания естественного языка, чтобы Alexa могла лучше понимать ваши запросы и обеспечивать бесперебойную работу службы для всех».
«У нас есть строгие технические и операционные меры безопасности, а также политика нулевой терпимости к злоупотреблению нашей системой. Сотрудники не имеют прямого доступа к информации, которая может идентифицировать человека или учетную запись, в рамках этого рабочего процесса. Вся информация обрабатывается с высокой степенью конфиденциальности, и мы используем многофакторную аутентификацию для ограничения доступа, шифрование сервисов и аудит нашей среды контроля для ее защиты».
В отчете Bloomberg также упоминаются усилия Apple в отношении Siri. В отчете поясняется, что, хотя у Apple есть «помощники-люди», в записях отсутствует информация, позволяющая идентифицировать личность. Через шесть месяцев данные лишаются информации, позволяющей идентифицировать личность, но могут храниться более длительные периоды для улучшения распознавания голоса.
У Siri от Apple также есть помощники-люди, которые работают над тем, чтобы оценить, соответствует ли интерпретация запросов цифровым помощником тому, что сказал человек. Записи, которые они просматривают, не содержат личной информации и хранятся в течение шести месяцев с привязкой к случайному идентификатору, согласно техническому документу Apple по безопасности. После этого данные лишаются информации, позволяющей идентифицировать личность, но могут храниться более длительные периоды для улучшения распознавания голоса Siri.
Полный отчет от Bloomberg определенно стоит прочтения, и его можно найти здесь.