Wayback Machine от Internet Archive под угрозой из-за блокировок издателей

Wayback Machine от Internet Archive — один из самых ценных ресурсов интернета, позволяющий нам получать доступ к предыдущим версиям веб-страниц и сайтов. Он выполняет бесценную роль в сохранении информации, которая иначе была бы утеряна при закрытии веб-сайтов, а также является практичным инструментом для отслеживания изменений на веб-странице.

Однако, по словам организации, сейчас она находится под серьезной угрозой из-за того, что медиаорганизации блокируют доступ к веб-краулеру архива — несмотря на то, что те же издатели используют его для своих собственных материалов…

Wired сообщает, что 23 крупных новостных сайта в настоящее время блокируют веб-краулер, используемый Internet Archive для наполнения Wayback Machine. Одним из них является USA Today.

USA Today опубликовал отличный репортаж, раскрывший, как Иммиграционная и таможенная служба США задержала раскрытие ключевой информации о последствиях своей политики задержания. Авторы использовали Wayback Machine от Internet Archive для сбора и анализа статистики задержаний от ICE и отслеживания изменений в ведомстве при администрации Трампа […]

[Тем не менее] USA Today Co., издательский конгломерат, ранее известный как Gannet, который управляет как одноименной газетой, так и более чем 200 дополнительными СМИ, запрещает Wayback Machine архивировать свои работы. «Они могут собирать материалы для своих статей благодаря существованию Wayback Machine. В то же время они блокируют доступ», — говорит директор Wayback Machine Марк Грэм […]

Согласно анализу стартапа по обнаружению искусственного интеллекта Originality AI, 23 крупных новостных сайта в настоящее время блокируют ia_archiverbot, веб-краулер, обычно используемый Internet Archive для проекта Wayback. Социальная платформа Reddit тоже.

USA Today заявил, что ему пришлось принять меры для блокировки скрапинг-ботов, и он не стремится специально блокировать Internet Archive.

Однако журналисты говорят, что Wayback Machine — это жизненно важный инструмент, который необходимо защищать.

Коалиция собрала более 100 подписей от работающих журналистов, которые признают ценность этого инструмента, и представила письмо поддержки Internet Archive. Среди подписавшихся — от телеведущей Рэйчел Мэддоу до независимых репортеров, таких как Кэт Тенбардж из Spitfire News и Тейлор Лоренц из User Mag.

«В предыдущих поколениях журналисты обращались к физическим архивам местных газет или местных публичных библиотек, чтобы получить доступ к историческим материалам и проследить нити настоящего в прошлое», — говорится в письме. «Поскольку многие газеты закрываются, а у местных публичных библиотек нет четкого пути для сохранения только цифровых материалов, работа по сохранению журналистского архива все больше ложится на Internet Archive».

Я подписал, и другие журналисты могут сделать это здесь.

Изображение: Ctrl.blog/CC2.0