Как удалить историю сайта из «Архива Интернета» (archive.org)

15 ноября 2021

Слово не воробей, вылетит — не поймаешь. А слово, брошенное в бездну интернета не смыть даже кровью. Но лазейки есть, и я поделюсь кейсом, как мне удалось удалить историю своего сайта из «Wayback Machine».

Я веду свой блог с 2008 года. Раньше я был более открыт, много писал о личном, участвовал в разных скандальных дискуссиях с разными странными оппонентами, совершенно не думая о последствиях. Блог со временем трансформировался в профессиональный, личное уходило на задний план и в конечном счете сошло на нет. Моей первой и главной ошибкой было совместить на одном ресурсе личный и рабочий блоги. Если без этого не обойтись, трогать личное нужно хотя бы деликатно. Стараться не трогать острых тем, за которые в будущем пусть будет и не стыдно, но мнение о вас, как профессионале, может создать неоднозначное. Второй ошибкой было развивать домен, который был изначально замаран и портил мою репутацию.

Интернет помнит все!

К сожалению, интернет помнит все. Даже если вы находитесь за пределами этой страны и ваш интернет-провайдер не подчиняется законам разных яровых, контент сайта могут просто растащить стервятники разные парсеры, грабберы. А главное — любой опубликованный в интернете сайт рано или поздно будет просканирован и весь открытый контент сохранится в т.н. Архиве Интернета.

Архив Интернета (англ. Internet Archive) — некоммерческая организация, основанная в 1996 году в Сан-Франциско американским программистом Брюстером Кейлом. Главной заявленной целью Архива является предоставление всеобщего доступа к накопленной в Интернете информации. Коллекция АИ состоит из множества подколлекций архивированных веб-сайтов, оцифрованных книг, аудио и видео файлов, игр, программного обеспечения.

Википедия

Мне бы, например, не очень хотелось, чтобы мои клиенты, партнеры и просто знакомые имели возможность отыскать мои старые эссе. Поэтому вместо переезда в другой домен, я решил попробовать зачистить историю вебархива. И мне это удалось.

Процедура происходит в два этапа через удаление и последующее восстановление сайта в архиве.

1. Удалить ресурс из Archive.org

Кнопки «удалить» как таковой нет, зайти и просто удалить сайт нельзя.

На профильных ресурсах мне удалось найти пример юридического запроса на удаление сайта из архива по электронной почте. Запрос делается на основании законодательства США об авторском праве в цифровую эпоху, более известному, как DMCA (Digital Millennium Copyright Act).

Скопируйте письмо, заполните свои данные, замените адрес сайта с danilin.biz на свой и отправьте его на адрес электронной почты: info@archive.org с темой сообщения: DMCA Take Down Notice.

Sir,
I am owner of domain name and website "danilin.biz"

I request you to remove the following link from your website
https://web.archive.org/web/*/danilin.biz

My Address: "Ваш полный почтовый адрес"
Phone No.: "Ваш номер телефона"
Email Address: "Ваша электронная почта"

I have a good-faith belief that the disputed use is not authorized by the copyright owner, its agent, or the law.

The above information in this notice is accurate, and under penalty of perjury, I am the owner of the copyright interest involved.

Signature: "Ваше полное имя"

Я отправлял такое письмо в 2018 году на адрес processor@archive.org, но сейчас там никто не отвечает. Видимо теперь все контакты только через info@archive.org.

Важный момент: рекомендую отправлять письмо с почты в домене запрашиваемого сайта или с почты, на которую зарегистрирован домен и виден во WHOIS.

На следующий день должно прийти такое письмо:

Как удалить историю сайта из «Архива Интернета» (archive.org)
Ответ команды Архива Интернета

А через несколько дней сайт должен полностью исчезнуть из архива.

2. Восстановить ресурс в Archive.org

Мне неизвестно существуют ли какие-то лимиты между обращениями. У меня прошло где-то три года, потому что я не планировал возвращать сайт, а потом решил попробовать. Но я бы не стал спешить, а выждал хотя бы месяц-другой.

Сайт возвращается аналогичным образом, через обращение по электронной почте на адрес: info@archive.org с темой сообщения: Including website и примерно таким содержанием:

Sir,
I am owner of domain name and website "danilin.biz"

Please include my website DANILIN.BIZ to ARCHIVE.ORG.

My Address: "Ваш полный почтовый адрес"
Phone No.: "Ваш номер телефона"
Email Address: "Ваша электронная почта"

Signature: "Ваше полное имя"

Примерно на следующий день придет письмо с просьбой подтвердить владение доменом.

Это можно сделать загрузив на хостинг подтверждающий файл, сделав соответствующую DNS-запись или открыв данные WHOIS домена.

Письмо целиком:

Hello,

Thank you for contacting us. To allow us to better review and assist with your request regarding danilin.biz, please select and follow the applicable section(s) below.

1. IF YOU PERSONALLY OWN THE WEBSITE(S) for the URL(s) for which you seek to allow future archives, please help us verify your ownership for those URLs by doing one of the following: 

Add a text file with your request to the site’s root directory (e.g., domain.com/waybackverify.txt) or to your DNS records

If a main email contact is identified on your site, send us your request from that address (and include a link to the place on the site where the contact is listed). Note: for companies with general customer service addresses listed as contacts and the like, we may request further verification.

If the registrant email is publicly viewable on a WHOIS lookup listing, send us an email from that address (and a link to the whois listing where it is displayed)

Send us email communication from a hosting company or registrar addressed to you as owner of the domain (the email should reference the domain specifically). To satisfy this option, please send the email to us as an attachment.

2. IF YOU REPRESENT AN ENTITY THAT OWNS ANY OF THE SITE(S) for the URL(s) for which you seek to allow future archives, please help us verify your ownership for those URLs by doing one of the following:

Add a text file with your request to the site’s root directory (e.g., domain.com/waybackverify.txt) or to your DNS records

If the registrant email is publicly viewable on a WHOIS lookup listing, send us an email from that address (and a link to the whois listing where it is displayed)

Send us email communication from a hosting company or registrar addressed to you as owner of the domain (the email should reference the domain specifically). To satisfy this option, please send the email to us as an attachment.

Thank you for working with our process.

--

The Internet Archive Team

Если их все устроит, через день-два придет соответсвующее уведомление:

Hello,

Thank you for your response.

We have queued the re-enablement of archiving of danilin.biz for deployment and will notify you once the cancellation of exclusion has taken effect.

---
The Internet Archive Team

И примерно через неделю сайт вернется в архив, а чем тоже уведомят:

Hello,

Please be advised that we have enabled archives for the following from the day of your request below onward:

danilin.biz

There may not be any currently available archives yet. If desired, you may submit URLs to be archived via the Save Page Now feature at https://web.archive.org.

—

The Internet Archive Team

Как видим, задача решена: история моего сайта чиста, как слеза девственницы.

Как удалить историю сайта из «Архива Интернета» (archive.org)
Архив Интернета — archive.org

Буду признателен, если поделитесь в комментариях своим опытом решения этой задачи.

Иван Данилин
Автор Иван Данилин

Делаю сайты на Вордпресс с 2008 года. Не просто сайты, а уникальные инструменты для решения сложных бизнес‑задач с оптимизацией и поддержкой.

Добавить комментарий