Как удалить историю сайта из «Архива Интернета» (archive.org)

15 ноября 2021

Слово не воробей, вылетит — не поймаешь. А слово, брошенное в бездну интернета не смыть даже кровью. Но лазейки есть, и я поделюсь кейсом, как мне удалось удалить историю своего сайта из «Wayback Machine».

Я веду свой блог с 2008 года. Раньше я был более открыт, много писал о личном, участвовал в разных скандальных дискуссиях с разными странными оппонентами, совершенно не думая о последствиях. Блог со временем трансформировался в профессиональный, личное уходило на задний план и в конечном счете сошло на нет. Моей первой и главной ошибкой было совместить на одном ресурсе личный и рабочий блоги. Если без этого не обойтись, трогать личное нужно хотя бы деликатно. Стараться не трогать острых тем, за которые в будущем пусть будет и не стыдно, но мнение о вас, как профессионале, может создать неоднозначное. Второй ошибкой было развивать домен, который был изначально замаран и портил мою репутацию.

Интернет помнит все!

К сожалению, интернет помнит все. Даже если вы находитесь за пределами этой страны и ваш интернет-провайдер не подчиняется законам разных яровых, контент сайта могут просто растащить стервятники разные парсеры, грабберы. А главное — любой опубликованный в интернете сайт рано или поздно будет просканирован и весь открытый контент сохранится в т.н. Архиве Интернета.

Архив Интернета (англ. Internet Archive) — некоммерческая организация, основанная в 1996 году в Сан-Франциско американским программистом Брюстером Кейлом. Главной заявленной целью Архива является предоставление всеобщего доступа к накопленной в Интернете информации. Коллекция АИ состоит из множества подколлекций архивированных веб-сайтов, оцифрованных книг, аудио и видео файлов, игр, программного обеспечения.

Википедия

Мне бы, например, не очень хотелось, чтобы мои клиенты, партнеры и просто знакомые имели возможность отыскать мои старые эссе. Поэтому вместо переезда в другой домен, я решил попробовать зачистить историю вебархива. И мне это удалось.

Процедура происходит в два этапа через удаление и последующее восстановление сайта в архиве.

1. Удалить ресурс из Archive.org

Кнопки «удалить» как таковой нет, зайти и просто удалить сайт нельзя.

На профильных ресурсах мне удалось найти пример юридического запроса на удаление сайта из архива по электронной почте. Запрос делается на основании законодательства США об авторском праве в цифровую эпоху, более известному, как DMCA (Digital Millennium Copyright Act).

Скопируйте письмо, заполните свои данные, замените адрес сайта с danilin.biz на свой и отправьте его на адрес электронной почты: [email protected] с темой сообщения: DMCA Take Down Notice.

Sir,
I am owner of domain name and website "danilin.biz"

I request you to remove the following link from your website
https://web.archive.org/web/*/danilin.biz

My Address: "Ваш полный почтовый адрес"
Phone No.: "Ваш номер телефона"
Email Address: "Ваша электронная почта"

I have a good-faith belief that the disputed use is not authorized by the copyright owner, its agent, or the law.

The above information in this notice is accurate, and under penalty of perjury, I am the owner of the copyright interest involved.

Signature: "Ваше полное имя"

Я отправлял такое письмо в 2018 году на адрес [email protected], но сейчас там никто не отвечает. Видимо теперь все контакты только через [email protected].

Важный момент: рекомендую отправлять письмо с почты в домене запрашиваемого сайта или с почты, на которую зарегистрирован домен и виден во WHOIS.

На следующий день должно прийти такое письмо:

Как удалить историю сайта из «Архива Интернета» (archive.org)
Ответ команды Архива Интернета

А через несколько дней сайт должен полностью исчезнуть из архива.

2. Восстановить ресурс в Archive.org

Мне неизвестно существуют ли какие-то лимиты между обращениями. У меня прошло где-то три года, потому что я не планировал возвращать сайт, а потом решил попробовать. Но я бы не стал спешить, а выждал хотя бы месяц-другой.

Сайт возвращается аналогичным образом, через обращение по электронной почте на адрес: [email protected] с темой сообщения: Including website и примерно таким содержанием:

Sir,
I am owner of domain name and website "danilin.biz"

Please include my website DANILIN.BIZ to ARCHIVE.ORG.

My Address: "Ваш полный почтовый адрес"
Phone No.: "Ваш номер телефона"
Email Address: "Ваша электронная почта"

Signature: "Ваше полное имя"

Примерно на следующий день придет письмо с просьбой подтвердить владение доменом.

Это можно сделать загрузив на хостинг подтверждающий файл, сделав соответствующую DNS-запись или открыв данные WHOIS домена.

Письмо целиком:

Hello,

Thank you for contacting us. To allow us to better review and assist with your request regarding danilin.biz, please select and follow the applicable section(s) below.

1. IF YOU PERSONALLY OWN THE WEBSITE(S) for the URL(s) for which you seek to allow future archives, please help us verify your ownership for those URLs by doing one of the following: 

Add a text file with your request to the site’s root directory (e.g., domain.com/waybackverify.txt) or to your DNS records

If a main email contact is identified on your site, send us your request from that address (and include a link to the place on the site where the contact is listed). Note: for companies with general customer service addresses listed as contacts and the like, we may request further verification.

If the registrant email is publicly viewable on a WHOIS lookup listing, send us an email from that address (and a link to the whois listing where it is displayed)

Send us email communication from a hosting company or registrar addressed to you as owner of the domain (the email should reference the domain specifically). To satisfy this option, please send the email to us as an attachment.

2. IF YOU REPRESENT AN ENTITY THAT OWNS ANY OF THE SITE(S) for the URL(s) for which you seek to allow future archives, please help us verify your ownership for those URLs by doing one of the following:

Add a text file with your request to the site’s root directory (e.g., domain.com/waybackverify.txt) or to your DNS records

If the registrant email is publicly viewable on a WHOIS lookup listing, send us an email from that address (and a link to the whois listing where it is displayed)

Send us email communication from a hosting company or registrar addressed to you as owner of the domain (the email should reference the domain specifically). To satisfy this option, please send the email to us as an attachment.

Thank you for working with our process.

--

The Internet Archive Team

Если их все устроит, через день-два придет соответсвующее уведомление:

Hello,

Thank you for your response.

We have queued the re-enablement of archiving of danilin.biz for deployment and will notify you once the cancellation of exclusion has taken effect.

---
The Internet Archive Team

И примерно через неделю сайт вернется в архив, а чем тоже уведомят:

Hello,

Please be advised that we have enabled archives for the following from the day of your request below onward:

danilin.biz

There may not be any currently available archives yet. If desired, you may submit URLs to be archived via the Save Page Now feature at https://web.archive.org.

—

The Internet Archive Team

Как видим, задача решена: история моего сайта чиста, как слеза девственницы.

Как удалить историю сайта из «Архива Интернета» (archive.org)
Архив Интернета — archive.org

Буду признателен, если поделитесь в комментариях своим опытом решения этой задачи.

Иван Данилин
Автор Иван Данилин

Фулстек веб‑разработчик, специализируюсь на платформе WordPress

Подробнее
Комментарии
  1. Добрый день! Пришел вот такой ответ. Но по ссылке «here» перейти не удается, выдает ошибку 403:

    Hello,

    Thank you for contacting us. You have reached the Internet Archive, a non-profit digital library. The Wayback Machine at web.archive.org is a non-profit project of the Internet Archive founded to preserve a historical record of the Internet for the purposes of scholarship and research. Thank you for considering the potential broad public benefit of a more complete archive as you submit your request.

    While we do not make any guarantees with respect to review or outcome, please help us advance your request by submitting a Wayback Machine Exclusion Request Form here.

    Our team will review your submission and advise if we have any further inquiries.

    Thank you again for your email and for working with our process.



    The Internet Archive Team
Добавить комментарий