Wayback Machine: відмінності між версіями

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
[перевірена версія][перевірена версія]
Вилучено вміст Додано вміст
оформлення
оформлення
Рядок 17: Рядок 17:


== Історія ==
== Історія ==
Засновники [[Інтернет-архів]]у {{нп|Брюстер Кале||en|Brewster Kahle}} і {{нп|Брюс Джилліат||en|Bruce Gilliat}} запустили Wayback Machine 2001 року, щоб вирішити проблему зникнення контенту веб-сайтів кожного разу, коли їх змінюють або закривають.<ref>{{Cite journal}}</ref> Сервіс дозволяє користувачам переглядати архівні версії [[Веб-сторінка|веб-сторінок]], як вони змінювались з часом, що архів називає "тривимірним індексом".<ref name="FAQ">{{Citation|title=Frequently Asked Questions|url=https://archive.org/about/faqs.php#The_Wayback_Machine|archiveurl=https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine|deadurl=no|chapter=The Wayback Machine|access-date=September 18, 2018|archivedate=September 18, 2018}}</ref> Кале і Джилліат створили машину, сподіваючись заархівувати весь інтернет і забезпечити "загальний доступ до всіх знань".<ref name=":0">{{Cite web|url=https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|title=20,000 Hard Drives on a Mission {{!}} Internet Archive Blogs|website=blog.archive.org|language=en-US|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20181020153727/https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|archivedate=October 20, 2018|deadurl=no}}</ref>
Засновники [[Інтернет-архів]]у {{нп|Брюстер Кале||en|Brewster Kahle}} і {{нп|Брюс Джилліат||en|Bruce Gilliat}} запустили Wayback Machine 2001 року, щоб вирішити проблему зникнення контенту веб-сайтів кожного разу, коли їх змінюють або закривають<ref>{{cite journal |last=Notess |first=Greg R. |date=March–April 2002 |title=The Wayback Machine: The Web's Archive |url= |journal=Online |volume=26 |pages=59–61 |via=EBSCOhost}}</ref>. Сервіс дозволяє користувачам переглядати архівні версії [[Веб-сторінка|веб-сторінок]], як вони змінювались з часом, що архів називає "тривимірним індексом"<ref name="FAQ">{{Citation|title=Frequently Asked Questions|url=https://archive.org/about/faqs.php#The_Wayback_Machine|archiveurl=https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine|deadurl=no|chapter=The Wayback Machine|access-date=September 18, 2018|archivedate=September 18, 2018}}</ref>. Кале і Джилліат створили машину, сподіваючись заархівувати весь інтернет і забезпечити "загальний доступ до всіх знань"<ref name=":0">{{Cite web|url=https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|title=20,000 Hard Drives on a Mission {{!}} Internet Archive Blogs|website=blog.archive.org|language=en-US|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20181020153727/https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|archivedate=October 20, 2018|deadurl=no}}</ref>.


Назву ''Wayback Machine'' вибрали як посилання на "{{iw|WABAC machine||}}" (вимовляється ''вей-бек''), пристрій для [[Подорож у часі|подорожей у часі]], який застосовують персонажі {{нп|Містер Пібоді||en|Mr. Peabody}} і Шерман в анімаційному фільмі ''{{нп|Шоу Роккі та Буллвінкля||en|The Rocky and Bullwinkle Show}}''.<ref>{{Cite news|url=http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|title=A Library as Big as the World|last=Green|first=Heather|date=February 28, 2002|archiveurl=https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|archivedate=December 20, 2011|publisher=BusinessWeek}}</ref><ref>{{Cite news|url=https://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|title=Responsible Party – Brewster Kahle; A Library Of the Web, On the Web|last=Tong|first=Judy|date=September 8, 2002|work=New York Times|accessdate=August 15, 2011|archiveurl=https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|archivedate=February 20, 2011|deadurl=no}}</ref> В одній з частин цього анімаційного мультфільму, ''{{нп|Неймовірна історія Пібоді||en|Peabody's Improbable History}}'', персонажі часто використовував машину, щоб спостерігати відомі події в історії, брати в них участь і, частіше, змінювати їх хід.
Назву ''Wayback Machine'' вибрали як посилання на "{{iw|WABAC machine||}}" (вимовляється ''вей-бек''), пристрій для [[Подорож у часі|подорожей у часі]], який застосовують персонажі {{нп|Містер Пібоді||en|Mr. Peabody}} і Шерман в анімаційному фільмі ''{{нп|Шоу Роккі та Буллвінкля||en|The Rocky and Bullwinkle Show}}''<ref>{{Cite news|url=http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|title=A Library as Big as the World|last=Green|first=Heather|date=February 28, 2002|archiveurl=https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|archivedate=December 20, 2011|publisher=BusinessWeek}}</ref><ref>{{Cite news|url=https://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|title=Responsible Party – Brewster Kahle; A Library Of the Web, On the Web|last=Tong|first=Judy|date=September 8, 2002|work=New York Times|accessdate=August 15, 2011|archiveurl=https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|archivedate=February 20, 2011|deadurl=no}}</ref>. В одній з частин цього анімаційного мультфільму, ''{{нп|Неймовірна історія Пібоді||en|Peabody's Improbable History}}'', персонажі часто використовував машину, щоб спостерігати відомі події в історії, брати в них участь і, частіше, змінювати їх хід.


Wayback Machine почала архівувати [[кеш]]овані веб-сторінки 1996 року, з метою зробити послугу доступною громадськості п'ять років по тому.<ref name="IA: Wayback">{{Cite web|url=https://archive.org/web/|title=Internet Archive: Wayback Machine|website=archive.org|language=en|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20140103004344/http://archive.org/web/|archivedate=January 3, 2014|deadurl=no}}</ref> Від 1996 до 2001 року інформація зберігалася на цифрових плівках, а Кале зрідка дозволяв дослідникам і дослідникам і науковцям підключатися до громіздкої бази даних.<ref>{{Cite news|last=Cook|first=John|title=Web site takes you way back in Internet history|url=http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|accessdate=August 15, 2011|work=Seattle Post-Intelligencer|date=November 1, 2001|deadurl=no|archiveurl=https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|archivedate=August 12, 2014}}</ref> 2001 року, коли архівові виповнилося п'ять років, його відкрили для публіки на церемонії в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі).<ref>{{Cite journal}}</ref> До часу запуску Wayback Machine вона вже містила понад 10 мільярдів архівних сторінок.<ref name="Arora (2015)">{{Cite journal}}</ref>
Wayback Machine почала архівувати [[кеш]]овані веб-сторінки 1996 року, з метою зробити послугу доступною громадськості п'ять років по тому<ref name="IA: Wayback">{{Cite web|url=https://archive.org/web/|title=Internet Archive: Wayback Machine|website=archive.org|language=en|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20140103004344/http://archive.org/web/|archivedate=January 3, 2014|deadurl=no}}</ref>. Від 1996 до 2001 року інформація зберігалася на цифрових плівках, а Кале зрідка дозволяв дослідникам і дослідникам і науковцям підключатися до громіздкої бази даних<ref>{{Cite news|last=Cook|first=John|title=Web site takes you way back in Internet history|url=http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|accessdate=August 15, 2011|work=Seattle Post-Intelligencer|date=November 1, 2001|deadurl=no|archiveurl=https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|archivedate=August 12, 2014}}</ref>. 2001 року, коли архівові виповнилося п'ять років, його відкрили для публіки на церемонії в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі)<ref>{{cite journal |url=https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |title=Wayback Goes Way Back on Web |journal=Wired |author= |date=October 28, 2001 |accessdate=October 16, 2017 |deadurl=no |archiveurl=https://web.archive.org/web/20171016225914/https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |archivedate=October 16, 2017 |df= }}</ref>. До часу запуску Wayback Machine вона вже містила понад 10 мільярдів архівних сторінок<ref name="Arora (2015)" />.


Нині дані зберігаються на великому кластері вузлів [[Linux]] Інтернет-архіву.<ref name=":0">{{Cite web|url=https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|title=20,000 Hard Drives on a Mission {{!}} Internet Archive Blogs|website=blog.archive.org|language=en-US|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20181020153727/https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|archivedate=October 20, 2018|deadurl=no}}</ref> Він заново відвідує і архівує нові версії веб-сайтів випадково (див. технічні дані нижче).<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=January 28, 2016|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref> Сайти також можна архівувати вручну, вводячи його [[Уніфікований локатор ресурсів|URL-адресу]] в поле пошуку, за умови, що сайт дозволяє Wayback Machine "проковзати" по ньому пошуковим роботом і зберегти дані.<ref name="IA: Wayback">{{Cite web|url=https://archive.org/web/|title=Internet Archive: Wayback Machine|website=archive.org|language=en|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20140103004344/http://archive.org/web/|archivedate=January 3, 2014|deadurl=no}}</ref>
Нині дані зберігаються на великому кластері вузлів [[Linux]] Інтернет-архіву<ref name=":0" />. Він заново відвідує і архівує нові версії веб-сайтів випадково (див. технічні дані нижче)<ref name="leetaru" />. Сайти також можна архівувати вручну, вводячи його [[Уніфікований локатор ресурсів|URL-адресу]] в поле пошуку, за умови, що сайт дозволяє Wayback Machine "проковзати" по ньому пошуковим роботом і зберегти дані<ref name="IA: Wayback" />.


== Технічні подробиці ==
== Технічні подробиці ==
Програмне забезпечення розроблено, щоб [[пошуковий робот]] міг "проковзувати" по Інтернету і завантажувати всі загальнодоступні веб-сторінки, ієрархію [[Gopher]], систему дошки оголошень [[Usenet]] і завантажуване програмне забезпечення.<ref name="ArchivingInternet">{{Cite web|last=Kahle|first=Brewster|title=Archiving the Internet|url=http://www.uibk.ac.at/voeb/texte/kahle.html|publisher=Scientific American – March 1997 Issue|accessdate=August 19, 2011|deadurl=no|archiveurl=https://web.archive.org/web/20120403042627/http://www.uibk.ac.at/voeb/texte/kahle.html|archivedate=April 3, 2012}}</ref> Інформація, зібрана за допомогою цих роботів не включає всю доступну інформацію в Інтернеті, оскільки значну частину даних обмежують видавці, або вона зберігається в недоступних базах даних. Щоб подолати суперечності частково кешованих веб-сайтів, 2005 року Інтернет архів розробив Archive-It.org як засіб, що дозволяє установам і творцям контенту добровільно збирати і зберігати колекції цифрового контенту та створювати цифрові архіви.<ref>{{Cite web|url=https://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|title=Archive-It: Crawling the Web Together|website=Internet Archive Blogs|last=Jeff Kaplan|date=October 27, 2014|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171012212827/http://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|archivedate=October 12, 2017}}</ref>
Програмне забезпечення розроблено, щоб [[пошуковий робот]] міг "проковзувати" по Інтернету і завантажувати всі загальнодоступні веб-сторінки, ієрархію [[Gopher]], систему дошки оголошень [[Usenet]] і завантажуване програмне забезпечення<ref name="ArchivingInternet">{{Cite web|last=Kahle|first=Brewster|title=Archiving the Internet|url=http://www.uibk.ac.at/voeb/texte/kahle.html|publisher=Scientific American – March 1997 Issue|accessdate=August 19, 2011|deadurl=no|archiveurl=https://web.archive.org/web/20120403042627/http://www.uibk.ac.at/voeb/texte/kahle.html|archivedate=April 3, 2012}}</ref>. Інформація, зібрана за допомогою цих роботів не включає всю доступну інформацію в Інтернеті, оскільки значну частину даних обмежують видавці, або вона зберігається в недоступних базах даних. Щоб подолати суперечності частково кешованих веб-сайтів, 2005 року Інтернет архів розробив Archive-It.org як засіб, що дозволяє установам і творцям контенту добровільно збирати і зберігати колекції цифрового контенту та створювати цифрові архіви<ref>{{Cite web|url=https://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|title=Archive-It: Crawling the Web Together|website=Internet Archive Blogs|last=Jeff Kaplan|date=October 27, 2014|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171012212827/http://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|archivedate=October 12, 2017}}</ref>.


Crawls надходять з різних джерел, деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого архіву.<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=January 28, 2016|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref> Наприклад, Crawls надходять від [[Фундація Альфреда Слоуна|Фундації Альфреда Слоуна]] і [[Alexa Internet|Alexa]], повзає веденні ІА від імені [[Національне управління архівів та документації|Національного управління архівів та документації]] та {{iw|Internet Memory Foundation||}}, дзеркал з {{iw|Common Crawl||}}.<ref name="leetaru" /> "Worldwide Web Crawls" працює з 2010 року і захоплює глобальне павутиння.<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref><ref name="leetaru" />
Crawls надходять з різних джерел, деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого архіву<ref name=leetaru/>. Наприклад, Crawls надходять від [[Фундація Альфреда Слоуна|Фундації Альфреда Слоуна]] і [[Alexa Internet|Alexa]], повзає веденні ІА від імені [[Національне управління архівів та документації|Національного управління архівів та документації]] та {{iw|Internet Memory Foundation||}}, дзеркал з {{iw|Common Crawl||}}<ref name="leetaru" />. "Worldwide Web Crawls" працює з 2010 року і захоплює глобальне павутиння<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref><ref name="leetaru" />.


Частота захоплень для зберігання змінюється в залежності від сайту.<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=January 28, 2016|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref> Сайти у "Worldwide Web Crawls" включені в "crawl list", один сайт архівується раз за обхід.<ref name="leetaru" /> Обхід може тривати кілька місяців або навіть років у залежності від розміру.<ref name="leetaru" /> Наприклад, "Wide Crawl Number 13" розпочався 9 січня 2015 року й завершився 11 липня 2016 року.<ref>{{Cite web|url=https://archive.org/details/wide00013?&sort=-publicdate&page=3|title=Wide Crawl Number 13|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019223332/https://archive.org/details/wide00013?&sort=-publicdate&page=3|archivedate=October 19, 2017}}</ref> Однак, в один і той самий момент може проходити кілька обходів, і сайт може бути включений у понад один crawl list, тож частота обходу сайтів змінюється в широких межах.<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=January 28, 2016|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref>
Частота захоплень для зберігання змінюється в залежності від сайту<ref name=leetaru/>. Сайти у "Worldwide Web Crawls" включені в "crawl list", один сайт архівується раз за обхід<ref name="leetaru" />. Обхід може тривати кілька місяців або навіть років у залежності від розміру<ref name="leetaru" />. Наприклад, "Wide Crawl Number 13" розпочався 9 січня 2015 року й завершився 11 липня 2016 року<ref>{{Cite web|url=https://archive.org/details/wide00013?&sort=-publicdate&page=3|title=Wide Crawl Number 13|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019223332/https://archive.org/details/wide00013?&sort=-publicdate&page=3|archivedate=October 19, 2017}}</ref>. Однак, в один і той самий момент може проходити кілька обходів, і сайт може бути включений у понад один crawl list, тож частота обходу сайтів змінюється в широких межах<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=January 28, 2016|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref>.


=== Місткість сховища і зростання ===
=== Місткість сховища і зростання ===
Разом з розвитком технології впродовж років зростала й місткість сховища Wayback Machine. У 2003 році, через два роки після того, як доступ став публічним, Wayback Machine зростала зі швидкістю 12 терабайтів на місяць. Дані зберігаються на rack systems custom [[PetaBox]], розробленій співробітниками інтернет-архіву. Перша стійка 100ТВ повністю увійшла в дію в червні 2004 року, хоча невдовзі стало зрозуміло, що їм потрібно значно більше місця, ніж на ній.<ref>{{Cite web|url=https://archive.org/web/petabox.php|title=Internet Archive: Petabox|website=archive.org|language=en|accessdate=October 25, 2018}}</ref><ref>{{Cite news|url=http://news.zdnet.com/2100-9584_22-5808754.html|title=Big storage on the cheap|last=Kanellos|first=Michael|date=July 29, 2005|accessdate=July 29, 2007|archiveurl=https://web.archive.org/web/20070403030705/http://news.zdnet.com/2100-9584_22-5808754.html <!-- Bot retrieved archive -->|archivedate=April 3, 2007|publisher=CNET News.com}}</ref>
Разом з розвитком технології впродовж років зростала й місткість сховища Wayback Machine. У 2003 році, через два роки після того, як доступ став публічним, Wayback Machine зростала зі швидкістю 12 терабайтів на місяць. Дані зберігаються на rack systems custom [[PetaBox]], розробленій співробітниками інтернет-архіву. Перша стійка 100ТВ повністю увійшла в дію в червні 2004 року, хоча невдовзі стало зрозуміло, що їм потрібно значно більше місця, ніж на ній<ref>{{Cite web|url=https://archive.org/web/petabox.php|title=Internet Archive: Petabox|website=archive.org|language=en|accessdate=October 25, 2018}}</ref><ref>{{Cite news|url=http://news.zdnet.com/2100-9584_22-5808754.html|title=Big storage on the cheap|last=Kanellos|first=Michael|date=July 29, 2005|accessdate=July 29, 2007|archiveurl=https://web.archive.org/web/20070403030705/http://news.zdnet.com/2100-9584_22-5808754.html <!-- Bot retrieved archive -->|archivedate=April 3, 2007|publisher=CNET News.com}}</ref>.


2009 року Інтернет-архів перевів свою клієнтську архітектуру зберігання в {{iw|Sun Open Storage||}}, і утримує новий центр обробки даних у {{iw|Sun Modular Datacenter}} у каліфорнійському кампусі [[Sun Microsystems]].<ref>{{Cite web|title=Internet Archive and Sun Microsystems Create Living History of the Internet|publisher=[[Sun Microsystems]]|date=March 25, 2009|url=http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|accessdate=March 27, 2009|deadurl=no|archiveurl=https://web.archive.org/web/20090326200212/http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|archivedate=March 26, 2009}}</ref> {{Станом на|2009}} Wayback Machine містила приблизно три [[петабайт]]и даних і зростала зі швидкістю 100 [[терабайт]] на місяць.<ref>{{Cite news|url=http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|title=Internet Archive to unveil massive Wayback Machine data center|last=Mearian|first=Lucas|date=March 19, 2009|accessdate=March 22, 2009|archiveurl=https://web.archive.org/web/20090323093002/http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|archivedate=March 23, 2009|publisher=Computerworld.com}}</ref>
2009 року Інтернет-архів перевів свою клієнтську архітектуру зберігання в {{iw|Sun Open Storage||}}, і утримує новий центр обробки даних у {{iw|Sun Modular Datacenter}} у каліфорнійському кампусі [[Sun Microsystems]]<ref>{{Cite web|title=Internet Archive and Sun Microsystems Create Living History of the Internet|publisher=[[Sun Microsystems]]|date=March 25, 2009|url=http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|accessdate=March 27, 2009|deadurl=no|archiveurl=https://web.archive.org/web/20090326200212/http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|archivedate=March 26, 2009}}</ref>. {{Станом на|2009}} Wayback Machine містила приблизно три [[петабайт]]и даних і зростала зі швидкістю 100 [[терабайт]] на місяць<ref>{{Cite news|url=http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|title=Internet Archive to unveil massive Wayback Machine data center|last=Mearian|first=Lucas|date=March 19, 2009|accessdate=March 22, 2009|archiveurl=https://web.archive.org/web/20090323093002/http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|archivedate=March 23, 2009|publisher=Computerworld.com}}</ref>.


Нова, поліпшена версія Wayback Machine, з оновленим інтерфейсом і свіжішим індексом архівних матеріалів, стала доступною для публічного тестування у 2011 році.<ref name="WordpressArchive">{{Cite web|title=Updated Wayback Machine in Beta Testing|url=http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|publisher=Archive.org|accessdate=August 19, 2011|deadurl=no|archiveurl=https://web.archive.org/web/20110823040310/http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|archivedate=August 23, 2011}}</ref> У березні того самого року на форумі Wayback Machine було сказано, що "бета-версія нової Wayback Machine має повніший і актуальніший покажчик всіх обійдених матеріалів до 2010 року, й продовжить регулярно оновлюватися. Покажчик, який управляв старою Wayback Machine, має небагато матеріалів після 2008 року, і жодних його подальших оновлень не планується, оскільки його мають згорнути цього року".<ref>{{Cite web|url=https://www.archive.org/post/350738/updated-wayback-machine-in-beta-testing|title=Beta Wayback Machine, in forum|publisher=Archive.org|date=|accessdate=April 16, 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140417082107/https://archive.org/post/350738/updated-wayback-machine-in-beta-testing|archivedate=April 17, 2014}}</ref> Також 2011 року інтернет-архів встановив свою шосту пару стійок PetaBox, що дозволило збільшити ємність Wayback Machine на 700 терабайт.<ref>{{Cite web|url=https://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|title=Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used|website=archive.org|language=en|accessdate=October 25, 2018|archiveurl=https://web.archive.org/web/20161024144627/http://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|archivedate=October 24, 2016|deadurl=no}}</ref>
Нова, поліпшена версія Wayback Machine, з оновленим інтерфейсом і свіжішим індексом архівних матеріалів, стала доступною для публічного тестування у 2011 році<ref name="WordpressArchive">{{Cite web|title=Updated Wayback Machine in Beta Testing|url=http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|publisher=Archive.org|accessdate=August 19, 2011|deadurl=no|archiveurl=https://web.archive.org/web/20110823040310/http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|archivedate=August 23, 2011}}</ref>. У березні того самого року на форумі Wayback Machine було сказано, що "бета-версія нової Wayback Machine має повніший і актуальніший покажчик всіх обійдених матеріалів до 2010 року, й продовжить регулярно оновлюватися. Покажчик, який управляв старою Wayback Machine, має небагато матеріалів після 2008 року, і жодних його подальших оновлень не планується, оскільки його мають згорнути цього року"<ref>{{Cite web|url=https://www.archive.org/post/350738/updated-wayback-machine-in-beta-testing|title=Beta Wayback Machine, in forum|publisher=Archive.org|date=|accessdate=April 16, 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140417082107/https://archive.org/post/350738/updated-wayback-machine-in-beta-testing|archivedate=April 17, 2014}}</ref>. Також 2011 року інтернет-архів встановив свою шосту пару стійок PetaBox, що дозволило збільшити ємність Wayback Machine на 700 терабайт<ref>{{Cite web|url=https://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|title=Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used|website=archive.org|language=en|accessdate=October 25, 2018|archiveurl=https://web.archive.org/web/20161024144627/http://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|archivedate=October 24, 2016|deadurl=no}}</ref>.


У січні 2013 року, компанія оголосила про нову віху 240 мільярдів URL-адрес.<ref>{{Cite web|url=http://blog.archive.org/2013/01/09/updated-wayback/|title=Wayback Machine: Now with 240,000,000,000 URLs &#124; Internet Archive Blogs|publisher=Blog.archive.org|date=January 9, 2013|accessdate=April 16, 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140414221120/http://blog.archive.org/2013/01/09/updated-wayback/|archivedate=April 14, 2014}}</ref> В жовтні 2013 року компанія оголосила про функцію "Save a Page"<ref name="ia-2013-10">{{Cite web|url=https://blog.archive.org/2013/10/25/fixing-broken-links/|title=Fixing Broken Links on the Internet|last=Rossi|first=Alexis|date=October 25, 2013|website=archive.org|publisher=Collections Team, the Internet Archive|location=San Francisco, CA, US|archiveurl=https://web.archive.org/web/20141107193437/http://blog.archive.org/2013/10/25/fixing-broken-links/|archivedate=November 7, 2014|deadurl=no|accessdate=March 25, 2015|quote=We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.}}</ref>, яка дозволяє будь-якому користувачеві мережі Інтернет заархівувати вміст URL-адреси. Це стало загрозою зловживань з боку сервісу як {{нп|Drive-by download|хостингу шкідливих двійкових файлів|en|Drive-by download}}.<ref name="vt-207-241">{{Cite web|url=https://www.virustotal.com/en/ip-address/207.241.226.190/information/|title=207.241.226.190 IP address information|last=The VirusTotal Team|date=March 25, 2015|website=virustotal.com|publisher=[[VirusTotal]]|location=Dublin 2, Ireland|archiveurl=https://web.archive.org/web/20140714232311/https://www.virustotal.com/en/ip-address/207.241.226.190/information/|archivedate=July 14, 2014|deadurl=no|accessdate=March 25, 2015|quote=2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe}}</ref><ref name="goog-sb-ia1">{{Cite web|url=http://www.google.com/safebrowsing/diagnostic?site=archive.org|title=Safe Browsing Diagnostic page for archive.org|last=Advisory provided by Google|date=March 25, 2015|website=google.com/safebrowsing|publisher=[[Google]]|location=Mountain View, CA, US|deadurl=no|accessdate=March 25, 2015|quote=2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).|archiveurl=https://web.archive.org/web/20150406101743/http://www.google.com/safebrowsing/diagnostic?site=archive.org|archivedate=April 6, 2015}}</ref>
У січні 2013 року, компанія оголосила про нову віху 240 мільярдів URL-адрес<ref>{{Cite web|url=http://blog.archive.org/2013/01/09/updated-wayback/|title=Wayback Machine: Now with 240,000,000,000 URLs &#124; Internet Archive Blogs|publisher=Blog.archive.org|date=January 9, 2013|accessdate=April 16, 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140414221120/http://blog.archive.org/2013/01/09/updated-wayback/|archivedate=April 14, 2014}}</ref>. У жовтні 2013 року компанія оголосила про функцію "Save a Page"<ref name="ia-2013-10">{{Cite web|url=https://blog.archive.org/2013/10/25/fixing-broken-links/|title=Fixing Broken Links on the Internet|last=Rossi|first=Alexis|date=October 25, 2013|website=archive.org|publisher=Collections Team, the Internet Archive|location=San Francisco, CA, US|archiveurl=https://web.archive.org/web/20141107193437/http://blog.archive.org/2013/10/25/fixing-broken-links/|archivedate=November 7, 2014|deadurl=no|accessdate=March 25, 2015|quote=We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.}}</ref>, яка дозволяє будь-якому користувачеві мережі Інтернет заархівувати вміст URL-адреси. Це стало загрозою зловживань з боку сервісу як {{нп|Drive-by download|хостингу шкідливих двійкових файлів|en|Drive-by download}}<ref name="vt-207-241">{{Cite web|url=https://www.virustotal.com/en/ip-address/207.241.226.190/information/|title=207.241.226.190 IP address information|last=The VirusTotal Team|date=March 25, 2015|website=virustotal.com|publisher=[[VirusTotal]]|location=Dublin 2, Ireland|archiveurl=https://web.archive.org/web/20140714232311/https://www.virustotal.com/en/ip-address/207.241.226.190/information/|archivedate=July 14, 2014|deadurl=no|accessdate=March 25, 2015|quote=2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe}}</ref><ref name="goog-sb-ia1">{{Cite web|url=http://www.google.com/safebrowsing/diagnostic?site=archive.org|title=Safe Browsing Diagnostic page for archive.org|last=Advisory provided by Google|date=March 25, 2015|website=google.com/safebrowsing|publisher=[[Google]]|location=Mountain View, CA, US|deadurl=no|accessdate=March 25, 2015|quote=2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).|archiveurl=https://web.archive.org/web/20150406101743/http://www.google.com/safebrowsing/diagnostic?site=archive.org|archivedate=April 6, 2015}}</ref>.


{{Станом на|2014|12}} Wayback Machine містила 435 мільярдів веб-сторінок обсягом майже дев'ять петабайтів, і зростала приблизно на 20 терабайтів щотижня.<ref>{{Cite web|title=Internet Archive Frequently Asked Questions|url=https://archive.org/about/faqs.php|date=|accessdate=January 17, 2015|deadurl=no|archiveurl=https://web.archive.org/web/20091021003552/https://archive.org/about/faqs.php|archivedate=October 21, 2009}}</ref><ref name="Arora (2015)">{{Cite journal}}</ref><ref>{{Cite web|url=https://archive.org/about/faqs.php|archiveurl=https://web.archive.org/web/20141218203115/https://archive.org/about/faqs.php|deadurl=yes|archivedate=December 18, 2014|title=Internet Archive Frequently Asked Questions|date=December 18, 2014|accessdate=December 13, 2018}}</ref>
{{Станом на|2014|12}} Wayback Machine містила 435 мільярдів веб-сторінок обсягом майже дев'ять петабайтів, і зростала приблизно на 20 терабайтів щотижня<ref>{{Cite web|title=Internet Archive Frequently Asked Questions|url=https://archive.org/about/faqs.php|date=|accessdate=January 17, 2015|deadurl=no|archiveurl=https://web.archive.org/web/20091021003552/https://archive.org/about/faqs.php|archivedate=October 21, 2009}}</ref><ref name="Arora (2015)">{{cite journal |last=Arora |first=Sanjay K. |last2=Li |first2=Yin |last3=Youtie |first3=Jan |last4=Shapira |first4=Philip |date=May 5, 2015 |title=Using the wayback machine to mine websites in the social sciences: A methodological resource |journal=Journal of the Association for Information Science and Technology |language=en |volume=67 |issue=8 |pages=1904–1915 |doi=10.1002/asi.23503 |issn=2330-1635}}</ref><ref>{{Cite web|url=https://archive.org/about/faqs.php|archiveurl=https://web.archive.org/web/20141218203115/https://archive.org/about/faqs.php|deadurl=yes|archivedate=December 18, 2014|title=Internet Archive Frequently Asked Questions|date=December 18, 2014|accessdate=December 13, 2018}}</ref>.


{{Станом на|2016|19}} Wayback Machine містила близько 15 петабайт даних.<ref>{{Cite web|title=Can the manipulation of big data change the way the world thinks?|website=The National|url=http://www.thenational.ae/opinion/comment/can-the-manipulation-of-big-data-change-the-way-the-world-thinks|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170112060354/http://www.thenational.ae/opinion/comment/can-the-manipulation-of-big-data-change-the-way-the-world-thinks|archivedate=January 12, 2017}}</ref>
{{Станом на|2016|19}} Wayback Machine містила близько 15 петабайт даних<ref>{{Cite web|title=Can the manipulation of big data change the way the world thinks?|website=The National|url=http://www.thenational.ae/opinion/comment/can-the-manipulation-of-big-data-change-the-way-the-world-thinks|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170112060354/http://www.thenational.ae/opinion/comment/can-the-manipulation-of-big-data-change-the-way-the-world-thinks|archivedate=January 12, 2017}}</ref>.


Станом на вересень 2018 року Wayback Machine містила понад 25 петабайтів даних.<ref>{{Cite news|url=https://thehustle.co/inside-wayback-machine-internet-archive|title=Inside Wayback Machine, the internet’s time capsule|last=Crockett|first=Zachary|date=September 28, 2018|work=The Hustle|accessdate=October 26, 2018|language=en-US|archiveurl=https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive|archivedate=October 2, 2018|deadurl=no}}</ref><ref>{{Cite news|url=https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|title=Things Break and Decay on the Internet—That's a Good Thing|last=Heffernan|first=Virginia|date=September 18, 2018|work=WIRED|accessdate=October 26, 2018|language=en-US|archiveurl=https://web.archive.org/web/20180925130510/https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|archivedate=September 25, 2018|deadurl=no}}</ref>
Станом на вересень 2018 року Wayback Machine містила понад 25 петабайтів даних<ref>{{Cite news|url=https://thehustle.co/inside-wayback-machine-internet-archive|title=Inside Wayback Machine, the internet’s time capsule|last=Crockett|first=Zachary|date=September 28, 2018|work=The Hustle|accessdate=October 26, 2018|language=en-US|archiveurl=https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive|archivedate=October 2, 2018|deadurl=no}}</ref><ref>{{Cite news|url=https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|title=Things Break and Decay on the Internet—That's a Good Thing|last=Heffernan|first=Virginia|date=September 18, 2018|work=WIRED|accessdate=October 26, 2018|language=en-US|archiveurl=https://web.archive.org/web/20180925130510/https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|archivedate=September 25, 2018|deadurl=no}}</ref>.


=== Зростання ===
=== Зростання ===
В період з жовтня 2013 року по березень 2015 року глобальний рейтинг Alexa сайту Wayback Machine змінився зі 163<ref name="alexa-2013-10">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Info|publisher=[[Alexa Internet]]|archiveurl=https://web.archive.org/web/20131028025923/http://www.alexa.com/siteinfo/archive.org|archivedate=October 28, 2013|deadurl=yes|accessdate=October 29, 2013}}</ref> до 208.<ref name="alexa-2015-03">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Overview|publisher=Alexa Internet|archiveurl=https://web.archive.org/web/20150409101131/http://www.alexa.com/siteinfo/archive.org|archivedate=April 9, 2015|deadurl=yes<!-- set to yes, because the alexa page will show a new current rank, not the as-of-date rank, invalidating this reference. -->|accessdate=April 9, 2015}}</ref> У березні 2019 рейтинг був 244.<ref>{{Cite web|url=https://web.archive.org/web/20190323051243/https://www.alexa.com/siteinfo/archive.org|title=Archive.org Traffic, Demographics and Competitors - Alexa|date=2019-03-23|website=web.archive.org|accessdate=2019-04-05}}</ref>
В період з жовтня 2013 року по березень 2015 року глобальний рейтинг Alexa сайту Wayback Machine змінився зі 163<ref name="alexa-2013-10">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Info|publisher=[[Alexa Internet]]|archiveurl=https://web.archive.org/web/20131028025923/http://www.alexa.com/siteinfo/archive.org|archivedate=October 28, 2013|deadurl=yes|accessdate=October 29, 2013}}</ref> до 208<ref name="alexa-2015-03">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Overview|publisher=Alexa Internet|archiveurl=https://web.archive.org/web/20150409101131/http://www.alexa.com/siteinfo/archive.org|archivedate=April 9, 2015|deadurl=yes<!-- set to yes, because the alexa page will show a new current rank, not the as-of-date rank, invalidating this reference. -->|accessdate=April 9, 2015}}</ref>. У березні 2019 рейтинг був 244<ref>{{Cite web|url=https://web.archive.org/web/20190323051243/https://www.alexa.com/siteinfo/archive.org|title=Archive.org Traffic, Demographics and Competitors - Alexa|date=2019-03-23|website=web.archive.org|accessdate=2019-04-05}}</ref>.


{{Bar chart
{{Bar chart
Рядок 75: Рядок 75:


=== Політики виключення сайту ===
=== Політики виключення сайту ===
Історично, Wayback Machine поважав стандарт винятків для роботів ([[Robots.txt]]), визначаючи, чи сайт можна обходити чи ні; або, якщо вже робот його обійшов, то чи ці архіви будуть у відкритому доступі. Власники веб-сайту мають можливість відмовитися від послуг Wayback Machine за допомогою robots.txt. Правила robots.txt застосовуються заднім числом; якщо сайт заблокував інтернет-архів, то всі раніше архівні сторінки з цього домену також негайно стають недоступними. Крім того, в Internet Archive заявили, що "іноді власник сайту зв'язується з нами і просить нас зупинити сканування та архівацію сайту. Ми виконуємо ці запити".<ref>[https://web.archive.org/collections/web/faqs.html#exclusions Some sites are not available because of Robots.txt or other exclusions] {{Webarchive}}</ref> На додаток, на сайті написано: "Інтернет-архів не зацікавлений у збереженні або наданні доступу до веб-сайту або інших інтернет-документів від осіб, які не хочуть, щоб їх матеріали були в зібранні."<ref>[https://www.archive.org/about/faqs.php#2 How can I remove my site's pages from the Wayback Machine?] {{Webarchive}}</ref><ref>{{Cite news|url=https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy|title=The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers|last=Cox|first=Joseph|date=May 22, 2018|accessdate=May 23, 2018|archiveurl=https://archive.is/20180522192132/https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy|archivedate=May 23, 2018|deadurl=no}}</ref>
Історично, Wayback Machine поважав стандарт винятків для роботів ([[Robots.txt]]), визначаючи, чи сайт можна обходити чи ні; або, якщо вже робот його обійшов, то чи ці архіви будуть у відкритому доступі. Власники веб-сайту мають можливість відмовитися від послуг Wayback Machine за допомогою robots.txt. Правила robots.txt застосовуються заднім числом; якщо сайт заблокував інтернет-архів, то всі раніше архівні сторінки з цього домену також негайно стають недоступними. Крім того, в Internet Archive заявили, що "іноді власник сайту зв'язується з нами і просить нас зупинити сканування та архівацію сайту. Ми виконуємо ці запити"<ref>[https://web.archive.org/collections/web/faqs.html#exclusions Some sites are not available because of Robots.txt or other exclusions] {{Webarchive}}</ref> На додаток, на сайті написано: "Інтернет-архів не зацікавлений у збереженні або наданні доступу до веб-сайту або інших інтернет-документів від осіб, які не хочуть, щоб їх матеріали були в зібранні."<ref>[https://www.archive.org/about/faqs.php#2 How can I remove my site's pages from the Wayback Machine?] {{webarchive |url=https://web.archive.org/web/20140417122600/https://archive.org/about/faqs.php |date=April 17, 2014}}</ref><ref>{{Cite news|url=https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy|title=The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers|last=Cox|first=Joseph|date=May 22, 2018|accessdate=May 23, 2018|archiveurl=https://archive.is/20180522192132/https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy|archivedate=May 23, 2018|deadurl=no}}</ref>


==== Оклендська архівна політика ====
==== Оклендська архівна політика ====
Політика винятку заднім числом Wayback Machine частково ґрунтується на ''рекомендаціях з управління запитами на вилучення і збереження архівної цілісності'' ({{lang-en|Recommendations for Managing Removal Requests and Preserving Archival Integrity}}), опублікованих Школою інформаційного управління і системам в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі) у 2002 році, який дає право власнику сайту заблокувати доступ до архіву сайту.<ref>{{Cite web|title=Recommendations for Managing Removal Requests And Preserving Archival Integrity|date=December 14, 2002|publisher=[[University of California]]|url=http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|accessdate=September 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170918025220/http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|archivedate=September 18, 2017}}</ref> Wayback дотримується цієї політики, щоб за можливості уникнути дорогих судових розглядів.<ref>{{Cite web|title=Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy|date=July 7, 2014|publisher=Internet Archive|url=https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|accessdate=September 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171010124036/https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|archivedate=October 10, 2017}}</ref>
Політика винятку заднім числом Wayback Machine частково ґрунтується на ''рекомендаціях з управління запитами на вилучення і збереження архівної цілісності'' ({{lang-en|Recommendations for Managing Removal Requests and Preserving Archival Integrity}}), опублікованих Школою інформаційного управління і системам в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі) у 2002 році, який дає право власнику сайту заблокувати доступ до архіву сайту<ref>{{Cite web|title=Recommendations for Managing Removal Requests And Preserving Archival Integrity|date=December 14, 2002|publisher=[[University of California]]|url=http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|accessdate=September 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170918025220/http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|archivedate=September 18, 2017}}</ref>. Wayback дотримується цієї політики, щоб за можливості уникнути дорогих судових розглядів<ref>{{Cite web|title=Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy|date=July 7, 2014|publisher=Internet Archive|url=https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|accessdate=September 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171010124036/https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|archivedate=October 10, 2017}}</ref>.


Політика винятку заднім числом Wayback почала послаблюватися 2017 року, коли він перестав зважати на файли robots.txt на американських урядових і військових веб-сайтах як для їх сканування, так і показу відсканованих веб-сторінок. Станом на квітень 2017 Wayback ігнорує robots.txt в ширших межах, не тільки для урядових сайтів США.<ref>{{Cite web|url=http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|title=Robots.txt meant for search engines don't work well for web archives|website=Internet Archive Blogs|last=Mark Graham|date=April 17, 2017|accessdate=April 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170417131508/http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|archivedate=April 17, 2017}}</ref><ref>{{Cite web|title=Archivierung des Internets: Internet Archive ignoriert künftig robots.txt|url=https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|publisher=heise online|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20170427035659/https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|archivedate=April 27, 2017}}</ref><ref>{{Cite web|title=Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de|url=https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20170619210648/https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|archivedate=June 19, 2017}}</ref><ref>{{Cite web|title=Internet Archive will ignore robots.txt files to keep historical record accurate|url=https://www.digitaltrends.com/computing/internet-archive-robots-txt/|publisher=Digital Trends|accessdate=May 14, 2017|date=April 24, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170516130029/https://www.digitaltrends.com/computing/internet-archive-robots-txt/|archivedate=May 16, 2017}}</ref>
Політика винятку заднім числом Wayback почала послаблюватися 2017 року, коли він перестав зважати на файли robots.txt на американських урядових і військових веб-сайтах як для їх сканування, так і показу відсканованих веб-сторінок. Станом на квітень 2017 Wayback ігнорує robots.txt в ширших межах, не тільки для урядових сайтів США<ref>{{Cite web|url=http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|title=Robots.txt meant for search engines don't work well for web archives|website=Internet Archive Blogs|last=Mark Graham|date=April 17, 2017|accessdate=April 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170417131508/http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|archivedate=April 17, 2017}}</ref><ref>{{Cite web|title=Archivierung des Internets: Internet Archive ignoriert künftig robots.txt|url=https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|publisher=heise online|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20170427035659/https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|archivedate=April 27, 2017}}</ref><ref>{{Cite web|title=Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de|url=https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20170619210648/https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|archivedate=June 19, 2017}}</ref><ref>{{Cite web|title=Internet Archive will ignore robots.txt files to keep historical record accurate|url=https://www.digitaltrends.com/computing/internet-archive-robots-txt/|publisher=Digital Trends|accessdate=May 14, 2017|date=April 24, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170516130029/https://www.digitaltrends.com/computing/internet-archive-robots-txt/|archivedate=May 16, 2017}}</ref>.


== Використання ==
== Використання ==
Починаючи з публічного запуску 2001 року, науковці вивчали Wayback Machine як у сенсі способів, якими вона зберігає збирає дані, так і самі сторінки, що містяться в її архіві. Станом на 2013 рік науковці написали близько 350 статей про Wayback Machine, здебільшого в галузях інформаційних технологій, бібліотекознавства та суспільних наук. Представники суспільних наук скористалися Wayback Machine, щоб проаналізувати, як розвиток веб-сайтів, починаючи з середини 1990-х років і до теперішнього часу вплинув на зростання компаній.<ref name="Arora (2015)">{{Cite journal}}</ref>
Починаючи з публічного запуску 2001 року, науковці вивчали Wayback Machine як у сенсі способів, якими вона зберігає збирає дані, так і самі сторінки, що містяться в її архіві. Станом на 2013 рік науковці написали близько 350 статей про Wayback Machine, здебільшого в галузях інформаційних технологій, бібліотекознавства та суспільних наук. Представники суспільних наук скористалися Wayback Machine, щоб проаналізувати, як розвиток веб-сайтів, починаючи з середини 1990-х років і до теперішнього часу вплинув на зростання компаній<ref name="Arora (2015)" />.


Коли машина Wayback архівує сторінку, вона зазвичай містить більшість гіперпосилань, зберігаючи ці посилання активними, коли вони так само легко могли бути порушені нестабільністю Інтернету. Індійські вчені вивчали ефективність здатності Wayback Machine зберігати гіперпосилання наукових онлайн-публікацій і визначили, що вона зберігає трохи більш як половину з них.<ref>{{Cite journal}}</ref>
Коли Wayback Machine архівує сторінку, вона зазвичай містить більшість гіперпосилань, зберігаючи ці посилання активними, коли вони так само легко могли бути порушені нестабільністю Інтернету. Індійські вчені вивчали ефективність здатності Wayback Machine зберігати гіперпосилання наукових онлайн-публікацій і визначили, що вона зберігає трохи більш як половину з них<ref>{{cite journal |last=Sampath Kumar |first=B.T. |last2=Prithviraj |first2=K.R. |date=October 21, 2014 |title=Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs |journal=Journal of Information Science |language=en |volume=41 |issue=1 |pages=71–81 |doi=10.1177/0165551514552752 |issn=0165-5515}}</ref>.


Журналісти використовують Wayback Machine, щоб переглядати мертві сайти, застарілі новини і зміни в змісті сайту. Його зміст використовують, щоб притягати політиків до відповідальності й викривати брехню на полі бою.<ref name="usn1">{{Cite web|url=https://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|title=Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed|archiveurl=https://web.archive.org/web/20170106151933/http://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|archivedate=January 6, 2017|deadurl=no|accessdate=May 14, 2017}}</ref> 2014 року архівна сторінка [[Гіркін Ігор Всеволодович|Ігоря Гіркина]] в соціальній мережі засвідчила як він хвалиться, що його бійці [[Збиття Boeing 777 біля Донецька|збили нібито український військовий літак перед тим як стало відомо, що насправді це цивільний літак Малайзійських авіаліній]], після чого він видалив пост і звинуватив українських військових у знищенні літака.<ref name="usn1" /><ref>{{Cite web|title=What the Web Said Yesterday|url=http://www.newyorker.com/magazine/2015/01/26/cobweb|publisher=The New Yorker|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20150125141230/http://www.newyorker.com/magazine/2015/01/26/cobweb|archivedate=January 25, 2015}}</ref> [[Марш за науку]] в березні 2017 року розпочався з обговорення на [[Reddit]], яке показало, що хтось відвідав Archive.org і виявив, що всі посилання на [[Зміна клімату|зміну клімату]] на сайті Білого дому, з нього вилучено. У відповідь один з користувачів прокоментував так: "Має бути марш науковців на Вашингтон".<ref>{{Cite web|title=The March for Science began with this person's 'throwaway line' on Reddit|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|publisher=Washington Post|accessdate=April 23, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170423081417/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|archivedate=April 23, 2017}}</ref><ref name=":1">{{Cite web|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|title=Are scientists going to march on Washington?|website=The Washington Post|accessdate=January 31, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170131152535/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|archivedate=January 31, 2017}}</ref><ref>{{Cite web|last=Foley|first=Katherine Ellen|title=The global March for Science started with a single Reddit thread|url=https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|publisher=Quartz|accessdate=April 23, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170424004314/https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|archivedate=April 24, 2017}}</ref>
Журналісти використовують Wayback Machine, щоб переглядати мертві сайти, застарілі новини і зміни в змісті сайту. Його зміст використовують, щоб притягати політиків до відповідальності й викривати брехню на полі бою<ref name="usn1">{{Cite web|url=https://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|title=Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed|archiveurl=https://web.archive.org/web/20170106151933/http://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|archivedate=January 6, 2017|deadurl=no|accessdate=May 14, 2017}}</ref>. 2014 року архівна сторінка [[Гіркін Ігор Всеволодович|Ігоря Гіркина]] в соціальній мережі засвідчила як він хвалиться, що його бійці [[Збиття Boeing 777 біля Донецька|збили нібито український військовий літак перед тим як стало відомо, що насправді це цивільний літак Малайзійських авіаліній]], після чого він видалив пост і звинуватив українських військових у знищенні літака<ref name="usn1" /><ref>{{Cite web|title=What the Web Said Yesterday|url=http://www.newyorker.com/magazine/2015/01/26/cobweb|publisher=The New Yorker|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20150125141230/http://www.newyorker.com/magazine/2015/01/26/cobweb|archivedate=January 25, 2015}}</ref>. [[Марш за науку]] в березні 2017 року розпочався з обговорення на [[Reddit]], яке показало, що хтось відвідав Archive.org і виявив, що всі посилання на [[Зміна клімату|зміну клімату]] на сайті Білого дому, з нього вилучено. У відповідь один з користувачів прокоментував так: "Має бути марш науковців на Вашингтон"<ref>{{Cite web|title=The March for Science began with this person's 'throwaway line' on Reddit|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|publisher=Washington Post|accessdate=April 23, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170423081417/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|archivedate=April 23, 2017}}</ref><ref name=":1">{{Cite web|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|title=Are scientists going to march on Washington?|website=The Washington Post|accessdate=January 31, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170131152535/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|archivedate=January 31, 2017}}</ref><ref>{{Cite web|last=Foley|first=Katherine Ellen|title=The global March for Science started with a single Reddit thread|url=https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|publisher=Quartz|accessdate=April 23, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170424004314/https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|archivedate=April 24, 2017}}</ref>.


Крім того, сайт активно використовується для верифікації, забезпечуючи [[Вікіспільнота|редакторам Вікіпедії]] доступ до посилань і можливість створювати контент. [правити]
Крім того, сайт активно використовується для верифікації, забезпечуючи [[Вікіспільнота|редакторам Вікіпедії]] доступ до посилань і можливість створювати контент.


=== Обмеження ===
=== Обмеження ===
Попри свої можливості, Wayback Machine також має деякі обмеження. У 2014 році затримка між скануванням вмісту сайтів і часом, коли він був доступним на Wayback Machine, становила шість місяців.<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|last=|first=|date=April 2, 2014|website=Internet Archive|archiveurl=https://web.archive.org/web/20140402223358/https://archive.org/about/faqs.php|archivedate=2014-04-02|deadurl=yes|accessdate=November 23, 2018}}</ref> Станом на листопад 2018 року час затримки становив від 3 до 10 годин.<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=November 23, 2018}}</ref> Wayback Machine не є "історичним Google"; користувачі мають знати URL-адреси веб-сайтів, які вони хочуть переглянути.<ref name=":4">{{Cite journal}}</ref> Вона має функцію "Site Search" (пошук сайту), яка дозволяє користувачам знайти сайт на основі слів, що описують сайт, а не слів, знайдених на самих веб-сторінках.
Попри свої можливості, Wayback Machine також має деякі обмеження. У 2014 році затримка між скануванням вмісту сайтів і часом, коли він був доступним на Wayback Machine, становила шість місяців<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|last=|first=|date=April 2, 2014|website=Internet Archive|archiveurl=https://web.archive.org/web/20140402223358/https://archive.org/about/faqs.php|archivedate=2014-04-02|deadurl=yes|accessdate=November 23, 2018}}</ref>. Станом на листопад 2018 року час затримки становив від 3 до 10 годин<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=November 23, 2018}}</ref>. Wayback Machine не є "історичним Google"; користувачі мають знати URL-адреси веб-сайтів, які вони хочуть переглянути<ref name=":4" />. Вона має функцію "Site Search" (пошук сайту), яка дозволяє користувачам знайти сайт на основі слів, що описують сайт, а не слів, знайдених на самих веб-сторінках.


Wayback Machine не не містить усіх сторінок, коли-небудь створених, через обмеження свого веб-краулера. Wayback Machine не може повністю архівувати веб-сторінки, які містять інтерактивні функції, такі як Флеш-платформи і форми, написані на JavaScript, бо ці функції вимагають взаємодії з хост-сайтом. Веб-краулер має тружнощі з витягуванням усього, що закодовано не в HTML (або одному з його варіантів), що часто призводить до зламаних гіперпосилань та відсутніх зображень. Крім того, веб-краулер не архівує "сторінок-сиріт", які не містять посилань на інші сторінки.<ref name=":2">{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=October 18, 2018|archiveurl=https://web.archive.org/web/20130420213122/http://archive.org/about/faqs.php|archivedate=April 20, 2013|deadurl=no}}</ref><ref name=":4">{{Cite journal}}</ref> Конкретні правила, що регулюють краулер Wayback Machine, можуть дослідити лише наперед визначену кількість гіперпосилань, ґрунтуючись на наперед заданому обмеженні глибини, тому він не може архівувати всі гіперпосилання на кожній сторінці.<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref>
Wayback Machine не не містить усіх сторінок, коли-небудь створених, через обмеження свого веб-краулера. Wayback Machine не може повністю архівувати веб-сторінки, які містять інтерактивні функції, такі як Флеш-платформи і форми, написані на JavaScript, бо ці функції вимагають взаємодії з хост-сайтом. Веб-краулер має тружнощі з витягуванням усього, що закодовано не в HTML (або одному з його варіантів), що часто призводить до зламаних гіперпосилань та відсутніх зображень. Крім того, веб-краулер не архівує "сторінок-сиріт", які не містять посилань на інші сторінки<ref name=":2">{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=October 18, 2018|archiveurl=https://web.archive.org/web/20130420213122/http://archive.org/about/faqs.php|archivedate=April 20, 2013|deadurl=no}}</ref><ref name=":4">{{cite journal |last=Bates |first=Mary Ellen |date=2002 |title=The Wayback Machine |url= |journal=Online |volume=26 |pages=80 |via=EBSCOhost}}</ref>. Конкретні правила, що регулюють краулер Wayback Machine, можуть дослідити лише наперед визначену кількість гіперпосилань, ґрунтуючись на наперед заданому обмеженні глибини, тому він не може архівувати всі гіперпосилання на кожній сторінці<ref name=":3" />.


Деякі власники поміщають на свій сайт файл robot.txt, який не дозволяє Wayback Machine знаходити та архівувати їх. Крім того, власники веб-сайтів також можуть безпосередньо зв'язатися з Інтернет-архівом і просити, щоб їх сторінки було вилучено з архіву.<ref name=":2">{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=October 18, 2018|archiveurl=https://web.archive.org/web/20130420213122/http://archive.org/about/faqs.php|archivedate=April 20, 2013|deadurl=no}}</ref>
Деякі власники поміщають на свій сайт файл robot.txt, який не дозволяє Wayback Machine знаходити та архівувати їх. Крім того, власники веб-сайтів також можуть безпосередньо зв'язатися з Інтернет-архівом і просити, щоб їх сторінки було вилучено з архіву<ref name=":2" />.


=== Як юридичні докази ===
=== Як юридичні докази ===
Рядок 103: Рядок 103:


===== Netbula LLC проти Chordiant Software Inc. =====
===== Netbula LLC проти Chordiant Software Inc. =====
У справі 2009 року ''Netbula, LLC проти Chordiant Software Inc'' відповідач Chordiant подав клопотання, щоб Netbula на своєму сайті вимкнула файл [[robots.txt]], який змушував Wayback Machine заднім числом закривати доступ до попередніх версій сторінок, заархівованих з сайту Netbula, які, на думку Chordiant могли б підтримати її справу.<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>
У справі 2009 року ''Netbula, LLC проти Chordiant Software Inc'' відповідач Chordiant подав клопотання, щоб Netbula на своєму сайті вимкнула файл [[robots.txt]], який змушував Wayback Machine заднім числом закривати доступ до попередніх версій сторінок, заархівованих з сайту Netbula, які, на думку Chordiant могли б підтримати її справу<ref name="howard_lloyd"/>.


Netbula заперечила проти цього клопотання на тій підставі, що відповідач зверталися з проханням змінити сайт Netbula і що він мав би безпосередньо звернутися до Архіву Інтернету за сторінками.<ref name="antonio_cortes">{{Cite web|last=Cortes|first=Antonio|date=October 2009|title=Motion Opposing Removal of Robots.txt|url=http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE/|accessdate=October 15, 2009|deadurl=no|archiveurl=https://web.archive.org/web/20101027050350/http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE|archivedate=October 27, 2010}}</ref> Проте, співробітник Інтернет-архіву подав заяву під присягою, якою підтримав дію Chordiant, заявивши, що він не може видати веб-сторінки за допомогою інших засобів "без значного навантаження, витрат і перебоїв у його роботі."<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>
Netbula заперечила проти цього клопотання на тій підставі, що відповідач зверталися з проханням змінити сайт Netbula і що він мав би безпосередньо звернутися до Архіву Інтернету за сторінками<ref name="antonio_cortes">{{Cite web|last=Cortes|first=Antonio|date=October 2009|title=Motion Opposing Removal of Robots.txt|url=http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE/|accessdate=October 15, 2009|deadurl=no|archiveurl=https://web.archive.org/web/20101027050350/http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE|archivedate=October 27, 2010}}</ref>. Проте, співробітник Інтернет-архіву подав заяву під присягою, якою підтримав дію Chordiant, заявивши, що він не може видати веб-сторінки за допомогою інших засобів "без значного навантаження, витрат і перебоїв у його роботі"<ref name="howard_lloyd"/>.


Суддя Говард Ллойд у Північному окрузі Каліфорнії, відділі Сан-Хосе, відхилив доводи Netbula і наказав їм тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отримали архівні сторінки, які їм були потрібні.<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>
Суддя Говард Ллойд у Північному окрузі Каліфорнії, відділі Сан-Хосе, відхилив доводи Netbula і наказав їм тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отримали архівні сторінки, які їм були потрібні<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>.


===== Telewizja Polska =====
===== Telewizja Polska =====
У жовтні 2004 року у справі ''[[TVP|Telewizja Polska USA, Inc.]] проти Echostar Satellite'', No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004), позивач намагався використати Wayback Machine як джерело допустимих доказів, мабуть, вперше. Компанії Telewizja Polska є провайдером {{нп|TVP Polonia||en|TVP Polonia}} і {{iw|EchoStar||}}, яка управляє [[Dish Network]]. До початку судового розгляду, EchoStar вказала, що має намір запропонувати знімки Wayback Machine як доказ минулого змісту сайту Telewizja Polska. Компанії Telewizja Polska і подала ''{{нп|Клопотання in limine||en|Motion in limine}}'', щоб не дати хід знімкам на тій підставі, що нібито це {{нп|Чутки (право)|чутки|en|Hearsay}} і неперевірене джерело, але суддя Арландер, відхилив твердження Telewizja Polska, що нібито це чутки й відмовив у клопотанні ''in limine'' щодо виключення доказів у суді.<ref name="gelman">{{Cite journal}}</ref><ref name="howell">{{Cite journal}}</ref>
У жовтні 2004 року у справі ''[[TVP|Telewizja Polska USA, Inc.]] проти Echostar Satellite'', No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004), позивач намагався використати Wayback Machine як джерело допустимих доказів, мабуть, вперше. Компанії Telewizja Polska є провайдером {{нп|TVP Polonia||en|TVP Polonia}} і {{iw|EchoStar||}}, яка управляє [[Dish Network]]. До початку судового розгляду, EchoStar вказала, що має намір запропонувати знімки Wayback Machine як доказ минулого змісту сайту Telewizja Polska. Компанії Telewizja Polska і подала ''{{нп|Клопотання in limine||en|Motion in limine}}'', щоб не дати хід знімкам на тій підставі, що нібито це {{нп|Чутки (право)|чутки|en|Hearsay}} і неперевірене джерело, але суддя Арландер, відхилив твердження Telewizja Polska, що нібито це чутки й відмовив у клопотанні ''in limine'' щодо виключення доказів у суді<ref name="gelman">{{cite journal |last=Gelman |first=Lauren |date=November 17, 2004 |title=Internet Archive's Web Page Snapshots Held Admissible as Evidence |journal=Packets |volume=2 |issue=3 |url=http://cyberlaw.stanford.edu/packets002728.shtml |accessdate=January 4, 2007 |archive-url=https://web.archive.org/web/20110430095339/http://cyberlaw.stanford.edu/packets002728.shtml |archive-date=April 30, 2011 |dead-url=no |df= }}</ref><ref name="howell">{{cite journal |last=Howell |first=Beryl A. |date=February 2006 |title=Proving Web History: How to use the Internet Archive |journal=Journal of Internet Law |pages=3–9 |url=http://www.strozfriedberg.com/files/Publication/fee98a34-d739-478b-a7db-6af37b757714/Presentation/PublicationAttachment/aae88469-9835-4fe4-ae5f-38637924314f/BAHPROVINGWEBHISTORY.pdf |archive-url=https://web.archive.org/web/20100705043226/http://www.strozfriedberg.com/files/Publication/fee98a34-d739-478b-a7db-6af37b757714/Presentation/PublicationAttachment/aae88469-9835-4fe4-ae5f-38637924314f/BAHPROVINGWEBHISTORY.pdf |dead-url=yes |archive-date=July 5, 2010 |format=PDF |accessdate=August 6, 2008}}</ref>.


==== Патентне право ====
==== Патентне право ====
За умови виконання деяких додаткових вимог (наприклад, надання авторитетної заяви архіваріуса), {{нп|Відомство з патентів і торгових знаків США||en|United States patent office}} і {{нп|Європейське патентне відомство||en|European Patent Office}} приймають date stamps від Інтернет-архіву як доказ того, коли ця веб-сторінка була доступна громадськості. Ці дані використовуються для визначення, чи веб-сторінка доступна як [[Патентний пошук|prior art]], наприклад, під час розгляду заявки на патент.<ref>{{Cite web|title=Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?|last=Wynn W. Coggins|date=Fall 2002|url=http://www.uspto.gov/patents/resources/methods/aiplafall02paper.jsp|website=USPTO|deadurl=no|archiveurl=https://web.archive.org/web/20120921083344/http://www.uspto.gov/patents/resources/methods/aiplafall02paper.jsp|archivedate=September 21, 2012}}</ref>
За умови виконання деяких додаткових вимог (наприклад, надання авторитетної заяви архіваріуса), {{нп|Відомство з патентів і торгових знаків США||en|United States patent office}} і {{нп|Європейське патентне відомство||en|European Patent Office}} приймають date stamps від Інтернет-архіву як доказ того, коли ця веб-сторінка була доступна громадськості. Ці дані використовуються для визначення, чи веб-сторінка доступна як [[Патентний пошук|prior art]], наприклад, під час розгляду заявки на патент<ref>{{Cite web|title=Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?|last=Wynn W. Coggins|date=Fall 2002|url=http://www.uspto.gov/patents/resources/methods/aiplafall02paper.jsp|website=USPTO|deadurl=no|archiveurl=https://web.archive.org/web/20120921083344/http://www.uspto.gov/patents/resources/methods/aiplafall02paper.jsp|archivedate=September 21, 2012}}</ref>.


== Цензура та інші загрози ==
== Цензура та інші загрози ==
Станом на грудень 2016 року Archive.org {{нп|Інтернет-цензура в Китаї|заблокований у Китаї|en|Internet censorship in China}}.<ref>{{Cite web|last=Conger|first=Kate|title=Backing up the history of the internet in Canada to save it from Trump|url=https://techcrunch.com/2016/12/08/backing-up-the-history-of-the-internet-in-canada-to-save-it-from-trump/|publisher=TechCrunch|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161227100714/https://techcrunch.com/2016/12/08/backing-up-the-history-of-the-internet-in-canada-to-save-it-from-trump/|archivedate=December 27, 2016}}</ref><ref>{{Cite web|title=Where to find what's disappeared online, and a whole lot more: the Internet Archive|url=https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive|publisher=Public Radio International|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170328092846/https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive|archivedate=March 28, 2017}}</ref> Після того, як сайт включив зашифрований протокол [[HTTPS]] Internet Archive повністю {{нп|Інтернет-цензура в Росії|заблоковано в Росії|en|Internet censorship in Russia}} у 2015 році.<ref>{{Cite web|last=Chirgwin|first=Richard|title=There's no Wayback in Russia: Putin blocks Archive.org|url=https://www.theregister.co.uk/2015/09/01/russias_putin_blocks_archiveorg/|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161007165431/http://www.theregister.co.uk/2015/09/01/russias_putin_blocks_archiveorg|archivedate=October 7, 2016}}</ref><ref>{{Cite web|title=Russia won’t go Wayback, blocks the Internet Archive|url=https://www.digitaltrends.com/web/russia-censors-wayback-machines-485-billion-archived-web-pages/|publisher=Digital Trends|accessdate=May 14, 2017|date=June 26, 2015|deadurl=no|archiveurl=https://web.archive.org/web/20160417125727/http://www.digitaltrends.com/web/russia-censors-wayback-machines-485-billion-archived-web-pages/|archivedate=April 17, 2016}}</ref><ref name="usn1">{{Cite web|url=https://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|title=Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed|archiveurl=https://web.archive.org/web/20170106151933/http://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|archivedate=January 6, 2017|deadurl=no|accessdate=May 14, 2017}}</ref>
Станом на грудень 2016 року Archive.org {{нп|Інтернет-цензура в Китаї|заблокований у Китаї|en|Internet censorship in China}}<ref>{{Cite web|last=Conger|first=Kate|title=Backing up the history of the internet in Canada to save it from Trump|url=https://techcrunch.com/2016/12/08/backing-up-the-history-of-the-internet-in-canada-to-save-it-from-trump/|publisher=TechCrunch|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161227100714/https://techcrunch.com/2016/12/08/backing-up-the-history-of-the-internet-in-canada-to-save-it-from-trump/|archivedate=December 27, 2016}}</ref><ref>{{Cite web|title=Where to find what's disappeared online, and a whole lot more: the Internet Archive|url=https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive|publisher=Public Radio International|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170328092846/https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive|archivedate=March 28, 2017}}</ref>. Після того, як сайт включив зашифрований протокол [[HTTPS]] Internet Archive повністю {{нп|Інтернет-цензура в Росії|заблоковано в Росії|en|Internet censorship in Russia}} у 2015 році<ref>{{Cite web|last=Chirgwin|first=Richard|title=There's no Wayback in Russia: Putin blocks Archive.org|url=https://www.theregister.co.uk/2015/09/01/russias_putin_blocks_archiveorg/|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161007165431/http://www.theregister.co.uk/2015/09/01/russias_putin_blocks_archiveorg|archivedate=October 7, 2016}}</ref><ref>{{Cite web|title=Russia won’t go Wayback, blocks the Internet Archive|url=https://www.digitaltrends.com/web/russia-censors-wayback-machines-485-billion-archived-web-pages/|publisher=Digital Trends|accessdate=May 14, 2017|date=June 26, 2015|deadurl=no|archiveurl=https://web.archive.org/web/20160417125727/http://www.digitaltrends.com/web/russia-censors-wayback-machines-485-billion-archived-web-pages/|archivedate=April 17, 2016}}</ref><ref name="usn1"/>


Елісон Макріна, директор Library Freedom Project, зазначає, що "хоча бібліотекарі глибоко цінують недоторканість приватного життя, ми також рішуче виступаємо проти цензури".<ref name="usn1">{{Cite web|url=https://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|title=Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed|archiveurl=https://web.archive.org/web/20170106151933/http://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|archivedate=January 6, 2017|deadurl=no|accessdate=May 14, 2017}}</ref>
Елісон Макріна, директор Library Freedom Project, зазначає, що "хоча бібліотекарі глибоко цінують недоторканість приватного життя, ми також рішуче виступаємо проти цензури"<ref name="usn1"/>.


Відомі рідкісні випадки, коли онлайн-доступ до матеріалів, які "за просто так" поставили людей в небезпеку, вимкнуто на сайті.<ref name="usn1">{{Cite web|url=https://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|title=Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed|archiveurl=https://web.archive.org/web/20170106151933/http://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|archivedate=January 6, 2017|deadurl=no|accessdate=May 14, 2017}}</ref>
Відомі рідкісні випадки, коли онлайн-доступ до матеріалів, які "за просто так" поставили людей в небезпеку, вимкнуто на сайті<ref name="usn1"/>.


Серед інших загроз: стихійні лиха,<ref>{{Cite web|title=Help Us Keep the Archive Free, Accessible, and Reader Private {{!}} Internet Archive Blogs|url=https://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170521080543/http://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|archivedate=May 21, 2017}}</ref> знищення (дистанційне або фізичне), маніпуляцію вмістом архіву (див. також: [[хакерська атака]], [[резервне копіювання]]), проблематичне авторське право<ref>{{Cite web|title=Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"|url=https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|publisher=Consumerist|accessdate=May 14, 2017|date=June 7, 2016|deadurl=no|archiveurl=https://web.archive.org/web/20161111161239/https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|archivedate=November 11, 2016}}</ref> і спостереження користувачів сайту.<ref>{{Cite web|last=Herb|first=Ulrich|title=Die Trump-Angst grassiert|url=https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|publisher=heise online|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20161207164413/https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|archivedate=December 7, 2016}}</ref>
Серед інших загроз: стихійні лиха,<ref>{{Cite web|title=Help Us Keep the Archive Free, Accessible, and Reader Private {{!}} Internet Archive Blogs|url=https://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170521080543/http://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|archivedate=May 21, 2017}}</ref> знищення (дистанційне або фізичне), маніпуляцію вмістом архіву (див. також: [[хакерська атака]], [[резервне копіювання]]), проблематичне авторське право<ref>{{Cite web|title=Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"|url=https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|publisher=Consumerist|accessdate=May 14, 2017|date=June 7, 2016|deadurl=no|archiveurl=https://web.archive.org/web/20161111161239/https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|archivedate=November 11, 2016}}</ref> і спостереження за користувачами сайту<ref>{{Cite web|last=Herb|first=Ulrich|title=Die Trump-Angst grassiert|url=https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|publisher=heise online|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20161207164413/https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|archivedate=December 7, 2016}}</ref>.


Кевін Воен підозрює, що в довгостроковій перспективі декількох поколінь "безцінь" виживуть корисним способом, крім "Якщо у нас є наступність у нашої технологічної цивілізації", за яким "велика голою дані залишаться виявити і пошуку".<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Internet's Dark Ages|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|publisher=The Atlantic|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|archivedate=May 7, 2017}}</ref>
Кевін Воен підозрює, що в довгостроковій перспективі декількох поколінь "безцінь" виживуть корисним способом, крім "Якщо у нас є наступність у нашої технологічної цивілізації", за яким "велика голою дані залишаться виявити і пошуку"<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Internet's Dark Ages|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|publisher=The Atlantic|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|archivedate=May 7, 2017}}</ref>.


Деякі [хто?] знаходить, Інтернет-архів, який описує себе як побудований на довгострокову перспективу<ref>{{Cite web|title=The Entire Internet Will Be Archived In Canada to Protect It From Trump|url=https://motherboard.vice.com/en_us/article/the-entire-internet-will-be-archived-in-canada-to-protect-it-from-trump|publisher=Motherboard|accessdate=May 14, 2017|language=en-us|deadurl=no|archiveurl=https://web.archive.org/web/20170516221604/https://motherboard.vice.com/en_us/article/the-entire-internet-will-be-archived-in-canada-to-protect-it-from-trump|archivedate=May 16, 2017}}</ref> працює несамовито, щоб захопити дані, перш ніж вони зникнуть, без будь-якої довгострокової інфраструктури.<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Human Fear of Total Knowledge|url=https://www.theatlantic.com/technology/archive/2016/06/knowledge-compendia/485507/|publisher=The Atlantic|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161202040113/http://www.theatlantic.com/technology/archive/2016/06/knowledge-compendia/485507/|archivedate=December 2, 2016}}</ref>
Деякі [хто?] знаходить, Інтернет-архів, який описує себе як побудований на довгострокову перспективу<ref>{{Cite web|title=The Entire Internet Will Be Archived In Canada to Protect It From Trump|url=https://motherboard.vice.com/en_us/article/the-entire-internet-will-be-archived-in-canada-to-protect-it-from-trump|publisher=Motherboard|accessdate=May 14, 2017|language=en-us|deadurl=no|archiveurl=https://web.archive.org/web/20170516221604/https://motherboard.vice.com/en_us/article/the-entire-internet-will-be-archived-in-canada-to-protect-it-from-trump|archivedate=May 16, 2017}}</ref> працює несамовито, щоб захопити дані, перш ніж вони зникнуть, без будь-якої довгострокової інфраструктури<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Human Fear of Total Knowledge|url=https://www.theatlantic.com/technology/archive/2016/06/knowledge-compendia/485507/|publisher=The Atlantic|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161202040113/http://www.theatlantic.com/technology/archive/2016/06/knowledge-compendia/485507/|archivedate=December 2, 2016}}</ref>.


== См. також ==
== См. також ==
Рядок 143: Рядок 143:


== Зовнішні посилання ==
== Зовнішні посилання ==

* {{Official}}
* {{Official}}
* {{Cite web|url=https://archive.org/about/terms.php/|title=Terms of use, privacy and copyright policy|website=archive.org|date=December 31, 2014}}
* {{Cite web|url=https://archive.org/about/terms.php/|title=Terms of use, privacy and copyright policy|website=archive.org|date=December 31, 2014}}

Версія за 14:59, 22 квітня 2019

Wayback Machine
Логотип
Логотип
Знімок часового зрізу заархівованих сторінок www.wikipedia.org на сайті Wayback Machine від 21 грудня 2015 року
Посилання web.archive.org
Тип Archive
Реєстрація Optional
Мови англійська
Власник Internet Archive
Автор Брюстер Кейгл і Брюс Джильятd
Започатковано 24 жовтня 2001; 22 роки тому (2001-10-24)[1][2]
Стан Active
Рейтинг Alexa 253 (February 2019)[3]
Мова програмування C, Perl, Java і Python
CMNS: Wayback Machine у Вікісховищі

Wayback Machine - цифровий архів з всесвітнього павутиння та іншої інформації в Інтернеті. Його запустила 2001 року Інтернет-архів, неприбуткова організація, що базується в Сан-Франциско(Каліфорнія, США).

Історія

Засновники Інтернет-архіву Брюстер Кале і Брюс Джилліат[en] запустили Wayback Machine 2001 року, щоб вирішити проблему зникнення контенту веб-сайтів кожного разу, коли їх змінюють або закривають[4]. Сервіс дозволяє користувачам переглядати архівні версії веб-сторінок, як вони змінювались з часом, що архів називає "тривимірним індексом"[5]. Кале і Джилліат створили машину, сподіваючись заархівувати весь інтернет і забезпечити "загальний доступ до всіх знань"[6].

Назву Wayback Machine вибрали як посилання на "WABAC machine[en]" (вимовляється вей-бек), пристрій для подорожей у часі, який застосовують персонажі Містер Пібоді[en] і Шерман в анімаційному фільмі Шоу Роккі та Буллвінкля[en][7][8]. В одній з частин цього анімаційного мультфільму, Неймовірна історія Пібоді[en], персонажі часто використовував машину, щоб спостерігати відомі події в історії, брати в них участь і, частіше, змінювати їх хід.

Wayback Machine почала архівувати кешовані веб-сторінки 1996 року, з метою зробити послугу доступною громадськості п'ять років по тому[9]. Від 1996 до 2001 року інформація зберігалася на цифрових плівках, а Кале зрідка дозволяв дослідникам і дослідникам і науковцям підключатися до громіздкої бази даних[10]. 2001 року, коли архівові виповнилося п'ять років, його відкрили для публіки на церемонії в Університеті Каліфорнії (Берклі)[11]. До часу запуску Wayback Machine вона вже містила понад 10 мільярдів архівних сторінок[12].

Нині дані зберігаються на великому кластері вузлів Linux Інтернет-архіву[6]. Він заново відвідує і архівує нові версії веб-сайтів випадково (див. технічні дані нижче)[13]. Сайти також можна архівувати вручну, вводячи його URL-адресу в поле пошуку, за умови, що сайт дозволяє Wayback Machine "проковзати" по ньому пошуковим роботом і зберегти дані[9].

Технічні подробиці

Програмне забезпечення розроблено, щоб пошуковий робот міг "проковзувати" по Інтернету і завантажувати всі загальнодоступні веб-сторінки, ієрархію Gopher, систему дошки оголошень Usenet і завантажуване програмне забезпечення[14]. Інформація, зібрана за допомогою цих роботів не включає всю доступну інформацію в Інтернеті, оскільки значну частину даних обмежують видавці, або вона зберігається в недоступних базах даних. Щоб подолати суперечності частково кешованих веб-сайтів, 2005 року Інтернет архів розробив Archive-It.org як засіб, що дозволяє установам і творцям контенту добровільно збирати і зберігати колекції цифрового контенту та створювати цифрові архіви[15].

Crawls надходять з різних джерел, деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого архіву[13]. Наприклад, Crawls надходять від Фундації Альфреда Слоуна і Alexa, повзає веденні ІА від імені Національного управління архівів та документації та Internet Memory Foundation[en], дзеркал з Common Crawl[en][13]. "Worldwide Web Crawls" працює з 2010 року і захоплює глобальне павутиння[16][13].

Частота захоплень для зберігання змінюється в залежності від сайту[13]. Сайти у "Worldwide Web Crawls" включені в "crawl list", один сайт архівується раз за обхід[13]. Обхід може тривати кілька місяців або навіть років у залежності від розміру[13]. Наприклад, "Wide Crawl Number 13" розпочався 9 січня 2015 року й завершився 11 липня 2016 року[17]. Однак, в один і той самий момент може проходити кілька обходів, і сайт може бути включений у понад один crawl list, тож частота обходу сайтів змінюється в широких межах[13].

Місткість сховища і зростання

Разом з розвитком технології впродовж років зростала й місткість сховища Wayback Machine. У 2003 році, через два роки після того, як доступ став публічним, Wayback Machine зростала зі швидкістю 12 терабайтів на місяць. Дані зберігаються на rack systems custom PetaBox, розробленій співробітниками інтернет-архіву. Перша стійка 100ТВ повністю увійшла в дію в червні 2004 року, хоча невдовзі стало зрозуміло, що їм потрібно значно більше місця, ніж на ній[18][19].

2009 року Інтернет-архів перевів свою клієнтську архітектуру зберігання в Sun Open Storage[en], і утримує новий центр обробки даних у Sun Modular Datacenter[en] у каліфорнійському кампусі Sun Microsystems[20]. Станом на 2009 Wayback Machine містила приблизно три петабайти даних і зростала зі швидкістю 100 терабайт на місяць[21].

Нова, поліпшена версія Wayback Machine, з оновленим інтерфейсом і свіжішим індексом архівних матеріалів, стала доступною для публічного тестування у 2011 році[22]. У березні того самого року на форумі Wayback Machine було сказано, що "бета-версія нової Wayback Machine має повніший і актуальніший покажчик всіх обійдених матеріалів до 2010 року, й продовжить регулярно оновлюватися. Покажчик, який управляв старою Wayback Machine, має небагато матеріалів після 2008 року, і жодних його подальших оновлень не планується, оскільки його мають згорнути цього року"[23]. Також 2011 року інтернет-архів встановив свою шосту пару стійок PetaBox, що дозволило збільшити ємність Wayback Machine на 700 терабайт[24].

У січні 2013 року, компанія оголосила про нову віху 240 мільярдів URL-адрес[25]. У жовтні 2013 року компанія оголосила про функцію "Save a Page"[26], яка дозволяє будь-якому користувачеві мережі Інтернет заархівувати вміст URL-адреси. Це стало загрозою зловживань з боку сервісу як хостингу шкідливих двійкових файлів[en][27][28].

Станом на грудень 2014 Wayback Machine містила 435 мільярдів веб-сторінок обсягом майже дев'ять петабайтів, і зростала приблизно на 20 терабайтів щотижня[29][12][30].

Станом на липень 2016 Wayback Machine містила близько 15 петабайт даних[31].

Станом на вересень 2018 року Wayback Machine містила понад 25 петабайтів даних[32][33].

Зростання

В період з жовтня 2013 року по березень 2015 року глобальний рейтинг Alexa сайту Wayback Machine змінився зі 163[34] до 208[35]. У березні 2019 рейтинг був 244[36].

Зростання Wayback Machine [37] [38]
Рік Кількість заархівованих сторінок (мільярдів)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452

Політики виключення сайту

Історично, Wayback Machine поважав стандарт винятків для роботів (Robots.txt), визначаючи, чи сайт можна обходити чи ні; або, якщо вже робот його обійшов, то чи ці архіви будуть у відкритому доступі. Власники веб-сайту мають можливість відмовитися від послуг Wayback Machine за допомогою robots.txt. Правила robots.txt застосовуються заднім числом; якщо сайт заблокував інтернет-архів, то всі раніше архівні сторінки з цього домену також негайно стають недоступними. Крім того, в Internet Archive заявили, що "іноді власник сайту зв'язується з нами і просить нас зупинити сканування та архівацію сайту. Ми виконуємо ці запити"[39] На додаток, на сайті написано: "Інтернет-архів не зацікавлений у збереженні або наданні доступу до веб-сайту або інших інтернет-документів від осіб, які не хочуть, щоб їх матеріали були в зібранні."[40][41]

Оклендська архівна політика

Політика винятку заднім числом Wayback Machine частково ґрунтується на рекомендаціях з управління запитами на вилучення і збереження архівної цілісності (англ. Recommendations for Managing Removal Requests and Preserving Archival Integrity), опублікованих Школою інформаційного управління і системам в Університеті Каліфорнії (Берклі) у 2002 році, який дає право власнику сайту заблокувати доступ до архіву сайту[42]. Wayback дотримується цієї політики, щоб за можливості уникнути дорогих судових розглядів[43].

Політика винятку заднім числом Wayback почала послаблюватися 2017 року, коли він перестав зважати на файли robots.txt на американських урядових і військових веб-сайтах як для їх сканування, так і показу відсканованих веб-сторінок. Станом на квітень 2017 Wayback ігнорує robots.txt в ширших межах, не тільки для урядових сайтів США[44][45][46][47].

Використання

Починаючи з публічного запуску 2001 року, науковці вивчали Wayback Machine як у сенсі способів, якими вона зберігає збирає дані, так і самі сторінки, що містяться в її архіві. Станом на 2013 рік науковці написали близько 350 статей про Wayback Machine, здебільшого в галузях інформаційних технологій, бібліотекознавства та суспільних наук. Представники суспільних наук скористалися Wayback Machine, щоб проаналізувати, як розвиток веб-сайтів, починаючи з середини 1990-х років і до теперішнього часу вплинув на зростання компаній[12].

Коли Wayback Machine архівує сторінку, вона зазвичай містить більшість гіперпосилань, зберігаючи ці посилання активними, коли вони так само легко могли бути порушені нестабільністю Інтернету. Індійські вчені вивчали ефективність здатності Wayback Machine зберігати гіперпосилання наукових онлайн-публікацій і визначили, що вона зберігає трохи більш як половину з них[48].

Журналісти використовують Wayback Machine, щоб переглядати мертві сайти, застарілі новини і зміни в змісті сайту. Його зміст використовують, щоб притягати політиків до відповідальності й викривати брехню на полі бою[49]. 2014 року архівна сторінка Ігоря Гіркина в соціальній мережі засвідчила як він хвалиться, що його бійці збили нібито український військовий літак перед тим як стало відомо, що насправді це цивільний літак Малайзійських авіаліній, після чого він видалив пост і звинуватив українських військових у знищенні літака[49][50]. Марш за науку в березні 2017 року розпочався з обговорення на Reddit, яке показало, що хтось відвідав Archive.org і виявив, що всі посилання на зміну клімату на сайті Білого дому, з нього вилучено. У відповідь один з користувачів прокоментував так: "Має бути марш науковців на Вашингтон"[51][52][53].

Крім того, сайт активно використовується для верифікації, забезпечуючи редакторам Вікіпедії доступ до посилань і можливість створювати контент.

Обмеження

Попри свої можливості, Wayback Machine також має деякі обмеження. У 2014 році затримка між скануванням вмісту сайтів і часом, коли він був доступним на Wayback Machine, становила шість місяців[54]. Станом на листопад 2018 року час затримки становив від 3 до 10 годин[55]. Wayback Machine не є "історичним Google"; користувачі мають знати URL-адреси веб-сайтів, які вони хочуть переглянути[56]. Вона має функцію "Site Search" (пошук сайту), яка дозволяє користувачам знайти сайт на основі слів, що описують сайт, а не слів, знайдених на самих веб-сторінках.

Wayback Machine не не містить усіх сторінок, коли-небудь створених, через обмеження свого веб-краулера. Wayback Machine не може повністю архівувати веб-сторінки, які містять інтерактивні функції, такі як Флеш-платформи і форми, написані на JavaScript, бо ці функції вимагають взаємодії з хост-сайтом. Веб-краулер має тружнощі з витягуванням усього, що закодовано не в HTML (або одному з його варіантів), що часто призводить до зламаних гіперпосилань та відсутніх зображень. Крім того, веб-краулер не архівує "сторінок-сиріт", які не містять посилань на інші сторінки[57][56]. Конкретні правила, що регулюють краулер Wayback Machine, можуть дослідити лише наперед визначену кількість гіперпосилань, ґрунтуючись на наперед заданому обмеженні глибини, тому він не може архівувати всі гіперпосилання на кожній сторінці[16].

Деякі власники поміщають на свій сайт файл robot.txt, який не дозволяє Wayback Machine знаходити та архівувати їх. Крім того, власники веб-сайтів також можуть безпосередньо зв'язатися з Інтернет-архівом і просити, щоб їх сторінки було вилучено з архіву[57].

Як юридичні докази

Цивільне судочинство

Netbula LLC проти Chordiant Software Inc.

У справі 2009 року Netbula, LLC проти Chordiant Software Inc відповідач Chordiant подав клопотання, щоб Netbula на своєму сайті вимкнула файл robots.txt, який змушував Wayback Machine заднім числом закривати доступ до попередніх версій сторінок, заархівованих з сайту Netbula, які, на думку Chordiant могли б підтримати її справу[58].

Netbula заперечила проти цього клопотання на тій підставі, що відповідач зверталися з проханням змінити сайт Netbula і що він мав би безпосередньо звернутися до Архіву Інтернету за сторінками[59]. Проте, співробітник Інтернет-архіву подав заяву під присягою, якою підтримав дію Chordiant, заявивши, що він не може видати веб-сторінки за допомогою інших засобів "без значного навантаження, витрат і перебоїв у його роботі"[58].

Суддя Говард Ллойд у Північному окрузі Каліфорнії, відділі Сан-Хосе, відхилив доводи Netbula і наказав їм тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отримали архівні сторінки, які їм були потрібні[58].

Telewizja Polska

У жовтні 2004 року у справі Telewizja Polska USA, Inc. проти Echostar Satellite, No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004), позивач намагався використати Wayback Machine як джерело допустимих доказів, мабуть, вперше. Компанії Telewizja Polska є провайдером TVP Polonia і EchoStar[en], яка управляє Dish Network. До початку судового розгляду, EchoStar вказала, що має намір запропонувати знімки Wayback Machine як доказ минулого змісту сайту Telewizja Polska. Компанії Telewizja Polska і подала Клопотання in limine[en], щоб не дати хід знімкам на тій підставі, що нібито це чутки і неперевірене джерело, але суддя Арландер, відхилив твердження Telewizja Polska, що нібито це чутки й відмовив у клопотанні in limine щодо виключення доказів у суді[60][61].

Патентне право

За умови виконання деяких додаткових вимог (наприклад, надання авторитетної заяви архіваріуса), Відомство з патентів і торгових знаків США[en] і Європейське патентне відомство[en] приймають date stamps від Інтернет-архіву як доказ того, коли ця веб-сторінка була доступна громадськості. Ці дані використовуються для визначення, чи веб-сторінка доступна як prior art, наприклад, під час розгляду заявки на патент[62].

Цензура та інші загрози

Станом на грудень 2016 року Archive.org заблокований у Китаї[en][63][64]. Після того, як сайт включив зашифрований протокол HTTPS Internet Archive повністю заблоковано в Росії[en] у 2015 році[65][66][49]

Елісон Макріна, директор Library Freedom Project, зазначає, що "хоча бібліотекарі глибоко цінують недоторканість приватного життя, ми також рішуче виступаємо проти цензури"[49].

Відомі рідкісні випадки, коли онлайн-доступ до матеріалів, які "за просто так" поставили людей в небезпеку, вимкнуто на сайті[49].

Серед інших загроз: стихійні лиха,[67] знищення (дистанційне або фізичне), маніпуляцію вмістом архіву (див. також: хакерська атака, резервне копіювання), проблематичне авторське право[68] і спостереження за користувачами сайту[69].

Кевін Воен підозрює, що в довгостроковій перспективі декількох поколінь "безцінь" виживуть корисним способом, крім "Якщо у нас є наступність у нашої технологічної цивілізації", за яким "велика голою дані залишаться виявити і пошуку"[70].

Деякі [хто?] знаходить, Інтернет-архів, який описує себе як побудований на довгострокову перспективу[71] працює несамовито, щоб захопити дані, перш ніж вони зникнуть, без будь-якої довгострокової інфраструктури[72].

См. також

Примітки

  1. WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools. WHOIS. Процитовано 13 березня 2016.
  2. InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools. WHOIS. Процитовано 13 березня 2016.
  3. Archive.org Traffic, Demographics and Competitors - Alexa. alexa.com. Процитовано 4 February 2019.
  4. Notess, Greg R. (March–April 2002). The Wayback Machine: The Web's Archive. Online. 26: 59—61 — через EBSCOhost.
  5. The Wayback Machine, Frequently Asked Questions, архів оригіналу за 18 вересня 2018, процитовано 18 вересня 2018
  6. а б 20,000 Hard Drives on a Mission | Internet Archive Blogs. blog.archive.org (амер.). Архів оригіналу за 20 жовтня 2018. Процитовано 15 жовтня 2018.
  7. Green, Heather (28 лютого 2002). A Library as Big as the World. BusinessWeek. Архів оригіналу за 20 грудня 2011.
  8. Tong, Judy (8 вересня 2002). Responsible Party – Brewster Kahle; A Library Of the Web, On the Web. New York Times. Архів оригіналу за 20 лютого 2011. Процитовано 15 серпня 2011.
  9. а б Internet Archive: Wayback Machine. archive.org (англ.). Архів оригіналу за 3 січня 2014. Процитовано 15 жовтня 2018.
  10. Cook, John (1 листопада 2001). Web site takes you way back in Internet history. Seattle Post-Intelligencer. Архів оригіналу за 12 серпня 2014. Процитовано 15 серпня 2011.
  11. Wayback Goes Way Back on Web. Wired. 28 жовтня 2001. Архів оригіналу за 16 жовтня 2017. Процитовано 16 жовтня 2017. {{cite journal}}: Cite має пустий невідомий параметр: |df= (довідка)
  12. а б в Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (5 травня 2015). Using the wayback machine to mine websites in the social sciences: A methodological resource. Journal of the Association for Information Science and Technology (англ.). 67 (8): 1904—1915. doi:10.1002/asi.23503. ISSN 2330-1635.
  13. а б в г д е ж и Kalev Leetaru (28 січня 2016). The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web. Forbes. Архів оригіналу за 16 жовтня 2017. Процитовано 16 жовтня 2017.
  14. Kahle, Brewster. Archiving the Internet. Scientific American – March 1997 Issue. Архів оригіналу за 3 квітня 2012. Процитовано 19 серпня 2011.
  15. Jeff Kaplan (27 жовтня 2014). Archive-It: Crawling the Web Together. Internet Archive Blogs. Архів оригіналу за 12 жовтня 2017. Процитовано 16 жовтня 2017.
  16. а б Worldwide Web Crawls. Internet Archive. Архів оригіналу за 19 жовтня 2017. Процитовано 16 жовтня 2017.
  17. Wide Crawl Number 13. Internet Archive. Архів оригіналу за 19 жовтня 2017. Процитовано 16 жовтня 2017.
  18. Internet Archive: Petabox. archive.org (англ.). Процитовано 25 жовтня 2018.
  19. Kanellos, Michael (29 липня 2005). Big storage on the cheap. CNET News.com. Архів оригіналу за 3 квітня 2007. Процитовано 29 липня 2007.
  20. Internet Archive and Sun Microsystems Create Living History of the Internet. Sun Microsystems. 25 березня 2009. Архів оригіналу за 26 березня 2009. Процитовано 27 березня 2009.
  21. Mearian, Lucas (19 березня 2009). Internet Archive to unveil massive Wayback Machine data center. Computerworld.com. Архів оригіналу за 23 березня 2009. Процитовано 22 березня 2009.
  22. Updated Wayback Machine in Beta Testing. Archive.org. Архів оригіналу за 23 серпня 2011. Процитовано 19 серпня 2011.
  23. Beta Wayback Machine, in forum. Archive.org. Архів оригіналу за 17 квітня 2014. Процитовано 16 квітня 2014.
  24. Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used. archive.org (англ.). Архів оригіналу за 24 жовтня 2016. Процитовано 25 жовтня 2018.
  25. Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs. Blog.archive.org. 9 січня 2013. Архів оригіналу за 14 квітня 2014. Процитовано 16 квітня 2014.
  26. Rossi, Alexis (25 жовтня 2013). Fixing Broken Links on the Internet. archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. Архів оригіналу за 7 листопада 2014. Процитовано 25 березня 2015. We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
  27. The VirusTotal Team (25 березня 2015). 207.241.226.190 IP address information. virustotal.com. Dublin 2, Ireland: VirusTotal. Архів оригіналу за 14 липня 2014. Процитовано 25 березня 2015. 2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe
  28. Advisory provided by Google (25 березня 2015). Safe Browsing Diagnostic page for archive.org. google.com/safebrowsing. Mountain View, CA, US: Google. Архів оригіналу за 6 квітня 2015. Процитовано 25 березня 2015. 2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).
  29. Internet Archive Frequently Asked Questions. Архів оригіналу за 21 жовтня 2009. Процитовано 17 січня 2015.
  30. Internet Archive Frequently Asked Questions. 18 грудня 2014. Архів оригіналу за 18 грудня 2014. Процитовано 13 грудня 2018.
  31. Can the manipulation of big data change the way the world thinks?. The National. Архів оригіналу за 12 січня 2017. Процитовано 14 травня 2017.
  32. Crockett, Zachary (28 вересня 2018). Inside Wayback Machine, the internet’s time capsule. The Hustle (амер.). Архів оригіналу за 2 жовтня 2018. Процитовано 26 жовтня 2018.
  33. Heffernan, Virginia (18 вересня 2018). Things Break and Decay on the Internet—That's a Good Thing. WIRED (амер.). Архів оригіналу за 25 вересня 2018. Процитовано 26 жовтня 2018.
  34. Archive.org Site Info. Alexa Internet. Архів оригіналу за 28 жовтня 2013. Процитовано 29 жовтня 2013.
  35. Archive.org Site Overview. Alexa Internet. Архів оригіналу за 9 квітня 2015. Процитовано 9 квітня 2015.
  36. Archive.org Traffic, Demographics and Competitors - Alexa. web.archive.org. 23 березня 2019. Процитовано 5 квітня 2019.
  37. michelle (9 травня 2014). Wayback Machine Hits 400,000,000,000!. Internet Archive. Архів оригіналу за 26 серпня 2014. Процитовано 25 березня 2015.
  38. Internet Archive Wayback Machine. Internet Archive. Архів оригіналу за 13 лютого 2015. Процитовано 25 березня 2015.
  39. Some sites are not available because of Robots.txt or other exclusions [Шаблон:Webarchive:помилка: Перевірте аргументи |url= value. Порожньо.]
  40. How can I remove my site's pages from the Wayback Machine? [Архівовано April 17, 2014, у Wayback Machine.]
  41. Cox, Joseph (22 травня 2018). The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers. Архів оригіналу за 23 травня 2018. Процитовано 23 травня 2018.
  42. Recommendations for Managing Removal Requests And Preserving Archival Integrity. University of California. 14 грудня 2002. Архів оригіналу за 18 вересня 2017. Процитовано 14 вересня 2017.
  43. Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy. Internet Archive. 7 липня 2014. Архів оригіналу за 10 жовтня 2017. Процитовано 14 вересня 2017.
  44. Mark Graham (17 квітня 2017). Robots.txt meant for search engines don't work well for web archives. Internet Archive Blogs. Архів оригіналу за 17 квітня 2017. Процитовано 16 квітня 2017.
  45. Archivierung des Internets: Internet Archive ignoriert künftig robots.txt (de-DE) . heise online. Архів оригіналу за 27 квітня 2017. Процитовано 14 травня 2017.
  46. Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de (de-DE) . Архів оригіналу за 19 червня 2017. Процитовано 14 травня 2017.
  47. Internet Archive will ignore robots.txt files to keep historical record accurate. Digital Trends. 24 квітня 2017. Архів оригіналу за 16 травня 2017. Процитовано 14 травня 2017.
  48. Sampath Kumar, B.T.; Prithviraj, K.R. (21 жовтня 2014). Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs. Journal of Information Science (англ.). 41 (1): 71—81. doi:10.1177/0165551514552752. ISSN 0165-5515.
  49. а б в г д Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed. Архів оригіналу за 6 січня 2017. Процитовано 14 травня 2017.
  50. What the Web Said Yesterday. The New Yorker. Архів оригіналу за 25 січня 2015. Процитовано 14 травня 2017.
  51. The March for Science began with this person's 'throwaway line' on Reddit. Washington Post. Архів оригіналу за 23 квітня 2017. Процитовано 23 квітня 2017.
  52. Are scientists going to march on Washington?. The Washington Post. Архів оригіналу за 31 січня 2017. Процитовано 31 січня 2017.
  53. Foley, Katherine Ellen. The global March for Science started with a single Reddit thread. Quartz. Архів оригіналу за 24 квітня 2017. Процитовано 23 квітня 2017.
  54. Internet Archive Frequently Asked Questions. Internet Archive. 2 квітня 2014. Архів оригіналу за 2 квітня 2014. Процитовано 23 листопада 2018.
  55. Internet Archive Frequently Asked Questions. archive.org (англ.). Процитовано 23 листопада 2018.
  56. а б Bates, Mary Ellen (2002). The Wayback Machine. Online. 26: 80 — через EBSCOhost.
  57. а б Internet Archive Frequently Asked Questions. archive.org (англ.). Архів оригіналу за 20 квітня 2013. Процитовано 18 жовтня 2018.
  58. а б в Lloyd, Howard (October 2009). Order to Disable Robots.txt (PDF). Процитовано 15 жовтня 2009.
  59. Cortes, Antonio (October 2009). Motion Opposing Removal of Robots.txt. Архів оригіналу за 27 жовтня 2010. Процитовано 15 жовтня 2009.
  60. Gelman, Lauren (17 листопада 2004). Internet Archive's Web Page Snapshots Held Admissible as Evidence. Packets. 2 (3). Архів оригіналу за 30 квітня 2011. Процитовано 4 січня 2007. {{cite journal}}: Cite має пустий невідомий параметр: |df= (довідка)
  61. Howell, Beryl A. (February 2006). Proving Web History: How to use the Internet Archive (PDF). Journal of Internet Law: 3—9. Архів оригіналу (PDF) за 5 липня 2010. Процитовано 6 серпня 2008.
  62. Wynn W. Coggins (Fall 2002). Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?. USPTO. Архів оригіналу за 21 вересня 2012.
  63. Conger, Kate. Backing up the history of the internet in Canada to save it from Trump. TechCrunch. Архів оригіналу за 27 грудня 2016. Процитовано 14 травня 2017.
  64. Where to find what's disappeared online, and a whole lot more: the Internet Archive. Public Radio International. Архів оригіналу за 28 березня 2017. Процитовано 14 травня 2017.
  65. Chirgwin, Richard. There's no Wayback in Russia: Putin blocks Archive.org. Архів оригіналу за 7 жовтня 2016. Процитовано 14 травня 2017.
  66. Russia won’t go Wayback, blocks the Internet Archive. Digital Trends. 26 червня 2015. Архів оригіналу за 17 квітня 2016. Процитовано 14 травня 2017.
  67. Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs. Архів оригіналу за 21 травня 2017. Процитовано 14 травня 2017.
  68. Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web". Consumerist. 7 червня 2016. Архів оригіналу за 11 листопада 2016. Процитовано 14 травня 2017.
  69. Herb, Ulrich. Die Trump-Angst grassiert (de-DE) . heise online. Архів оригіналу за 7 грудня 2016. Процитовано 14 травня 2017.
  70. LaFrance, Adrienne. The Internet's Dark Ages. The Atlantic. Архів оригіналу за 7 травня 2017. Процитовано 14 травня 2017.
  71. The Entire Internet Will Be Archived In Canada to Protect It From Trump (en-us) . Motherboard. Архів оригіналу за 16 травня 2017. Процитовано 14 травня 2017.
  72. LaFrance, Adrienne. The Human Fear of Total Knowledge. The Atlantic. Архів оригіналу за 2 грудня 2016. Процитовано 14 травня 2017.

Зовнішні посилання

Дзеркала

Утиліти