Сведения об образовательной организации

INTERNET ARCHIVE В ИСТОРИИ РЕГИОНАЛЬНЫХ ИНТЕРНЕТ-СМИ

Концевой М.П.
Брестский государственный университет имени А. С. Пушкина
kmp@brsu.by

Появление в 90-е годы интернет-журналистики открывает новый этап в развитии региональной журналистики и актуализирует ее историческое рассмотрение. Проблематика, поднятая на этапе генезиса региональной интернет-журналистики и все еще остается в актуальном дискурсе, представляет существенный интерес для осмысления всей истории журналистики, а также культуры чтения, письма, вербальных и визуальных практик в целом. Обострившиеся в последние десятилетия проблемы соотношения в СМИ профессионализма и дилетантства, информационной свободы и ответственности, глобализации и культурного своеобразия, языковой динамики и нормы непосредственно были связаны с интернет-журналистикой, освещались в первую очередь интернет-журналистикой, осмысливать в контексте становления и развития интернет-журналитики и вне ее не могут быть адекватно поняты.

Новое качество интернет-журналистики обусловлено во многом особенностями информационной интернет-среды (гетерогенной, мультимедийной, гипертекстовой, интерактивной), в которой она представлена, что предполагает качественный сдвиг и в отношении ее научного изучения, в частности соответствующего источниковедческого инструментария. Особое значение среди источниковедческих ресурсов интернет-журналистики (наряду с архивами медийных сайтов, электронными библиотеками, онлайновыми информационными базами) имеет проект Internet Archive (http://archive.org/index.php).

Основанный в качестве некоммерческой  организации в 1996 году Internet Archive (IA) собирает информационный контент (копии веб-страниц, графические материалы, видео-, аудиозаписи, программное обеспечение), обеспечивает архивирование и долгосрочное хранение собранного материала и свободный (бесплатный и открытый) доступ к своим базам данных для пользователей Интернета. Декларируемой целью IA является сохранение культурно-исторических ценностей цивилизации в эпоху интернет-технологий. Аккумулируемые  IA собрания фильмов, аудио, текстов и программного обеспечения, являются общественным достоянием или защищены лицензией Creative Commons. С 2007 г. IA имеет юридический статус библиотеки. Сервера IA расположены в Сан-Франциско, зеркала серверов дублируют их в Новой Александрийской библиотеке и Амстердаме.

Практически все отдельные проекты в структуре  IA могут быть востребованы в журналистском источниковедении, но в первую очередь Open Library и WayBack Machine. Общественный проект Open Library (http://openlibrary.org/) по сканированию всего мирового книжного фонда (one web page for every book ever published. It's a lofty but achievable goal.) осуществляется в рамках Internet Archive c октября 2005 г. На февраль 2013 года библиотека содержит в открытом доступе около 2 миллионов книг, в каталог библиотеки занесено больше 22 миллионов изданий (включая изображения и документы в формате PDF). В 13 центрах оцифровки крупнейших библиотек мира сканируется около 1000 книг в день.

Проект WayBack Machine (http://archive.org/web/web.php) предназначен для того, чтобы запечатлеть и сохранить с возможной полнотой историю становления и развития Интернета посредством архивирования его информационных ресурсов. WayBack Machine запушен в конце 1996 года, и с тех пор пользователи Интернета получили возможность просматривать не только его актуальные ресурсы, но и те, которые уже давно прекратили свое существование на всех иных сетевых площадках. Например, по данным на 14 февраля 2013 года WayBack Machine были заархивированы и находились в свободном доступе следующие сетевые ресурсы:

  • учебная интернет-газета студентов специальности «Журналистика (веб-журналистика)» Института журналистики Белорусского государственного университета (http://www.websmi.by/)  41 раз (с 25 марта 2009 года по 31 января 2014 года);
  • региональная газета «Вечерний Брест» (http://www.vb.by/) 309 раз (с 9 октября 2002 года по 31 января 2014 года);
  • региональная газета Тамбовской области «Жердевские новости» (http://jernov.tamb.ru/) 31 раз (с 21 октября 2003 года по 31 января 2014 года).

Доступ к статистике, календарной и графической визуализациям выборки и непосредственно к самим ресурсам осуществляется с помощью собственной поисковой системы WayBack Machine. Необходимость в ней обусловлена тем, что WayBack Machine является самым масштабным хранилищем общедоступных ресурсов в Интернете и на февраль 2014 года его программные роботы регулярно архивируют веб-ресурсы с более чем 240 000 000 000 URL-адресов. Общий объем архива составляет более 5 петабайт данных. Эта база данных запрашивается более 1000 раз в секунду более чем 500 000 людьми в день. Для безопасного хранения и обработки информации объемом более 1 петабайта разработана программно-техническая платформа PetaBox.

Для научного исследования в области истории журналистики особое значение имеет аналитический инструментарий IA, который создавался в парадигме Big Data (Больших данных). Так, с его помощью легко установить, что в 1996 году средняя страница интернет-СМИ имела вес 15 КB и представляла собой статический текст с небольшим числом гиперссылок и одним графическим изображением. Для сравнения: в феврале 2013 года, для выборки популярных  300 000 сайтов, средняя страница имела вес 1280 КB, состояла из 88 ресурсов (графика, css, js), использовала данные более чем из 30 сторонних сайтов. Каждый из этих показателей неуклонно растет в течение нескольких последних лет.

В образовательном контексте работа с Internet Archive является фактором формирования журналистской ответственности в условиях, когда все сделанное тобою становится легкодоступным для всех и навсегда. 

   
Разделы