Одно из наиболее регулярных действий, совершаемых при работе с
браузером — сохранение веб-страниц. Его результатом, кроме собственно
полезного эффекта, становится стремительно растущий размер архивов на
винчестере. И если емкости современных дисков позволяют несколько
свысока смотреть на проблему нехватки пространства, то сортировка такого
беспорядочного архива и поиск по нему стандартными средствами
становятся настоящей головной болью. Для наведения порядка в готовых
собраниях служат всевозможные "настольные" индексаторы в духе Google
Desktop Search и его последователей. Есть и другой путь — изначально
сохранять страницы с помощью специализированных программ, которые и по
полочкам помогут все разложить, и в поиске нужной информацию
поспособствуют. Получается, что такая программа при серьезной работе с
сетевыми источниками входит в разряд повседневно необходимого софта. КГ
не обходила вниманием подобные пакеты, однако в героях ходили
самостоятельные коммерческие разработки. Сейчас же речь пойдет о
встроенном решении — адд-оне ScrapBook, разработанном одним японским
программистом для браузера Firefox.
Сайт
этого проекта можно найти по адресу: amb.vis.ne.jp/mozilla/scrapbook/.
Распространяется ScrapBook свободно. Весит приложение сущие пустяки —
несколько сотен килобайт — и устанавливается меньше чем за минуту
стандартным для дополнений Firefox образом. Важное для нас
обстоятельство — наличие русской версии программы. ScrapBook весьма
прост в освоении и работе. Он интегрируется в интерфейс Firefox в виде
боковой панели, которую можно вызвать либо из меню браузера, где
появляется новый одноименный пункт, либо, что гораздо удобней,
комбинацией Alt+K. Работа со ScrapBook, как и с другими подобными
решениями, четко делится на три этапа: сохранение страниц, управление
собранным архивом и настройку приложения. Сохранение страниц в архив
происходит с помощью контекстного меню, в котором содержатся пункты
Захватить веб-страницу, Захватить веб-страницу как… и Добавить в
закладки. Первый вариант наиболее простой и быстрый — достаточно выбрать
в списке необходимый каталог из списка недавно использованных или же
создать новый — и все готово: страница уже в архиве.

Второй
вариант предлагает набор дополнительных настроек: выбор сохраняемых
элементов (изображения, код JavaScript, CSS-стили), а также позволяет
автоматически сохранять файлы и страницы по ссылкам на сохраняемой
веб-странице. Среди опций — глубина захвата и выбор типа загружаемых
файлов, причем, если вы хотите сохранить файлы с какими-либо
экзотическими расширениями, достаточно просто перечислить эти расширения
через запятую в специальном поле. Если на открытой странице
присутствуют фреймы, ScrapBook может сохранить как всю страницу целиком,
так и отдельный нужный фрейм — соответствующие пункты появятся во все
том же контекстном меню. Дальнейшая работа с архивом в основном ведется с
помощью боковой панели ScrapBook. Ее главное назначение — демонстрация
содержимого собранного архива в виде дерева файлов и каталогов. Кроме
списка самого архива, на панели расположены поле поиска по архиву,
кнопки раскрытия дерева каталогов, создания новых папок и переключения
режима просмотра. Доступны два таких режима.

Первый
— общим списком сохраненных страниц и каталогов, отсортированных в
хронологическом порядке. Во втором режиме панель разделяется на две
части, при этом в верхней показываются только каталоги, а в нижней —
список страниц активного каталога. При большом архиве такой разделенный
режим гораздо удобней в использовании. По умолчанию список сортируется
по датам сохранения страниц, однако в настройках ScrapBook можно
выставить сортировку по заглавиям страниц, а также включить рекурсивную
сортировку вложенных каталогов. Система поиска может работать как по
всему тексту сохраненных страниц, так и по их отдельным характеристикам —
например, имени и дате сохранения. Радует, что в поиске работают
стандартные регулярные выражения.
Просмотр архива ведется в самом
браузере, без запуска каких-либо дополнительных приложений. О том, что
работа идет с локальной копией, свидетельствует только дополнительная
панель инструментов под просматриваемой страницей. Она содержит поле
добавления комментария, набор маркеров для выделения особо интересного
контента и инструмент создания кратких примечаний к нужным кускам текста
веб-страницы. Окно настроек ScrapBook состоит из нескольких вкладок,
отвечающих за различные аспекты поведения приложения. Особый интерес
представляют вкладки Изменение и Организация. Первая позволяет настроить
цветовую гамму маркеров, применяемых при работе с сохраненными
страницами. Вкладка Организация содержит важные опции: место хранения
сохраняемых файлов, а также использование нескольких архивов. Дело в
том, что все файлы и веб-страницы ScrapBook по умолчанию сохраняются в
каталоге профиля браузера Firefox. Гораздо удобнее и надежнее разделить
профиль и архивы. Для этого достаточно включить соответствующую опцию и
указать путь к новому каталогу архива. Более того, мы можем одновременно
использовать несколько архивов ScrapBook, переключаясь между ними по
мере необходимости.

Данная
функция называется Multi-ScrapBook и также может быть включена на
рассматриваемой вкладке. Несколько отдельных страниц из архива можно
склеить в единый файл — удобно при сохранении обсуждений на форумах или
больших статей, состоящих из нескольких частей. Данная операция
называется Объединение веб-страниц, вызывается из меню Инструменты
панели ScrapBook и выполняется в два этапа: сначала отбираются нужные
страницы, затем с помощью предпросмотра происходит знакомство с новым
единым файлом. При необходимости можно включить опцию удаления исходных
страниц из архива по завершении их объединения. Средства обслуживания
ScrapBook представлены инструментами проверки целостности и аварийного
восстановления архива. Для импорта уже присутствующих на винчестере
развалов сохраненных веб-страниц в архив ScrapBook можно воспользоваться
инструментом Сохранение нескольких URL. Одноименное диалоговое окно
содержит строку выбора каталога архива, куда будут импортированы новые
страницы, а также кнопку Детектор URL, предлагающую меню с выбором
режимов работы. Для решения заявленной выше задачи служит пункт Все
страницы в каталоге. Указываем путь, дожидаемся окончания импорта — и
можем прощаться с беспорядочными свалками веб-страниц на диске. Штатные
возможности экспорта ScrapBook достаточно скромны. По умолчанию
приложение умеет экспортировать страницы из архива только в формат HTML.

Результатом
становится отдельная папка для каждой страницы, в которой содержатся
все относящиеся к ней файлы. Это, конечно, не верх удобства, однако
позволяет переносить архивы между копиями ScrapBook на разных
компьютерах. Кроме того, дерево каталогов ScrapBook можно сохранять в
виде самостоятельной HTML- страницы. Функциональность ScrapBook можно
расширять с помощью подключаемых плагинов. Подборка таких плагинов
доступна на сайте проекта. Особый интерес представляют плагины CopyPage
Info, ScrapBook AutoSave и CHM Exporter. Первый формирует расширенное
описание веб-страницы, которое потом можно использовать в списке
литературы к какой-либо письменной работе. Особенно удобно то
обстоятельство, что формат этого описания можно настраивать
самостоятельно. В результате его можно приблизить к существующим
требованиям. Справедливости ради стоит отметить, что точного совпадения
со стандартом на описание электронных ресурсов лично я пока не встречал
ни в одном современном пакете архивирования веб-страниц — разница только
в количестве ошибок описания ресурсов, поэтому возможность ручной
настройки ссылок весьма кстати. Плагин AutoSave включает режим
автоматического фонового сохранения всех веб-страниц, открываемых в
браузере, а CHM Exporter добавляет удобную возможность экспорта данных
из архива ScrapBook в формат CHM.
Алексей Кутовенко
Опубликовано: "Компьютерная газета"
Комментариев нет:
Отправить комментарий