утилита HTML_ZIP - чистка и оптимизация HTML кода

Это простая консольная утилита (откомпилирована пока только под MS Windows) для удаления из html-файлов лишних символов и тэгов.

Позволяет сжать html-файлы без ущерба для их отображения обычно на 15-20%. В частности, она позволяет удалять из исходного текста страниц пары тэгов <span lang="ru"> ... </span> и <span lang="en"> ... </span>, которые любит вставлять MS FrontPage (используйте опцию -2). Может удалять лишние пробелы и коды перевода строк (опция -1), в результате чего разобраться в исходном коде страницы становится труднее. Умеет рекурсивно обходить каталоги (опция -r) и обрабатывать файлы по заданной маске (см. учебные примеры аналогичных программ).

Написана специально для работы с этим сайтом, но достаточно универсальна. Ее можно рассматривать также как еще один пример работы с виртуальными потоками C++ библиотеки LEM.

Исходные тексты

Исходные тексты находятся в подкаталоге \LEM\Demo\Streams\Html_Zip в исходниках библиотеки LEM.

Компиляция: проект для IDE CBuilder 6.0

Исполнимый файл

Версия для Windows: 200 Kb download zip (117 Kb)

 

Опции

Возможные две формы вызова:

html_zip опции файл_для_обработки

html_zip опции маска_файлов

В первом случае будет обработан единственный файл. Во втором случае будут обработаны файлы, подходящие по маске с использованием символов * (произвольная последовательность символов) и ? (один произвольный символ).

Опции:

-r - рекурсивно обрабатывать подкаталоги, начиная с текущего

-0 - включение всех опций чистки (то есть комбинации -1 -2 -3 -4)

-1 - удаление символов перевода строки '\r' и '\n'

-2 - удаление пар тэгов <span lang='ru'> ... </span> и <span lang='en'> ... </span>

-3 - удаление лишних пробелов

-4 - кодирование адреса e-mail

Скриншот

  © Mental Computing 2010