![]()
Это простая консольная утилита (откомпилирована пока только под MS Windows) для удаления из html-файлов лишних символов и тэгов.
Позволяет сжать html-файлы без ущерба для их отображения обычно на 15-20%. В частности, она позволяет удалять из исходного текста страниц пары тэгов <span lang="ru"> ... </span> и <span lang="en"> ... </span>, которые любит вставлять MS FrontPage (используйте опцию -2). Может удалять лишние пробелы и коды перевода строк (опция -1), в результате чего разобраться в исходном коде страницы становится труднее. Умеет рекурсивно обходить каталоги (опция -r) и обрабатывать файлы по заданной маске (см. учебные примеры аналогичных программ).
Написана специально для работы с этим сайтом, но достаточно универсальна. Ее можно рассматривать также как еще один пример работы с виртуальными потоками C++ библиотеки LEM.
Исходные тексты
Исходные тексты находятся в подкаталоге \LEM\Demo\Streams\Html_Zip в исходниках библиотеки LEM.
Компиляция: проект для IDE CBuilder 6.0
Исполнимый файл
Версия для Windows: 200 Kb download zip (117 Kb)
Опции
Возможные две формы вызова:
html_zip опции файл_для_обработки
html_zip опции маска_файлов
В первом случае будет обработан единственный файл. Во втором случае будут обработаны файлы, подходящие по маске с использованием символов * (произвольная последовательность символов) и ? (один произвольный символ).
Опции:
-r - рекурсивно обрабатывать подкаталоги, начиная с текущего
-0 - включение всех опций чистки (то есть комбинации -1 -2 -3 -4)
-1 - удаление символов перевода строки '\r' и '\n'
-2 - удаление пар тэгов <span lang='ru'> ... </span> и <span lang='en'> ... </span>
-3 - удаление лишних пробелов
-4 - кодирование адреса e-mail
Скриншот
