Difference between revisions of "RU/kb/00000320"
From Wiki
Jump to navigationJump to searchm (1 версия) |
m (9 версий) |
(No difference)
|
Revision as of 13:52, 19 May 2011
Форматирование в DOS-редакторах осуществлялось с помощью пробелов и разрывов абзаца. Разделителями абзацев являлись один или несколько пустых абзацев. Обычно такие документы сохранялись в виде txt-файлов в формате ASCII.
В настоящее время подобное форматирование встречается в псевдо-html, используемом во многих электронных библиотеках.
Существует следующих алгоритм преобразования подобных файлов:
- Следует найти эти "истинные" разделители абзацев.
Для этого регулярными выражениями требуется заменить "символ абзаца в начале строки" на не встречающуюся в данном документе последовательность символов.
Например "QWERTYTREWQ". Произвести поиск "символа абзаца в начале строки". Регулярное выражение для этого (строка Найти): ^$
В строке Заменить ввести QWERTYTREWQ[1] - Далее - заменить все символы абзаца на пробел. То есть в случае с ¶ - искать надо $.
Регулярное выражение для этого (строка Найти): $
В строке Заменить нажать ПРОБЕЛ . - Далее - выполнить обратную замену "QWERTYTREWQ" на символ абзаца (¶).
Регулярное выражение для этого (строка Найти): QWERTYTREWQ
В строке Заменить ввести \n
Если же переносы строк в абзацах отформатированы "мягким переводом строки" ( ⇧ Shift + ↵ Enter ), то второй шаг немного меняется. В этом случае регулярное выражение в строке Найти будет \n В строке Заменить нажать Пробел .
- ↑ Любая, гарантированно не встречающаяся в документе последовательность символов.