База Знаний: Writer. Преобразование текстов из старых DOS-редакторов, в которых конец строки обозначался концом абзаца (Enter)
From Wiki
Jump to navigationJump to searchБаза Знаний: Writer. Специальный поиск и замена
Форматирование в DOS-редакторах осуществлялось с помощью пробелов и разрывов абзаца. Разделителями абзацев являлись один или несколько пустых абзацев. Обычно такие документы сохранялись в виде txt-файлов в формате ASCII.
В настоящее время подобное форматирование встречается в псевдо-html, используемом во многих электронных библиотеках.
Существует следующих алгоритм преобразования подобных файлов:
- Следует найти эти "истинные" разделители абзацев.
Для этого регулярными выражениями требуется заменить "символ абзаца в начале строки" на не встречающуюся в данном документе последовательность символов.
Например "QWERTYTREWQ". Произвести поиск "символа абзаца в начале строки". Регулярное выражение для этого (строка Найти): ^$
В строке Заменить ввести QWERTYTREWQ - Далее - заменить все символы абзаца на пробел. То есть в случае с ¶ - искать надо $.
Регулярное выражение для этого (строка Найти): $
В строке Заменить нажать ПРОБЕЛ. - Далее - выполнить обратную замену "QWERTYTREWQ" на символ абзаца (¶).
Регулярное выражение для этого (строка Найти): QWERTYTREWQ
В строке Заменить ввести \n
Если же переносы строк в абзацах отформатированы "мягким переводом строки" ([SHIFT]+[ENTER]), то второй шаг немного меняется. В этом случае регулярное выражение в строке Найти будет \n В строке Заменить нажать ПРОБЕЛ.