База Знаний: Writer. Преобразование текстов из старых DOS-редакторов, в которых конец строки обозначался концом абзаца (Enter)
From Wiki
Revision as of 16:12, 17 September 2011 by Sancho (talk | contribs) (moved RU/kb/10000050 to RU/kb/00000320)
Форматирование в DOS-редакторах осуществлялось с помощью пробелов и разрывов абзаца. Разделителями абзацев являлись один или несколько пустых абзацев. Обычно такие документы сохранялись в виде txt-файлов в формате ASCII.
В настоящее время подобное форматирование встречается в псевдо-html, используемом во многих электронных библиотеках.
Существует следующих алгоритм преобразования подобных файлов:
- Следует найти эти "истинные" разделители абзацев.
Для этого регулярными выражениями требуется заменить "символ абзаца в начале строки" на не встречающуюся в данном документе последовательность символов.
Например "QWERTYTREWQ". Произвести поиск "символа абзаца в начале строки". Регулярное выражение для этого (строка Найти): ^$
В строке Заменить ввести QWERTYTREWQ[1] - Далее - заменить все символы абзаца на пробел. То есть в случае с ¶ - искать надо $.
Регулярное выражение для этого (строка Найти): $
В строке Заменить нажать ПРОБЕЛ . - Далее - выполнить обратную замену "QWERTYTREWQ" на символ абзаца (¶).
Регулярное выражение для этого (строка Найти): QWERTYTREWQ
В строке Заменить ввести \n
Если же переносы строк в абзацах отформатированы "мягким переводом строки" ( ⇧ Shift + ↵ Enter ), то второй шаг немного меняется. В этом случае регулярное выражение в строке Найти будет \n В строке Заменить нажать Пробел .
- ↑ Любая, гарантированно не встречающаяся в документе последовательность символов.