База Знаний: Writer. Преобразование текстов из старых DOS-редакторов, в которых конец строки обозначался концом абзаца (Enter)

From Wiki
Revision as of 11:53, 18 January 2011 by Sancho (talk | contribs) (Корректировка кода)
Jump to navigationJump to search


Форматирование в DOS-редакторах осуществлялось с помощью пробелов и разрывов абзаца. Разделителями абзацев являлись один или несколько пустых абзацев. Обычно такие документы сохранялись в виде txt-файлов в формате ASCII.

В настоящее время подобное форматирование встречается в псевдо-html, используемом во многих электронных библиотеках.


Существует следующих алгоритм преобразования подобных файлов:

  1. Следует найти эти "истинные" разделители абзацев.
    Для этого регулярными выражениями требуется заменить "символ абзаца в начале строки" на не встречающуюся в данном документе последовательность символов.
    Например "QWERTYTREWQ". Произвести поиск "символа абзаца в начале строки". Регулярное выражение для этого (строка Найти): ^$
    В строке Заменить ввести QWERTYTREWQ[1]
  2. Далее - заменить все символы абзаца на пробел. То есть в случае с - искать надо $.
    Регулярное выражение для этого (строка Найти): $
    В строке Заменить нажать ПРОБЕЛ.
  3. Далее - выполнить обратную замену "QWERTYTREWQ" на символ абзаца ().
    Регулярное выражение для этого (строка Найти): QWERTYTREWQ
    В строке Заменить ввести \n

Если же переносы строк в абзацах отформатированы "мягким переводом строки" ( ⇧ Shift  +  ↵ Enter ), то второй шаг немного меняется. В этом случае регулярное выражение в строке Найти будет \n В строке Заменить нажать  Пробел .



Template:RUsignyear




  1. Любая, гарантированно не встречающаяся в документе последовательность символов.


К началу страницы