Difference between revisions of "RU/kb/00000320"
From Wiki
Jump to navigationJump to searchm (9 версий) |
|||
Line 19: | Line 19: | ||
− | {{ | + | {{SignYear|Sancho|А. Е. Харламенков|2010}} |
{{RUkbWriterBottom}} | {{RUkbWriterBottom}} |
Revision as of 09:06, 27 August 2011
Форматирование в DOS-редакторах осуществлялось с помощью пробелов и разрывов абзаца. Разделителями абзацев являлись один или несколько пустых абзацев. Обычно такие документы сохранялись в виде txt-файлов в формате ASCII.
В настоящее время подобное форматирование встречается в псевдо-html, используемом во многих электронных библиотеках.
Существует следующих алгоритм преобразования подобных файлов:
- Следует найти эти "истинные" разделители абзацев.
Для этого регулярными выражениями требуется заменить "символ абзаца в начале строки" на не встречающуюся в данном документе последовательность символов.
Например "QWERTYTREWQ". Произвести поиск "символа абзаца в начале строки". Регулярное выражение для этого (строка Найти): ^$
В строке Заменить ввести QWERTYTREWQ[1] - Далее - заменить все символы абзаца на пробел. То есть в случае с ¶ - искать надо $.
Регулярное выражение для этого (строка Найти): $
В строке Заменить нажать ПРОБЕЛ . - Далее - выполнить обратную замену "QWERTYTREWQ" на символ абзаца (¶).
Регулярное выражение для этого (строка Найти): QWERTYTREWQ
В строке Заменить ввести \n
Если же переносы строк в абзацах отформатированы "мягким переводом строки" ( ⇧ Shift + ↵ Enter ), то второй шаг немного меняется. В этом случае регулярное выражение в строке Найти будет \n В строке Заменить нажать Пробел .
- ↑ Любая, гарантированно не встречающаяся в документе последовательность символов.