Bug 8173 - неправильные пробелы в LaTeX-выводе
: неправильные пробелы в LaTeX-выводе
Status: ASSIGNED
: Sisyphus
(All bugs in Sisyphus/ALDConvert)
: unstable
: all Linux
: P2 normal
Assigned To:
:
:
:
:
:
  Show dependency tree
 
Reported: 2005-10-10 11:02 by
Modified: 2013-08-15 19:42 (History)


Attachments


Note

You need to log in before you can comment on or make changes to this bug.


Description From 2005-10-10 11:02:07
Периодически в тексте наблюдаются неправильно подставленные/удалённые
конвертером пробелы. 

Примеры следуют:

Исходный текст                    Вывод latex-writer'a
--------------                    --------------------
``Dell 1024x768 Laptop Display Panel''        1024 x768
@freesource.info|http://freesource.info@     freesource. info
@linuxsupport.ru|http://linuxsupport. ru@     linuxsupport. ru
номер от 0 до n-1.                n -1
приводы (CD- и DVD-RW)                CD-и
------- Comment #1 From 2005-11-28 14:15:42 -------
Ещё примеры с цифрами:

Исходный текст      Вывод latex-writer'a
--------------      --------------------
ядро Linux 2.6.11   2.6 .11
6.8.2               6.8 .2
------- Comment #2 From 2005-12-16 04:18:53 -------
исправлено в -alt8: теперь в числах может быть сколько угодно точек, внутри
слова бывают не только буквы, есть висячий знак препинаания "-", а конструкция
"n-1" считается Бойлем-Мариоттом
------- Comment #3 From 2006-03-06 19:00:56 -------
разъём(ы)
даёт пробел: 
разъём (ы)

Вообще закрывать это явно преждевременно. 
------- Comment #4 From 2006-03-09 15:09:46 -------
> разъём(ы)
> даёт пробел: 
> разъём (ы)
То есть скобка -- это не знак препинания, а буква? Можно и так.
------- Comment #5 From 2006-03-09 17:27:23 -------
> > даёт пробел: 
> > разъём (ы)
> То есть скобка -- это не знак препинания, а буква? Можно и так.

Смотря что ты понимаешь под буквой/препинанием. 
Бывает ещё вот так: (например?!) 
И интересный вопрос, что будет со смайликом, если его угораздит встретиться в
тексте.
------- Comment #6 From 2006-03-09 18:00:38 -------
> > То есть скобка -- это не знак препинания, а буква? Можно и так.
> Смотря что ты понимаешь под буквой/препинанием.
"Буква" -- это то, из чего состоит слово. "Знак препинания" -- разделитель,
возможно, выделяемый пробелами. Похоже, ты за то, чтобы вообще не было "знаков
препинания"? Если уж разделитель, то разделитель? Это бы сильно упростило
mk_read, да, только тогда его переделывать немножко надо.

Знаки препинания были задуманы для борьбы с системными опечатками (например,
многие любят пробел перед запятой ставить). Видимо, это я зря, и стоит их
вообще
изъять? Это важный вопрос.

Некоторые знаки всё равно надо оставить самостоятельными единицами: "...", "-",
"--". Что ещё?

> Бывает ещё вот так: (например?!) 
> И интересный вопрос, что будет со смайликом, если его угораздит встретиться в
> тексте.
Попилится, если не будет взято в ^^.
------- Comment #7 From 2006-03-09 19:03:33 -------
> Знаки препинания были задуманы для борьбы с системными опечатками (например,
> многие любят пробел перед запятой ставить). Видимо, это я зря, и стоит их вообще
> изъять? Это важный вопрос.

Если борьба с опечатками -- единственное, для чего заведены знаки препинания --
то я однозначно за то, чтобы их изъять. 

Такого рода искусственно-интеллектуальные улучшения текста скорее должны
выполняться специальной утилитой -- той самой, которая также знает, где
следует ставить неразрывные пробелы, чем отбиваются инициалы от фамилии, 
отделять ли пробелами тире между Бойлем и Мариоттом и т. п. 
Это такой особый этап работы с текстом, его полиграфическое причёсывание, 
причём оно никогда не бывает полностью автоматическим -- слишком уж много 
разнообразных случаев. Мне знакомы пара велосипедов такого типа. 
На мой взгляд, эта задача ортогональна конвертации из одной разметки в другую.

> Некоторые знаки всё равно надо оставить самостоятельными единицами: "...", "-",
> "--". Что ещё?

Ну да, это те, которые на самом деле нуль-местные теги.
А дефис зачем к ним относится? 
------- Comment #8 From 2006-03-09 19:44:42 -------
(In reply to comment #7)

> Если борьба с опечатками -- единственное, для чего заведены знаки препинания
> то я однозначно за то, чтобы их изъять.
Не только. Ещё для того. чтобы output-преобразователи не слишком много
занимались postprocessing-ом. То есть для выделения символов, которые по
определению вполне могут быть не-буквами.

Однако, если подумать, это -- тоже ортогональная задача. Мало ли, какие символы
не являются буквами в текущем выходном формате? А формат хранения это снова
упростит.

Однако вот, например, кавычки. Насколько проще -- или сложнее -- работать с
тегом "закавыченный текст" вместо "левая кавычка, слово, слово, ..., правая
кавычка"? Особенно в рассуждении ёлочек и лапок? У меня сейчас закавыченный
текст -- это тег.

> > Некоторые знаки всё равно надо оставить самостоятельными единицами: "...",
"-", "--". Что ещё?
> Ну да, это те, которые на самом деле нуль-местные теги.
Так что, других нет?

> А дефис зачем к ним относится? 
А он не является нульместным тегом? Тогда незачем.

------- Comment #9 From 2006-03-09 19:58:14 -------
> Не только. Ещё для того. чтобы output-преобразователи не слишком много
> занимались postprocessing-ом. То есть для выделения символов, которые по
> определению вполне могут быть не-буквами.
> 
> Однако, если подумать, это -- тоже ортогональная задача. Мало ли, какие символы
> не являются буквами в текущем выходном формате? А формат хранения это снова
> упростит.
Безусловно ортогональная. Список символов, которые нужно экранировать,
специфичен для каждого формата, и там может оказаться что угодно. 
Предусматривать их все в общем формате хранения, видимо, не следует.

> Однако вот, например, кавычки. Насколько проще -- или сложнее -- работать с
> тегом "закавыченный текст" вместо "левая кавычка, слово, слово, ..., правая
> кавычка"? Особенно в рассуждении ёлочек и лапок? У меня сейчас закавыченный
> текст -- это тег.

Так а что мешает ему оставаться с тегом? 
Нормальный одноместный тег: открывающая последовательность, текст, закрывающая
последовательность. Чем отличается ``текст'' от <текст>?

> > > Некоторые знаки всё равно надо оставить самостоятельными единицами: "...",
> "-", "--". Что ещё?
> > Ну да, это те, которые на самом деле нуль-местные теги.
> Так что, других нет?

Абзац ещё -- \n\n. А больше я не могу припомнить.

> > А дефис зачем к ним относится? 
> А он не является нульместным тегом? Тогда незачем.

Похоже, незачем.
------- Comment #10 From 2006-05-13 23:52:39 -------
Кирилл, проверь. в каком состоянии эта бага. Может, её закрыть?
------- Comment #11 From 2008-04-02 15:04:34 -------
(In reply to comment #10)
> Кирилл, проверь. в каком состоянии эта бага. Может, её закрыть?

man(8) -> man (8)

С точками и дефисами ведет себя корректно.