Bug 13870 - Character ranges misbehavior in UTF8 locale
: Character ranges misbehavior in UTF8 locale
Status: CLOSED NOTABUG
: Sisyphus
(All bugs in Sisyphus/grep)
: unstable
: all Linux
: P2 major
Assigned To:
:
: http://bugs.gentoo.org/show_bug.cgi?i...
:
:
:
  Show dependency tree
 
Reported: 2008-01-04 14:19 by
Modified: 2008-09-30 17:21 (History)


Attachments


Note

You need to log in before you can comment on or make changes to this bug.


Description From 2008-01-04 14:19:33
Для 2.5.1a-alt3 (как в Sisyphus, так и в Branch 4.0) при использовании в 
шаблонах в списках символов диапазонов (например, [A-Z]) в локали ru_RU.UTF-8 
наблюдаются ошибки в раскрытии таких диапазонов.

Пример:
$ cat test
A
a
K
k
Z
z

$ grep '[A-Z]' test
A
K
k
Z
z

$ LC_ALL=C grep '[A-Z]' test
A
K
Z

$ grep '[AKZ]' test
A
K
Z
------- Comment #1 From 2008-01-04 14:27:53 -------
Боян.

echo {A..Z} {a..z} | fmt -w 1 | LANG=C sort
echo {A..Z} {a..z} | fmt -w 1 | LANG=ru_RU sort
------- Comment #2 From 2008-01-04 16:07:58 -------
(In reply to comment #0)
> Для 2.5.1a-alt3 (как в Sisyphus, так и в Branch 4.0) при использовании в 
> шаблонах в списках символов диапазонов (например, [A-Z]) в локали ru_RU.UTF-8 
> наблюдаются ошибки в раскрытии таких диапазонов.

Collation в разных локалях отличается.
------- Comment #3 From 2008-01-25 17:27:47 -------
На будущее -- heirloom toolchest куда лучше работает с UTF-8 в среднем, чем
coreutils.
------- Comment #4 From 2008-05-30 19:42:31 -------
*** Bug 15851 has been marked as a duplicate of this bug. ***