<?xml version="1.0" encoding="UTF-8" ?>

<bugzilla version="5.2"
          urlbase="https://bugzilla.altlinux.org/"
          
          maintainer="jenya@basealt.ru"
>

    <bug>
          <bug_id>1709</bug_id>
          
          <creation_ts>2002-12-12 18:29:34 +0300</creation_ts>
          <short_desc>definitions of certain matched words can\&apos;t be retrieven</short_desc>
          <delta_ts>2008-09-06 23:23:06 +0400</delta_ts>
          <reporter_accessible>1</reporter_accessible>
          <cclist_accessible>1</cclist_accessible>
          <classification_id>4</classification_id>
          <classification>Development</classification>
          <product>Sisyphus</product>
          <component>dict</component>
          <version>unstable</version>
          <rep_platform>all</rep_platform>
          <op_sys>Linux</op_sys>
          <bug_status>REOPENED</bug_status>
          <resolution></resolution>
          
          
          <bug_file_loc></bug_file_loc>
          <status_whiteboard></status_whiteboard>
          <keywords></keywords>
          <priority>P5</priority>
          <bug_severity>minor</bug_severity>
          <target_milestone>---</target_milestone>
          
          
          <everconfirmed>1</everconfirmed>
          <reporter name="imz">vanyaz</reporter>
          <assigned_to name="Vitaly Lipatov">lav</assigned_to>
          <cc>aris</cc>
    
    <cc>cheusov</cc>
    
    <cc>imz</cc>
    
    <cc>lav</cc>
    
    <cc>mike</cc>
          
          

      

      

      

          <comment_sort_order>oldest_to_newest</comment_sort_order>  
          <long_desc isprivate="0" >
    <commentid>1553</commentid>
    <comment_count>0</comment_count>
    <who name="imz">vanyaz</who>
    <bug_when>2002-12-12 18:29:34 +0300</bug_when>
    <thetext>I\&apos;m working in a Russian environment. I want to see the definition for the German word uebrigens. I\&apos;m not able to enter the first letter. Therefore, i decide to use suffix matching. It matches the required word, but can\&apos;t retrieve the definition, because it transmits the request with a ? as the first letter.

The same problem in gnome-dictionary.

After all, it would be nice to have a matching algorithm that would match \&amp;quot;ae\&amp;quot; and the corresponding letter and the like. Now there is none such.
---
$ dict -s suffix brigens -r
* Send/2: client \&amp;quot;dict 1.8.0/rf on Linux 2.4.20-alt0.1-adv-up\&amp;quot;
match * suffix \&amp;quot;brigens\&amp;quot;
* Read: 220 arrakis.zephyrous dictd 1.8.0/rf on Linux 2.4.20-alt0.1-adv-up &amp;lt;auth                                                                                                 
.mime&amp;gt; &amp;lt;&lt;a href=&quot;mailto:50.10966.1039706374@arrakis.zephyrous&amp;gt&quot; target=&quot;_new&quot;&gt;50.10966.1039706374@arrakis.zephyrous&amp;gt&lt;/a&gt;;
* Status = 220
* Processed 2
* Read: 250 ok
* Status = 250
* Processed 3
* Processed 4
* Read: 152 1 matches found
* Status = 152
* Text: deu-eng \&amp;quot;ц╪brigens\&amp;quot;
* Text: .
* Read: 250 ok [d/m/c = 0/1/1055598; 1.000r 0.000u 0.000s]
* Status = 250
* Processed 10
* Send/13
* Processed 13
* Send/14: define deu-eng \&amp;quot;?brigens\&amp;quot;
quit
* Read: 552 no match [d/m/c = 0/0/16; 0.000r 0.000u 0.000s]
* Status = 552
* Processed 11
No definitions found for \&amp;quot;?brigens\&amp;quot;
* Processed 1
* Read: 221 bye [d/m/c = 0/0/0; 1.000r 0.000u 0.000s]
* Status = 221
* Processed 14

---
dict-deu-eng-0.2-alt1
dict-1.8.0-alt1
dictd-1.8.0-alt1

</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>36511</commentid>
    <comment_count>1</comment_count>
    <who name="Vitaly Lipatov">lav</who>
    <bug_when>2006-03-07 10:45:54 +0300</bug_when>
    <thetext>$ dict -s suffix brigens -r 
dict: mbrtowc.c:79: mbrtowc: Assertion `(__ctype_get_mb_cur_max ()) &gt; 1&apos; 
failed. 
Aborted 
 </thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>43160</commentid>
    <comment_count>2</comment_count>
    <who name="Michael Shigorin">mike</who>
    <bug_when>2006-12-16 17:52:06 +0300</bug_when>
    <thetext>I guess #1672 is rather about this...</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>43161</commentid>
    <comment_count>3</comment_count>
    <who name="Michael Shigorin">mike</who>
    <bug_when>2006-12-16 17:53:59 +0300</bug_when>
    <thetext>reassign...</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>43235</commentid>
    <comment_count>4</comment_count>
    <who name="Vitaly Lipatov">lav</who>
    <bug_when>2006-12-17 00:01:48 +0300</bug_when>
    <thetext>В нашем клиенте dict, который лежит в Сизифе, используется libnatspec и 
символы, которые не могут быть отображены в текущей кодировке консоли, 
транслитерируются.
Что с запросами, надо проверить. Нужен более понятный (мне) testcase.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>44043</commentid>
    <comment_count>5</comment_count>
    <who name="Vitaly Lipatov">lav</who>
    <bug_when>2006-12-29 09:48:09 +0300</bug_when>
    <thetext>Пока не покажете пример, я буду считать что эта четырёхлетняя бага уже не 
воспроизводима.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>77055</commentid>
    <comment_count>6</comment_count>
    <who name="Ivan Zakharyaschev">imz</who>
    <bug_when>2008-09-05 01:32:26 +0400</bug_when>
    <thetext>(In reply to comment #5)
&gt; Пока не покажете пример, я буду считать что эта четырёхлетняя бага уже не 
&gt; воспроизводима.


Да всё тот же пример. Вот, на dict-1.9.15-alt5, dictd-1.9.15-alt5, dict-deu-eng-0.2-alt2.1.1.

Дело в кривости dict внутри: он перекодирует для пользователя слишком рано, а не должен. Он не должен перекодировать как для пользователя то, что посылает серверу на втором раунде (а получил на первом раунде переговоров).

Пример, когда всё хорошо (потому что перекодировка не мешает: нашёл по образцу, показал, что нашёл по образцу):

$ dict -s suffix leicherweise -r -m
deu-eng:  gleicherweise
$ dict -s suffix leicherweise -r   

From German-English Freedict dictionary [deu-eng]:

  gleicherweise [glaic,rvaiz@]
       alike
$ 

Пример, когда плохо: 
$ dict -s suffix brigens -r -m
deu-eng:  u:brigens
$ dict -s suffix brigens -r   
No definitions found for &quot;u:brigens&quot;
$ 

А должен был показать.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>77056</commentid>
    <comment_count>7</comment_count>
    <who name="Ivan Zakharyaschev">imz</who>
    <bug_when>2008-09-05 01:33:58 +0400</bug_when>
    <thetext>(In reply to comment #2)
&gt; I guess #1672 is rather about this...

No, it&apos;s different (or rather: it&apos;s opposite -- that kind of recoding interferes here into dict&apos;s sane operation).</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>77057</commentid>
    <comment_count>8</comment_count>
    <who name="Ivan Zakharyaschev">imz</who>
    <bug_when>2008-09-05 01:36:39 +0400</bug_when>
    <thetext>(In reply to comment #6)

$ locale
LANG=ru_RU.KOI8-R
LC_CTYPE=&quot;ru_RU.KOI8-R&quot;
LC_NUMERIC=&quot;ru_RU.KOI8-R&quot;
LC_TIME=&quot;ru_RU.KOI8-R&quot;
LC_COLLATE=&quot;ru_RU.KOI8-R&quot;
LC_MONETARY=&quot;ru_RU.KOI8-R&quot;
LC_MESSAGES=POSIX
LC_PAPER=&quot;ru_RU.KOI8-R&quot;
LC_NAME=&quot;ru_RU.KOI8-R&quot;
LC_ADDRESS=&quot;ru_RU.KOI8-R&quot;
LC_TELEPHONE=&quot;ru_RU.KOI8-R&quot;
LC_MEASUREMENT=&quot;ru_RU.KOI8-R&quot;
LC_IDENTIFICATION=&quot;ru_RU.KOI8-R&quot;
LC_ALL=
$ 

&gt; Пример, когда плохо: 
&gt; $ dict -s suffix brigens -r -m
&gt; deu-eng:  u:brigens
&gt; $ dict -s suffix brigens -r   
&gt; No definitions found for &quot;u:brigens&quot;
&gt; $ 
&gt; 
&gt; А должен был показать.

</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>77157</commentid>
    <comment_count>9</comment_count>
    <who name="Michael Shigorin">mike</who>
    <bug_when>2008-09-06 11:47:15 +0400</bug_when>
    <thetext>Иван, а не хотите заняться dict?  У нас он последние годы неухоженный...</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>77178</commentid>
    <comment_count>10</comment_count>
    <who name="Vitaly Lipatov">lav</who>
    <bug_when>2008-09-06 21:12:09 +0400</bug_when>
    <thetext>Что значит неухоженный? См. changelog?
И нет ли здесь того, кто голосовал за прекращение борьбы за koi8-r?</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>77180</commentid>
    <comment_count>11</comment_count>
    <who name="Yuri N. Sedunov">aris</who>
    <bug_when>2008-09-06 21:31:18 +0400</bug_when>
    <thetext>(In reply to comment #10)
&gt; Что значит неухоженный? См. changelog?
&gt; И нет ли здесь того, кто голосовал за прекращение борьбы за koi8-r?
&gt; 

Разве koi8-r в данном случае имеет значение?

</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>77182</commentid>
    <comment_count>12</comment_count>
    <who name="Vitaly Lipatov">lav</who>
    <bug_when>2008-09-06 23:23:05 +0400</bug_when>
    <thetext>Что-то добавление ключа -n не решает проблему.
Похоже всё-таки локаль тут ни при чём.</thetext>
  </long_desc>
      
      

    </bug>

</bugzilla>