<?xml version="1.0" encoding="UTF-8" ?>

<bugzilla version="5.2"
          urlbase="https://bugzilla.altlinux.org/"
          
          maintainer="jenya@basealt.ru"
>

    <bug>
          <bug_id>50700</bug_id>
          
          <creation_ts>2024-06-20 17:50:40 +0300</creation_ts>
          <short_desc>HEALTH_WARN на ceph после рестарта сервисов для мониторов, OSD, MDS (нестабильная работа)</short_desc>
          <delta_ts>2024-08-23 03:01:34 +0300</delta_ts>
          <reporter_accessible>1</reporter_accessible>
          <cclist_accessible>1</cclist_accessible>
          <classification_id>4</classification_id>
          <classification>Development</classification>
          <product>Sisyphus</product>
          <component>ceph</component>
          <version>unstable</version>
          <rep_platform>x86_64</rep_platform>
          <op_sys>Linux</op_sys>
          <bug_status>CLOSED</bug_status>
          <resolution>NOTABUG</resolution>
          
          
          <bug_file_loc></bug_file_loc>
          <status_whiteboard></status_whiteboard>
          <keywords></keywords>
          <priority>P5</priority>
          <bug_severity>normal</bug_severity>
          <target_milestone>---</target_milestone>
          
          
          <everconfirmed>1</everconfirmed>
          <reporter name="Tatyana Gagina">tatyana</reporter>
          <assigned_to name="Alexey Shabalin">shaba</assigned_to>
          <cc>maks1ms</cc>
    
    <cc>shaba</cc>
          
          <qa_contact>qa-sisyphus</qa_contact>

      

      

      

          <comment_sort_order>oldest_to_newest</comment_sort_order>  
          <long_desc isprivate="0" >
    <commentid>247905</commentid>
    <comment_count>0</comment_count>
    <who name="Tatyana Gagina">tatyana</who>
    <bug_when>2024-06-20 17:50:40 +0300</bug_when>
    <thetext>Стенды, обновлённые до Sisyphus:
ALT Server x86-64

Версия: ceph-18.2.2-alt1

Шаги:
1. Настроить кластер ceph 

2. Включить модуль:
# ceph mgr module enable dashboard 
или 
# ceph mgr module enable dashboard --force (ввиду https://bugzilla.altlinux.org/50698)

3. # systemctl restart ceph-mon.target

4. Проверить статус кластера:
# ceph -s


Результат: 
  cluster:
    id:     ddf192ff-5f3e-4911-ba6d-0c797f9dddb2
    health: HEALTH_WARN
            1 filesystem is degraded
            1 MDSs report slow metadata IOs
            Reduced data availability: 17 pgs inactive, 111 pgs peering

Дополнительно - при выполнении: 
1) # systemctl restart ceph-osd.target &amp;&amp;  ceph -s
cluster:
    id:     0a8c1dee-60e3-4a4e-9c7f-83716ae9604c
    health: HEALTH_WARN
            3 osds down
            1 host (3 osds) down
Degraded data redundancy: 26/78 objects degraded (33.333%), 16 pgs degraded

2) # systemctl restart ceph-mds.target &amp;&amp; ceph -s  
  cluster:
    id:     0a8c1dee-60e3-4a4e-9c7f-83716ae9604c
    health: HEALTH_WARN
            insufficient standby MDS daemons available
или
Degraded data redundancy: 26/78 objects degraded (33.333%), 16 pgs degraded

Не на всех хостах одинаково отрабатывает.

Ожидаемое поведение: состояние кластера не должно становиться &quot;HEALTH_WARN&quot;</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>247906</commentid>
    <comment_count>1</comment_count>
    <who name="Tatyana Gagina">tatyana</who>
    <bug_when>2024-06-20 18:00:46 +0300</bug_when>
    <thetext>Дополнительно: спустя некоторое время 1-1,5 статус меняется на &apos;health: HEALTH_OK&apos;</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>250463</commentid>
    <comment_count>2</comment_count>
    <who name="Alexey Shabalin">shaba</who>
    <bug_when>2024-08-23 03:01:34 +0300</bug_when>
    <thetext>Не вижу никакой не стабильности.
Стабильно перегружается и стабильно вас об этом предупреждают в статусе.</thetext>
  </long_desc>
      
      

    </bug>

</bugzilla>