<?xml version="1.0" encoding="UTF-8" ?>

<bugzilla version="5.2"
          urlbase="https://bugzilla.altlinux.org/"
          
          maintainer="jenya@basealt.ru"
>

    <bug>
          <bug_id>40618</bug_id>
          <alias>pgo</alias>
          <creation_ts>2021-07-30 23:35:23 +0300</creation_ts>
          <short_desc>Enable build with PGO (profile-guided optimization)</short_desc>
          <delta_ts>2021-08-01 19:06:03 +0300</delta_ts>
          <reporter_accessible>1</reporter_accessible>
          <cclist_accessible>1</cclist_accessible>
          <classification_id>4</classification_id>
          <classification>Development</classification>
          <product>Sisyphus</product>
          <component>rpm-build</component>
          <version>unstable</version>
          <rep_platform>x86</rep_platform>
          <op_sys>Linux</op_sys>
          <bug_status>NEW</bug_status>
          <resolution></resolution>
          
          
          <bug_file_loc></bug_file_loc>
          <status_whiteboard></status_whiteboard>
          <keywords></keywords>
          <priority>P5</priority>
          <bug_severity>normal</bug_severity>
          <target_milestone>---</target_milestone>
          
          
          <everconfirmed>1</everconfirmed>
          <reporter name="Vitaly Chikunov">vt</reporter>
          <assigned_to name="placeholder@altlinux.org">placeholder</assigned_to>
          <cc>arseny</cc>
    
    <cc>glebfm</cc>
    
    <cc>imz</cc>
    
    <cc>iv</cc>
    
    <cc>ldv</cc>
    
    <cc>vt</cc>
          
          <qa_contact>qa-sisyphus</qa_contact>

      

      

      

          <comment_sort_order>oldest_to_newest</comment_sort_order>  
          <long_desc isprivate="0" >
    <commentid>201098</commentid>
    <comment_count>0</comment_count>
    <who name="Vitaly Chikunov">vt</who>
    <bug_when>2021-07-30 23:35:23 +0300</bug_when>
    <thetext>Некоторые пакеты выиграют от сборки с PGO (profile-guided optimization). Такая сборка есть в некоторых дистрибутивах (clearlinux) и уже есть в некоторых пакетах в ALT.

Общая задача, чтоб на неё ссылаться.

[1] https://en.wikipedia.org/wiki/Profile-guided_optimization
[2] https://lwn.net/Articles/830300/ Profile-guided optimization for the kernel</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>201116</commentid>
    <comment_count>1</comment_count>
    <who name="Vitaly Chikunov">vt</who>
    <bug_when>2021-08-01 00:55:10 +0300</bug_when>
    <thetext>Есть идея делать %prep + %build да раза, первый раз в optflags добавляется:

  -fprofile-generate -fprofile-dir=/tmp/pgo -fprofile-update=atomic

второй раз:

  -fprofile-use -fprofile-dir=/tmp/pgo -fprofile-correction

+ между ними делается find /tmp/pgo -name &apos;*conftest.gcda&apos; -delete.

Для профилирования используется или %check, или можно сделать макро %profile_use_exit, которое помещается в конец %build перед генерацией профиля - в первом проходе он не делает ничего, а во втором exit 0.

Идея Глеба - дополнить spec секцией (скажем) %profile_generate, где находится скрипт генерирующий профиль и само наличие этой секции запускает двойной build с PGO.

(В ней можно было бы, например, задавать и тип PGO с -fprofile-partial-training или без. Ну или управлять этим через макрос.)</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>201123</commentid>
    <comment_count>2</comment_count>
    <who name="Ivan Zakharyaschev">imz</who>
    <bug_when>2021-08-01 19:02:07 +0300</bug_when>
    <thetext>(Ответ для Vitaly Chikunov на комментарий #1)
&gt; Есть идея делать %prep + %build да раза, первый раз в optflags добавляется:
&gt; 
&gt;   -fprofile-generate -fprofile-dir=/tmp/pgo -fprofile-update=atomic
&gt; 
&gt; второй раз:
&gt; 
&gt;   -fprofile-use -fprofile-dir=/tmp/pgo -fprofile-correction
&gt; 
&gt; + между ними делается find /tmp/pgo -name &apos;*conftest.gcda&apos; -delete.

(Погуглил: это какие-то особые файлы, которые мешают второй стадии.)

&gt; Для профилирования используется или %check, или можно сделать макро

Я ещё подумал о получении feedback для второй сборки извне (из girar) и запуск второй сборки тоже извне.

При первом прогоне некоторые rpm собираются для профилирования, т.е. негодные для публикации. Потом всякие install check-и сохраняют информацию из обговоренного места (типа /feedback/for-SRPMNAME/*). Делается второй прогон (итерация задания, где должны ещё собираться пакеты, которым это требуется), во время которого подкладывается собранная информация. Она может быть из нескольких источников (install check разных бинарных пакетов и вообщеоткуда угодно при желании), так что её надо разложить как-то так:

/feedback/for-SRPMNAME/from-GENERATOR1/*
/feedback/for-SRPMNAME/from-GENERATOR2/*
...

Там можно сделать перед использованием на втором прогоне gcov-tool --merge разных источников информации.

Возникает мысль, что для воспроизводимости сборки нужно эту использованную информацию (профиль) сохранить рядом или внутри src.rpm. Только внутри сложно, потому что тогда меняется id src.rpm, да и для разных архитектур она разная. (Ну при желании использовать для этого формат src.rpm, понятный rpmbuild, можно хранить общий для всех архитектур оригинальный src.rpm, и для каждой архитектуры ещё свой с дополнительной информацией, можно без тех Source, которые есть в оригинальном, т.е. nosrc.rpm.)

* * *

У меня раньше были мысли о механизме feedback из girar для второй окончательной итерации сборки в связи с желанием исключить из Provides неимпортируемые python3-модули, так чтобы лишний раз не напрягать мейнтейнеров (автоматическая вторая итерация), но и не раздувать сборочную среду (BuildRequires), усложняя граф сборочных зависимостей циклами, поэтому не делать это полностью внутри одного запуска rpmbuild.</thetext>
  </long_desc><long_desc isprivate="0" >
    <commentid>201124</commentid>
    <comment_count>3</comment_count>
    <who name="Ivan Zakharyaschev">imz</who>
    <bug_when>2021-08-01 19:06:03 +0300</bug_when>
    <thetext>(Ответ для Ivan Zakharyaschev на комментарий #2)

&gt; /feedback/for-SRPMNAME/from-GENERATOR1/*
&gt; /feedback/for-SRPMNAME/from-GENERATOR2/*
&gt; ...
&gt; 
&gt; Там можно сделать перед использованием на втором прогоне gcov-tool --merge
&gt; разных источников информации.

gcov-tool merge

сливает пары (этого достаточно, чтобы слить и большее множество).</thetext>
  </long_desc>
      
      

    </bug>

</bugzilla>