Bug 32430

Summary: readpst's output lacks email addresses in To fields in Sent
Product: Sisyphus Reporter: Ivan Zakharyaschev <imz>
Component: libpst-toolsAssignee: nbr <nbr>
Status: NEW --- QA Contact: qa-sisyphus
Severity: enhancement    
Priority: P3 CC: azol, cas, mike, nbr
Version: unstable   
Hardware: all   
OS: Linux   

Description Ivan Zakharyaschev 2016-08-25 17:05:27 MSK
libpst-tools-0.6.67-alt3

In the messages sent by this user (through Exchange) and saved under Sent, after doing readpst, the To field has only the full names of the people, but not the email addresses.

This is probably caused by the way Exchnage works.

Other ways to check how these To fields look:

* natively in Outlook
* in Outlook after import
* in evolution-3.20.5-alt1 after import with import-pst plugin (uses libpst)

Other tools to read PST which could be tested:

1. https://packages.altlinux.org/en/Sisyphus/srpms/libpff
2. https://packages.altlinux.org/en/Sisyphus/srpms/java-libpst
Comment 1 Ivan Zakharyaschev 2016-08-26 16:32:13 MSK
nbr@ writes:

> я кстати поигрался с java парсером.
>
> там ясно, почему нет "To" у некоторых сообщений - там есть "Display To" а есть и целая структура Recipient у которого есть email в неудобоваримом X.400 внутреннем формате и SmtpName. Такой структуры может и не быть - вот тогда и получаются такие огрызки.
>
> можно посмотреть в пакете java-libpst-javadoc

translation:

> I've played with the Java parser.
>
> It has made it clear why "To:" is "missing" in some messages -- there is a "Display To" value, but there is also a whole "Recipient" structure, which holds the email address in a hardly digestible X.400 internal format and "SmtpName". There can be no such structure (in some cases) -- an then we get such incomplete values.
>
> java-libpst-javadoc helps seeing this.
Comment 2 Ivan Zakharyaschev 2016-08-31 00:47:54 MSK
@cas: Андрей, а ты какой командой раскодировал значение заголовка To: ? (Для полноты report-а.)
Comment 3 Andrey Cherepanov 2016-08-31 10:22:44 MSK
(В ответ на комментарий №2)
> @cas: Андрей, а ты какой командой раскодировал значение заголовка To: ? (Для
> полноты report-а.)

import email
email.Header.decode_header("Subject: =?utf-8?B?U3RvcCBPdmVycGF5aW5nIGZvciBQcmludGVyIEluaw==?=")[1][0]
'Stop Overpaying for Printer Ink'
Comment 4 Ivan Zakharyaschev 2016-09-20 21:24:04 MSK
(In reply to comment #2)
> @cas: Андрей, а ты какой командой раскодировал значение заголовка To: ? (Для
> полноты report-а.)

Ещё один способ это смотреть -- функции из emacs24-gnus-5.13-alt8. Пример:

(require 'mm-decode)
(mail-decode-encoded-word-string
 "This is =?iso-8859-1?q?na=EFve,?= baby")

Или выделяем скопированный кусок из mbox, потом M-x mail-decode-encoded-word-region -- кусок будет переписан в раскодированном виде.