[oodisc] сжатие папок в mozilla -mail

Dmitry Agafonov aga на office.rsm.ru
Чт Сен 1 11:46:20 MSD 2005


Итак, :)

Я не могу ручаться за 100% правду ниже изложенного, но думаю, что 
недалек от истины.

Ящики у почтовиков mozilla - это набор почтовых папок в каталоге Mail 
профиля в формате unix mbox с добавленными своими X- хедерами для 
хранения служебной информации. Рядом с файлами папок (они без 
расширения) лежат индексные/статусные файлы *.msf (в переводе громоптицы 
- "общие файлы"), где, в бинарноподобном виде содержится служебная 
информация для быстрого отображения почтовых папок, какие-то флаги и 
прочие данные, которые могут быть сгенерированы из писем (т.е. файлы 
*.msf можно удалять).

В файле почтовой папке письма лежат в текстовом виде, первая строка, 
означающая начало письма, начинается с "From ". Вы не поверите, но в 
тексте писем (в формате text/plain) нельзя переслать такую строку - она 
заменится на ">From ", поэтому признак начала письма уникален. В начале 
письма идут заголовки до первой пустой строки, затем до начала 
следующего письма идет построчно текст письма (возможно, в кодировке 
MIME или иной).

Экспериментально я выяснил, что удаленные письма в ящике содержат 
заголовок "X-Mozilla-Status: NNN9", где N - какие-то цифры (обычно 0 или 
1, но это не важно). Найдя в заголовках такую строку можно смело 
пропускать все до строки "From ", т.е. следующего письма. Можно, к 
стати, вырезать автопомеченные спамом письма с заголовками: "Subject: 
[SPAM]<текст заголовка>", "Subject: *SPAM*<текст заголовка>" и 
"X-Spam-Status: Yes;<описание причины>" и другие.

Мы у себя делали такие фильтры (для других, правда, задач) и на perl 
(проще) и на С, все работает на ура.

ЗЫ. Осознаю, что сказанное выше - чистый оффтоп, но к сожалению не могу 
дать референс на опенсорс программу, работающую по данному алгоритму... 
Могу присоединиться к автору письма, которое пришло, пока я писал этот 
опус и порекомендовать вам переход на Fx и Tb.

Andrey Pokalo пишет:

> Dmitry Agafonov пишет:
>
>> Привет!
>>
>> Умные админы пишут программы на perl для удаления писем с 
>> /X-Mozilla-Status: \d\d\d9/ :)
>> Потому как ящики эти в текстовом формате...
>
>
> просветите поподробнее, плз, а то я до умного пока не дорос... :-)
>
---поскипано---

-- 
Дмитрий Агафонов
руководитель отдела ИТ
ООО "Радиосервис Мобил"
Саратов, Россия
Тел.: (8452) 72-66-08, 73-43-46
mailto:aga на office.rsm.ru
http://www.rsm.ru/
--
Информационно-развлекательный
голосовой портал ФАКТ
http://fact.rsm.ru/



Подробная информация о списке рассылки Oo-discuss