[oodisc] сжатие папок в mozilla -mail
Dmitry Agafonov
aga на office.rsm.ru
Чт Сен 1 11:46:20 MSD 2005
Итак, :)
Я не могу ручаться за 100% правду ниже изложенного, но думаю, что
недалек от истины.
Ящики у почтовиков mozilla - это набор почтовых папок в каталоге Mail
профиля в формате unix mbox с добавленными своими X- хедерами для
хранения служебной информации. Рядом с файлами папок (они без
расширения) лежат индексные/статусные файлы *.msf (в переводе громоптицы
- "общие файлы"), где, в бинарноподобном виде содержится служебная
информация для быстрого отображения почтовых папок, какие-то флаги и
прочие данные, которые могут быть сгенерированы из писем (т.е. файлы
*.msf можно удалять).
В файле почтовой папке письма лежат в текстовом виде, первая строка,
означающая начало письма, начинается с "From ". Вы не поверите, но в
тексте писем (в формате text/plain) нельзя переслать такую строку - она
заменится на ">From ", поэтому признак начала письма уникален. В начале
письма идут заголовки до первой пустой строки, затем до начала
следующего письма идет построчно текст письма (возможно, в кодировке
MIME или иной).
Экспериментально я выяснил, что удаленные письма в ящике содержат
заголовок "X-Mozilla-Status: NNN9", где N - какие-то цифры (обычно 0 или
1, но это не важно). Найдя в заголовках такую строку можно смело
пропускать все до строки "From ", т.е. следующего письма. Можно, к
стати, вырезать автопомеченные спамом письма с заголовками: "Subject:
[SPAM]<текст заголовка>", "Subject: *SPAM*<текст заголовка>" и
"X-Spam-Status: Yes;<описание причины>" и другие.
Мы у себя делали такие фильтры (для других, правда, задач) и на perl
(проще) и на С, все работает на ура.
ЗЫ. Осознаю, что сказанное выше - чистый оффтоп, но к сожалению не могу
дать референс на опенсорс программу, работающую по данному алгоритму...
Могу присоединиться к автору письма, которое пришло, пока я писал этот
опус и порекомендовать вам переход на Fx и Tb.
Andrey Pokalo пишет:
> Dmitry Agafonov пишет:
>
>> Привет!
>>
>> Умные админы пишут программы на perl для удаления писем с
>> /X-Mozilla-Status: \d\d\d9/ :)
>> Потому как ящики эти в текстовом формате...
>
>
> просветите поподробнее, плз, а то я до умного пока не дорос... :-)
>
---поскипано---
--
Дмитрий Агафонов
руководитель отдела ИТ
ООО "Радиосервис Мобил"
Саратов, Россия
Тел.: (8452) 72-66-08, 73-43-46
mailto:aga на office.rsm.ru
http://www.rsm.ru/
--
Информационно-развлекательный
голосовой портал ФАКТ
http://fact.rsm.ru/
Подробная информация о списке рассылки Oo-discuss