1. Home
  2. News
  3. Download
    1. Thunderbird Release Version
    2. Thunderbird 140 ESR
    3. Thunderbird 128 ESR
    4. Thunderbird 115 ESR
    5. Thunderbird Beta Version
    6. Language Pack (User Interface)
    7. Dictionaries (Spell Check)
  4. Help & Lexicon
    1. Instructions for Thunderbird
    2. Questions & Answers (FAQ) about Thunderbird
    3. Help for this Website
  5. Forums
    1. Unresolved Threads
    2. Latest Posts
    3. Threads of the last 24 hours
  • Login
  • Register
  • 
  • Search
This Thread
  • Everywhere
  • This Thread
  • This Forum
  • Forum
  • Lexicon
  • Articles
  • Pages
  • More Options
  1. Thunderbird Mail DE
  2. Forum
  3. Hilfe zu E-Mail und allgemeines Arbeiten
  4. Migration / Import / Backups

exaktes Dateiformat für mbox-Dateien

  • Lord Wacky Armadillo
  • November 12, 2018 at 1:44 AM
  • Closed
  • Thread is Unresolved
  • Lord Wacky Armadillo
    Junior Member
    Posts
    2
    Member since
    11. Oct. 2015
    • November 12, 2018 at 1:44 AM
    • #1

    Um Rückfragen vorzubeugen, bitten wir um folgende Angaben:

    • Thunderbird-Version: 60.3.0
    • Betriebssystem + Version: Windows 10 Pro 1803
    • Kontenart (POP / IMAP): IMAP
    • Postfach-Anbieter (z.B. GMX): eigener IMAP-Server
    • Eingesetzte Antiviren-Software: Windows Defender
    • Firewall (Betriebssystem-intern/Externe Software): Windows
    • Router-Modellbezeichnung (bei Sende-Problemen): -

    Ich habe von verschiedenen überlappenden Backups 469 mbox-Dateien von Thunderbird mit insgesamt 287000 Mails die ich deduplizieren möchte. Diese konnte ich mit dem ImportExportTools-Addon importieren, aber sowohl Deduplizieren als auch Kopieren auf einen IMAP-Server um sie mit einem anderen Client oder direkt auf dem Server zu sortieren führt zu einer Fehlermeldung oder zum Programmabsturz. Bei der doch relativ großen Anzahl ist es für mich zu einem großen Teil auch nachvollziehbar dass es eben Grenzen gibt.

    Ich würde die Mails daher gerne außerhalb von Thunderbird deduplizieren, benötige sie dafür aber als einzelne Dateien. Mein erster Gedanke war, dass Thunderbird jetzt ja auch Maildir als Speicherformat unterstützt (ergibt dann eine Datei pro Mail) und ich einfach konvertieren kann. Aber auch das wurde mit der Fehlermeldung "... fehlgeschlagen" abgebrochen.

    Die mbox-Dateien lassen sich aber durch den eigentlich sehr einfachen Aufbau auch direkt leicht in einzelne Dateien (1 pro Mail) zerlegen. Vom mbox-Format gibt es mehrere Varianten und Thunderbird soll die mboxrd-Variante verwenden (mboxrd denke ich verstanden zu haben), aber leicht andere Quoting-Rules. Leider finde ich genau zu diesen kleinen Unterschieden zum normalen mboxrd-Format nix.

    Kennt jemand die genauen Abweichungen von Thunderbird-mbox zu mboxrd oder kennt die Codestelle im Sourcecode an der mbox gelesen oder geschrieben wird?

  • Chartwalker
    Member
    Posts
    7
    Member since
    11. Nov. 2018
    • November 12, 2018 at 4:58 AM
    • #2

    Wenn man wirklich durch das Unterholz der Fileformate krabbeln will, dann wäre Wotsit der Einstieg

    http://devel.archefire.org/mirrors/www.wo…d848.html?fc=11

    ODER

    http://justsolve.archiveteam.org/wiki/Sources

    das ist aber die russische Lösung

    DENN

    Meist führt ein Linuxsystem als Internetserver mit funktionierenden Onbord-Mitteln oder Linux-Tool schneller und dauerhafter zum Erfolg als die gleiche Aufgabe über den Support oder ext. Konvertierung unter Windows zu erreichen.

    Wenn man sich die Geschichte von Windows ansieht, dann kommt man zu dem Resultat, daß mit jeder Generation seit Windows 3,1 ein Drittel der Software wirklich 1:1 übernommen werden konnte, ein Drittel mit erheblichen Einschränkungen läuft und ein Drittel garnicht. Aus den letzten zwei Dritteln und Tonnen von vollgeheulten Tempos hat Microsoft seine Einnahmen generiert.

    Unter Linux gibt es seit man denken kann ein Onboard-Emailsystem wahlweise mit IMAP und POP was im wesentlichen bis heute so geblieben ist und alle nativen Anwendungen greifen darauf zurück, es sei denn die Anwendungen haben durch die Migration von Windows die Seuche ins Linux eingeschleppt.

    Unter Linux gibt es also bereits Scripte, die nahezu jedes externe Mbox-Format ins eigene Mbox-Format konvertieren und von dort aus kann man es mit Imap wieder in die bunte Windowswelt mit Outlock+Samba konvertieren und alle werden glücklich.

    Deswegen haben viele KMU's zwei Linuxserver - einer Läuft, der andere ist der Fallback, der allen Internetkram samt Firewall, Proxy und Email/FTP behandelt und alles dahinter samt Windows 7 oder XP vor Seuchen aller Art schützt.

    --

    • Thunderbird-Version: 60.3.0 mit IMAP
    • WIndows 7 64bit
    • Hoster: Diverse

    Edited once, last by Chartwalker (November 12, 2018 at 5:11 AM).

  • Solaris
    Guest
    • November 12, 2018 at 10:40 AM
    • #3

    Als Ideen:

    • Da du die E-Mails importieren konntest, könntest du einen Versuch mit Mailstore Home wagen, um die E-Mails auf deinen Server zu bekommen. Dieses Programm kann angeblich deutliche besser damit umgehen, eine große Anzahl E-Mails auf einen IMAP-Server zu kopieren als der Thunderbird dies kann.
    • Wenn du einzelnen Dateien benötigst um darin selbst nach den Duplikaten zu suchen, ließe sich das vielleicht auch über einen Ex- und Reimport als *.eml erreichen.
    • Zur Deduplikation bzw. dem Finden der Duplikate: Die Erweiterung RemoveDuplicateMessages kann dies in einem gewissen Rahmen. Ich habe diese Erweiterung selbst nie benutzt. Mir ist daher nicht bekannt, wie zuverlässig sie funktioniert und ob sie Duplikate auch über mehrere Ordner hinweg finden kann. Anschauen würde ich sie mir.
  • Lord Wacky Armadillo
    Junior Member
    Posts
    2
    Member since
    11. Oct. 2015
    • November 13, 2018 at 12:46 AM
    • #4

    Erstmal vielen Dank für die Tips.

    Quote from Chartwalker

    das ist aber die russische Lösung

    Das wäre mir relativ sympathisch, nur leider finde ich dort keine Details exakt zum Thunderbird-Mbox-Format.

    Quote from Chartwalker

    Meist führt ein Linuxsystem als Internetserver mit funktionierenden Onbord-Mitteln oder Linux-Tool schneller und dauerhafter zum Erfolg als die gleiche Aufgabe über den Support oder ext. Konvertierung unter Windows zu erreichen.

    Das ist auch ungefähr mein Ansatz. Nur brauche ich dazu die einzelnen Mails, dann kann ich die auf File-Ebene mit einfachen Tools deduplizieren und entweder über den LDA oder durch direktes Kopieren ins Maildir auf dem Server verfügbar machen.

    Quote from Solaris
    Da du die E-Mails importieren konntest, könntest du einen Versuch mit Mailstore Home wagen, um die E-Mails auf deinen Server zu bekommen. Dieses Programm kann angeblich deutliche besser damit umgehen, eine große Anzahl E-Mails auf einen IMAP-Server zu kopieren als der Thunderbird dies kann.

    Die Beschreibung klingt ja nicht schlecht und die Home-Variante soll für private Zwecke kostenlos sein. Wenn andere Wege nicht funktionieren werde ich das ausprobieren.

    Quote from Solaris
    Wenn du einzelnen Dateien benötigst um darin selbst nach den Duplikaten zu suchen, ließe sich das vielleicht auch über einen Ex- und Reimport als *.eml erreichen.

    Das war noch eine gute Idee, ich hatte EML für Extended ML (oder so) gehalten und gar nicht erst probiert. Im Prinzip liefert das die gewünschten einzelnen Dateien pro Mail, ich schaffe es aber mit den ImportExportTools immer nur für einen Ordner.

    Da es 469 Ordner sind scheint das leider nicht praktikabel.

    Vielleicht kann ich aber auch einfach alle mbox-Dateien aneinanderhängen und so auf einmal importieren, dann müsste alles in einem Verzeichnis sein. Idealerweise würde der EML-Export dann das von mir gesuchte liefern.

    Quote from Solaris
    Zur Deduplikation bzw. dem Finden der Duplikate: Die Erweiterung RemoveDuplicateMessages kann dies in einem gewissen Rahmen. Ich habe diese Erweiterung selbst nie benutzt. Mir ist daher nicht bekannt, wie zuverlässig sie funktioniert und ob sie Duplikate auch über mehrere Ordner hinweg finden kann. Anschauen würde ich sie mir.

    Ich habe "Remove Duplicate Messages (Alternate)" das schien mir bisher auch recht brauchbar, funktioniert aber bei der großen Zahl von Mails einfach gar nicht.

    Zum mboxrd-Format von Thunderbird glaube ich durch Probieren folgendes herausgefunden zu haben:

    Das originale mboxrd-Format verwendet eine mit "From " (Leerzeichen am Ende beachten) beginnende Zeile als Anfangskennung einer Mail auf die der Mailtext gefolgt von einer Leerzeile folgt. Danach folgt die Anfangskennung für die nächste Mail u.s.w.In der Mail enthaltene Zeilen die mit "From " beginnen werden im originalen mboxrd-Format mit '>' gequotet. Thunderbird scheint hier einfach ein Leerzeichen zu verwenden.


    Zeilen, die in der Mail mit 1 bis N Quote-Zeichen gefolgt von "From " beginnen

    erhalten ein zusätzliches Quote-Zeichen. Bis auf das unterschiedliche Quote-Zeichen scheint hier kein Unterschied zwischen Thunderbird-mbox und mboxrd zu bestehen. Damit lässt sich das ganze auch wieder eindeutig umkehren.

    Kann jemand diese Kodierung bestätigen oder gibt es noch andere Besonderheiten/Ausnahmen zu beachten?

  • generalsync
    Senior Member
    Reactions Received
    48
    Posts
    550
    Member since
    29. Aug. 2016
    Helpful answer
    1
    • November 13, 2018 at 2:00 AM
    • #5
    Quote from Lord Wacky Armadillo

    Codestelle im Sourcecode an der mbox gelesen oder geschrieben wird

    Einstiegspunkte: "Berkeley Mailbox stores" werden in der Klasse nsMsgBrkMBoxStore (header, implementation) verwaltet. Eventuell ebenfalls hilfreich: nsEmlxHelperUtils::ConvertToMboxRD aus dem Apple-Mail-Importer. Links sind jeweils für Thunderbird 60.

    Ich entwickle unter anderem Synchronisationssoftware für Kalender und Adressbücher – ohne Cloud oder Server.

  • Community-Bot September 3, 2024 at 8:40 PM

    Closed the thread.

Current app version

  • Thunderbird 144.0.1 veröffentlicht

    Thunder October 20, 2025 at 4:38 AM

Current 140 ESR version

  • Thunderbird 140.4.0 ESR veröffentlicht

    Thunder October 15, 2025 at 3:53 PM

Current 128 ESR version

  • Thunderbird 128.14.0 ESR veröffentlicht

    Thunder August 21, 2025 at 3:04 PM

No Advertisements

There are no advertisements here. Maybe you give the website owner (Alexander Ihrig - aka "Thunder") instead something to be able to finance these sites in the long run. Many Thanks!

Thank you for the support!

Coffee to be spent?

Donate now via Paypal*

*Forwarding to PayPal.Me

Thunderbird Mail DE
  1. Imprint & Contact
  2. Privacy Policy
    1. Cookie Policy
  3. Terms of Use
  4. Donation Call for Thunderbird
Help for this website
  • All website support articles
  • How to use website search
  • How to create a forums user account
  • How to create and edit a forums thread
  • How to reset your forums password
Copyright © 2003-2025 Thunderbird Mail DE

You are NOT on an official page of the Mozilla Foundation. Mozilla®, mozilla.org®, Firefox®, Thunderbird™, Bugzilla™, Sunbird®, Seamonkey®, XUL™ and the Thunderbird logo are (among others) registered trademarks of the Mozilla Foundation.

Powered by WoltLab Suite™