EMILiA: KI-gestützte Software für die Archivierung und Nutzbarmachung von E-Mails

E-Mails sind längst fester Bestandteil des privaten und beruflichen Alltags geworden. In vielen Bereichen haben sie die analoge Briefkorrespondenz sogar vollständig ersetzt. Für eine repräsentative archivische Überlieferungsbildung müssen daher definitiv auch digitale Kommunikationsformen berücksichtigt werden. Die Archivierung von E-Mails kann jedoch mit zahlreichen Schwierigkeiten einhergehen. Aufgrund von Spam, Rundmails und der allgemeinen Niedrigschwelligkeit elektronischer Kommunikation enthalten E-Mail-Accounts häufig riesige Datenmengen, die eine händische Bewertung und Erschließung undenkbar machen.

Aus diesem Grund wollen wir im Rahmen des EMILiA-Projekts eine teilautomatisierte Software entwickeln, die Archivfachkräfte bei der Übernahme, Bewertung, Erschließung und Nutzbarmachung von E-Mails unterstützt. Hierbei arbeiten wir eng mit dem Archiv der Max-Planck-Gesellschaft und der AG Zuverlässige Systeme der Freien Universität Berlin zusammen. Finanziert wird das Projekt durch das Förderprogramm „ProValid“ der Investitionsbank Berlin.

Um weitere Informationen zum Projektfortschritt zu erhalten, können Sie unseren Newsletter abonnieren. Außerdem bieten wir in regelmäßigen Abständen Webinare an, bei denen wir über aktuelle Fortschritte berichten und Feedback aus der Fachcommunity einholen. Weiter unten finden Sie Informationen zu den geplanten Funktionen, zum aktuellen Stand des Projekts sowie zu anstehenden Veranstaltungen und Publikationen.

Funktionen

Übernahme

Übernahme

Intuitives Abgabetool
Formaterkennung
Virenscan
Authentizität
Integrität
SIP-Erstellung
Bewertung

Bewertung

Bewertungsdashboard mit Statistiken
Dublettenerkennung
Spamfilterung
Such- und Filterfunktionen
Erschließung

Erschließung

Personenerkennung
Themenerkennung
Ortserkennung
Klarnamenextraktion
Rekonstruktion von Threads
Export

Export in digitales Langzeitarchiv

Schnittstelle für den reibungslosen Export in ein digitales Langzeitarchiv
Datenschutz

Datenschutz

Identifikation und optionale Anonymisierung personenbezogener Daten
Nutzung

Nutzung

Recherchedatenbank
DIP-Erstellung
Such- und Filterfunktionen

Eine zeitnahe und rechtskonforme Nutzbarmachung von E-Mail-Postfächern ist nur mithilfe einer Anonymisierung denkbar. Aus diesem Grund wird EMILiA eine Funktion für die automatisierte Erkennung und optionale Anonymisierung personenbezogener Daten zur Verfügung stellen. Über den nachfolgenden Link gelangen Sie zu einer Demo, die Sie auch mit eigenen Daten ausprobieren können. Obwohl der wir keine Eingaben speichern, bitten wir Sie darum, aus Sicherheitsgründen keine Texte zu verwenden, die sensible Informationen enthalten.

Projektfortschritt

Meilenstein 1

Projektstart

Dank des Förderprogramms „ProValid“ konnten die notwendigen Mittel für die Umsetzung der Projektidee akquiriert werden.

Meilenstein 2

Konzeptphase

Bis auf kleinere Detailfragen ist das Grundkonzept abgeschlossen. Grundlage für den Aufbau des Systems ist das OAIS-Referenzmodell für die digitale Langzeitarchivierung. Die Software wird sich aus den Modulen „Übernahme“, „Bewertung und Erschließung“ und „Nutzung“ zusammensetzen. Die langfristige Speicherung erfolgt außerhalb des Systems. Allerdings sollen Funktionen für einen reibungslosen Export zur Verfügung gestellt werden.

Meilenstein 3

Meilenstein 4

Meilenstein 5

Meilenstein 6

Veranstaltungen

Projektteam