
Am 16. Februar 2025 präsentiert die Gmail-App für Android und iOS ein wichtiges Update im Bereich Rechnungsmanagement. Wie Stadt-Bremerhaven berichtet, haben Nutzer nun die Möglichkeit, Rechnungen direkt in der Gmail-App einzusehen und zu begleichen. Das System ist in der Lage, eingehende Rechnungen automatisch zu erkennen und wichtige Informationen übersichtlich darzustellen.
Die neue Funktionalität der Zusammenfassungskarten erlaubt es dem Nutzer, Daten wie den Betrag, die Fälligkeit und den Zahlungsempfänger einfach abzulesen. Ergänzend dazu ermöglicht die Integration mit Google Tasks Erinnerungen zur späteren Begleichung.
Technische Umsetzung und weitere Entwicklungen
Die technische Umsetzung basiert auf der Erkennung von Rechnungsinformationen in E-Mails. Dies betrifft auch eine Rechnungsverarbeitungsanwendung, die mithilfe von Google Apps Script entwickelt wurde, wie Medium erläutert. Diese Anwendung nutzt das große Sprachmodell Gemini, um Rechnungen, die als E-Mail-Anhänge eintreffen, automatisch zu analysieren.
Durch zeitgesteuerte Trigger wird eine Automatisierung erreicht, die vor der Einführung von Gemini manuelle Überprüfungen erforderte. Das Modell ermöglicht es, Rechnungen automatisch zu analysieren und die relevanten Daten im JSON-Format zurückzugeben. E-Mails mit Rechnungen werden standardmäßig im „INBOX“-Label abgerufen, wobei die Anwendung die Gemini-API zur Analyse nutzt.
Die Benutzerfreundlichkeit wird durch die Low-Code-Plattform von Google Apps Script hervorgehoben, die eine nahtlose Integration mit Gmail und Google-Diensten ermöglicht. Im Konfigurationsblatt kann die Anwendung durch Klicken auf die „START“-Schaltfläche iniitiert werden. Zudem gibt es die Möglichkeit, spezifische Labels für die Rechnungsrecherche festzulegen.
Ein Beispiel für eine erfolgreiche Rechnungsanalyse liefert JSON-Daten zurück, die den Status der Rechnung anzeigen. Validierte Rechnungen erscheinen grün, während ungültige Rechnungen rot im Protokollblatt angezeigt werden. Bei ungültigen Rechnungen besteht zudem die Möglichkeit, automatisch eine E-Mail-Antwort mit den notwendigen Korrekturen zu senden.
Aktuelle Herausforderungen beinhalten die Nutzung der Gemini 1.5 API, die PDF-Daten nicht direkt verwenden kann. Stattdessen erfolgt eine Umgehung durch die Umwandlung in PNG-Bilder. Eine Aktualisierung des Skripts zur direkten Verwendung von PDF-Daten wurde am 23. Juli 2024 angekündigt, und das letzte Skript ist im Repository einsehbar.