Via Python mit Excel interagieren
10.06.2021, 08:20 Uhr
Zugriffe auf Excel-Objekte
Mit den Bibliotheken pandas und openpyxl können Sie Daten aus einem Excel-Tabellenblatt auslesen und vieles mehr.
Programmseitige Zugriffe auf Excel-Objekte sind nicht nur für Data Scientists interessant. Schließlich setzen die meisten großen Firmen Excel ein, zum Beispiel auch für betriebswirtschaftliche Kalkulationen. Daher verwundert es nicht, dass es zu diesem Zweck verschiedene Python-Pakete gibt. Die bekanntesten sind pandas, xlrd und openpyxl. Für die meisten Aufgaben ist pandas gut geeignet. Für spezielle Dinge, die über die üblichen Lese- und Schreiboperationen hinausgehen, ist openpyxl die richtige Wahl. Die xlrd-Bibliothek hat den Nachteil, dass sie aktuell nicht mehr weiterentwickelt wird und nur das XLS-Format unterstützt; XLSX-Excel-Arbeitsmappen oder Excel-Arbeitsmappen, die Makros enthalten (Dateityp .xlsm) lassen sich mit xlrd nicht ansprechen (Bild 1). Hier geht es im Weiteren ausschließlich um die pandas-Bibliothek. Die Bibliothek openpyxl wird Thema eines weiteren Beitrags sein.
Grundlage für die Darstellung der folgenden Beispiele ist die der Demonstration halber einfach gehaltene Datei Demo.xlsx. Sie hat drei Tabellenblätter (1. Halbjahr 2021, 2. Halbjahr 2020, 1. Halbjahr 2020) mit den Umsätzen von fünf Produkten für jeweils ein halbes Jahr. Den Aufbau sehen Sie in Bild 2 anhand des ersten Tabellenblatts. Aber natürlich können Sie die folgenden Beispiele auch mit jeder anderen Excel-Datei nachvollziehen.
Jetzt 1 Monat kostenlos testen!
Sie wollen zukünftig auch von den Vorteilen eines plus-Abos profitieren? Werden Sie jetzt dotnetpro-plus-Kunde.
- + Digitales Kundenkonto,
- + Zugriff auf das digitale Heft,
- + Zugang zum digitalen Heftarchiv,
- + Auf Wunsch: Weekly Newsletter,
- + Sämtliche Codebeispiele im digitalen Heftarchiv verfügbar