ꜛ Daten in PQ importieren → Aus CSV / Text (1)

Xtract: Import von Dat­en ein­er exter­nen Datei im Text-For­mat (*.csv, *.txt, *.prn, …) mit­tels Pow­er Query. Dieser Beitrag ist für absolute Ein­steiger ohne Vor­wis­sen geeignet. Teil 1, *.csv ohne Beson­der­heit­en.

Wis­sens­stand: Lev­el 1 ⇒ Pow­er Query für Ein­steiger – Keine Vorken­nt­nisse in PQ

Prolog

Zu Beginn ist es wichtig dass Sie eines wis­sen: Files mit der Endung *.csv wer­den typ­is­cher­weise in Win­dows zwar mit einem Excel-Sym­bol dargestellt und per Default bei einem Dop­pelk­lick auch mit Excel geöffnet, aber es sind und bleiben reinen Text-Dateien. Darum soll­ten Sie diese Dateien nie mit dieser Exten­sion mit Excel öff­nen son­dern stets (auch ohne PQ) importieren. Und wenn Sie auf Pow­er Query verzicht­en und den „klas­sis­chen” Weg gehen wollen, dann wählen Sie den passenden Lega­cy-Assis­ten­ten im Menü Dat­en | Dat­en abrufen. Später dazu mehr…

Datenimport *.csv (comma separated values)

Sie wollen Dat­en eines Files mit der Endung *.csv in den Pow­er Query-Edi­tor importieren. Und gle­ich zu Beginn der Hin­weis, dass das Wort „com­ma” prinzip­iell nur für die US-Vari­ante gilt. Hier in Deutsch­land (und diversen anderen europäis­chen Län­dern) wird das Semi­kolon ; statt des Kom­mas als Trennze­ichen zwis­chen den (kün­fti­gen) Spal­ten ver­wen­det. Der Hin­ter­grund ist, dass das Kom­ma bei uns ja als Dez­i­mal­tren­ner genutzt wird (in den USA ist es der Punkt). Wie Sie gut fest­stellen kön­nen, welch­er Tren­ner nun der richtige ist, wer­den Sie gle­ich erken­nen.

Damit Sie mit den gle­ichen Dat­en arbeit­en wie ich hier im Script, kön­nen Sie (jet­zt oder etwas später) dieses File von unserem Serv­er herun­ter­laden. Sie gehen (eventuell nach dem Down­load) den Weg über Dat­en | Abrufen und trans­formieren und Klick­en dann typ­is­cher­weise auf das Sym­bol Aus Text/csv oder im Menüband über das Sym­bol Dat­en abrufen | Aus Datei | Aus Text/csv. Anschließend öffnet sich der File-Dia­log, wo Sie die zu importieren­den Dat­en auswählen kön­nen. Nach der Auswahl des Files wird Ihnen der durch PQ „erkan­nte” Vorschlag für den kün­fti­gen Import ange­boten:

Beispiel­hafter Import-Dia­log direkt nach der Auswahl des Files

Hin­weis: Wenn Sie exakt die hierüber gezeigten Dat­en importieren möcht­en, dann laden Sie diese hier von unserem Serv­er (Bundestagsmitglieder_unsortiert.csv) herunter. Mein Vorschlag: Sie wer­den (ver­mut­lich) noch einige weit­ere Text­dateien im csv-For­mat herun­ter­laden wollen. In dieser zip-Datei find­en Sie all jene *.csv, welche hier disku­tiert wer­den. Hin­ter dem Link zur einzel­nen Datei find­en Sie in Klam­mern und kur­siv den eigentlichen File­na­men, wie er nach dem ent­pack­en vorhan­den ist.

Zugegeben, es gibt prak­tisch keine Ähn­lichkeit zwis­chen diesem Dia­log und dem Import-Fen­ster in Plain Excel. Aber dafür „erken­nt” Pow­er Query schon ver­schiedene Para­me­ter, die Sie in Excel per Hand auswählen müssen. Trotz dieser Pseu­do-Intel­li­genz haben Sie natür­lich die Möglichkeit, diese oder jene Ein­stel­lung nachzubessern.

Dateiur­sprung
Ich weiß nicht, wer den eigentlichen, US-mut­ter­sprach­lichen Begriff so eingedeutscht hat. Aber all­ge­mein ist der englis­che Begriff Code­page gebräuch­lich und der wird auch inter­na­tion­al angewen­det (und auch über­all richtig ver­standen). Grob, ja sehr grob erk­lärt: Unter­schiedliche Sys­teme spe­ich­ern Zeichen außer­halb des inter­na­tionalen Zeichen­satzes (also Zif­fern und A bis Z, a bis z, Satzze­ichen, bes­timmte Son­derze­ichen aber keine Umlaute) auf unter­schiedliche Weise ab. Jedes Zeichen hat im Zeichen­satz eine Zif­fer, die im eben beschriebe­nen all­ge­meinen Zeichen­satz auch immer gle­ich ist. So ste­ht die Zahl 65 immer für das große A. Aber beispiel­sweise unsere Umlaute haben auf dem Mac® (Apple-Gerät) eine andere Num­mer und das kann dazu führen, dass diese Zeichen nicht kor­rekt angezeigt wer­den.

Hier ste­ht der Wert 1252: Wes­teu­ropäisch (Win­dows) im Auswahl-Feld und der ist auch kor­rekt. Schauen Sie sich in der Vorschau-Tabelle ein­mal die Ein­träge mit Umlaut­en an und Sie wer­den erken­nen, dass die Namen kor­rekt dargestellt wer­den. Ändern Sie ver­such­sweise ein­mal die Ein­stel­lung des Dateiur­sprungs im Drop­Down auf die Zeile darüber, also 10000: Wes­teu­ropäisch (Mac):

Bei Umlaut­en sind deut­liche Unter­schiede sicht­bar

Bei der Frak­tion­s­ge­mein­schaft Bünd­nis 90/Die Grü­nen (und auch an anderen Stellen) ist klar zu erken­nen, dass die Umlaute nicht richtig dargestellt wer­den. Und Frau Schmidt (drit­tun­ter­ste sicht­bare Zeile) kommt übri­gens aus Ühlin­gen… Darum wech­seln Sie wieder rasch zu 1252… 💡 

Trennze­ichen
Hier hat Pow­er Query selb­st­ständig kor­rekt erkan­nt, dass die einzel­nen Spal­ten durch ein Semi­kolon getren­nt sind. Darum sind die Spal­ten darunter auch „sauber” getren­nt. Soll­ten ein­mal andere Tren­ner in der *.csv ver­wen­det wor­den sein und PQ erken­nt diese nicht oder nicht kor­rekt, erweit­ern Sie das Textfeld und tre­f­fen die passende Auswahl:

Die Auswahl –Benutzerdefiniert– gibt Ihnen alle Frei­heit­en…

Daten­type­r­ken­nung
Ich räume ein, dass ich hier so gut wie nie eine Änderung vornehme. Zumin­d­est nicht an dieser Stelle im Edi­tor. Ich behalte mir vor, den Daten­typ nach dem Import in den Edi­tor bei Bedarf meinen Wün­schen anzu­passen.

Schalt­fläche „Laden”
Ein Klick auf diese Schalt­fläche führt dazu, dass die Dat­en in dieser Form in eine Abfrage importiert und sofort in ein neues Tabel­len­blatt in der Excel Arbeitsmappe geschrieben wer­den. Wenn Sie diesen But­ton durch einen Klick auf das Sym­bol erweit­ern haben Sie die Möglichkeit, Laden in… zu wählen. Dann kön­nen Sie beispiel­sweise über den Punkt Nur Verbindung erstellen vorgeben, dass die Dat­en zwar in eine Abfrage importiert aber nach dem Schließen nicht direkt in ein neues Arbeits­blatt geschrieben wer­den. In bei­den Fällen wird sich jedoch der Import-Edi­tor schließen und sie befind­en sich entwed­er im aktuellen (eventuell noch leeren) oder im neu erstell­ten Arbeits­blatt mit der erstell­ten Tabelle mit den Dat­en der Abfrage. Sie erken­nen jedoch, dass in jedem Fall ein recht­es Seit­en­fen­ster hinzuge­fügt wor­den ist, wo die Abfrage aufge­führt ist:

Nach einem direk­ten Klick auf die Schalt­fläche Laden

Schalt­fläche „Dat­en trans­formieren”
In den meis­ten Fällen ist dieses der beste Weg. Ein Klick auf die Schalt­fläche bewirkt, dass die Dat­en direkt in den Edi­tor importiert wer­den und Ihnen für die weit­ere Bear­beitung zur Ver­fü­gung ste­hen. Ich nutze diese Möglichkeit so gut wie immer. Schauen Sie sich an, wie das direkt nach dem aus­führen den des Imports aussieht:

Nach dem Import der Dat­en stellt sich der Edi­tor so dar

Im Moment ist das rechte Seit­en­fen­ster das Objekt Ihres Inter­ess­es. Bei der Über­schrift Eigen­schaften wurde der Name der Abfrage automa­tisch vergeben. Es ist der eigentliche Name der importierten *.csv. Selb­stre­dend kön­nen Sie diesen Namen nach eige­nen Wün­schen anpassen. Im großen Feld darunter Angewen­dete Schritte sind zwei Zeilen (sprich Schritte) einge­fügt: Quelle und Geän­dert­er Typ. Diese Auflis­tung wird bei jed­er durch Sie oder Pow­er Query ini­ti­ierten Aktion automa­tisch erweit­ert. Im Anfangssta­di­um sind diese Ein­träge für Sie nicht ganz so wichtig; Aus­nah­men bestäti­gen allerd­ings die Regel. 💡 

Was Ihnen aber gewiss aufall­en wird: Pow­er Query hat automa­tisch Über­schriften vergeben, hier Column1 bis Column3. Jede Spalte ein­er Tabelle muss eine ein­deutige Über­schrift haben. Aber für den Betra­chter ist es offen­sichtlich, dass schon „sprechende” Über­schriften existieren. Allerd­ings sind diese in Zeile1 der Tabelle. Der Import-Assis­tent kann nicht in jedem Fall unter­schei­den, ob die Texte in der ersten Zeile nun Über­schriften sind oder Dat­en. Wenn eine ein­deutige Unter­schei­dung möglich ist, weil im Daten­bere­ich Zahlen ste­hen, dann wird der Assis­tent die erste Zeile auch automa­tisch als Über­schrift einord­nen. Aber natür­lich bietet Ihnen PQ auch in diesem Fall, wo Über­schrift und Dat­en aus Tex­ten beste­hen, einen leicht zu beschre­i­t­en­den Ausweg an. Im Menü Start gibt es in der Gruppe Trans­formieren eine Schalt­fläche mit der Beze­ich­nung Erste Zeile als Über­schriften ver­wen­den. Ein Klick darauf und Sie haben eine richtig schicke Tabelle (genauer gesagt: Abfrage), welche den Regeln und Ihren Vorstel­lun­gen entspricht. Der eigentliche Import ist damit been­det und Sie kön­nen mit den Dat­en nach Herzenslust arbeit­en.

▲ nach oben …

Hat Ihnen der Beitrag gefallen?
Erleichtert dieser Beitrag Ihre Arbeit?

Dann würde ich mich über einen Beitrag Ihrer­seits z.B. 1,50  freuen …

Dieser Beitrag wurde unter a) Keine Vorkenntnisse, File-Handling, Power Query, PQ für Einsteiger, PQ-Basics, PQ-Import en détail, Text-Behandlung abgelegt und mit , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.