Dubletten löschen (2)

Dubletten bei gegebenen Bedingungen löschen

Das löschen von dop­pel­ten Werten oder Ein­trä­gen mit Pow­er Query ist bere­its in diesem Beitrag erk­lärt wor­den. Nun gibt es aber Sit­u­a­tio­nen, wo beispiel­sweise die Index-Spalte diverse dop­pelte Werte enthält und das prinzip­ielle Ziel ist, jeden Wert nur ein Mal ste­hen zu lassen; aber es soll nicht immer die erste Zeile beste­hen bleiben und die restlichen Zeilen gelöscht wer­den. Sehen Sie sich diese Mus­ter­datei an und erken­nen sie, dass in ver­schiede­nen Zeilen der Spalte Hin­weis ein Text einge­fügt ist. Diese Zeilen sollen in jedem Fall beste­hen bleiben.

Begin­nen Sie damit, dass sie diese Auflis­tung in Pow­er Query als Tabelle ein­le­sen. Nach dem öff­nen des Abfrage-Edi­tor wird Ihnen gewiss auf­fall­en, dass die Pro­dukt-ID als Zahl und nicht als Text dargestellt wird. Sie erken­nen das daran, dass die führen­den Nullen ent­fer­nt wor­den sind und der Daten­typ ist hier Dez­i­malzahl. Der ein­fach­ste Weg wäre zwar, im recht­en Seit­en­fen­ster bei Angewen­dete Schritte den Ein­trag Geän­dert­er Typ ein­fach zu löschen. Ich ziehe es vor, diese Spalte expliz­it den Daten­typ Text zuzuweisen. An dieser Stelle soll­ten Sie jedoch (erst ein­mal) den derzeit­i­gen Zus­tand belassen, also auch nichts zu löschen.

Da mich beim Erfas­sungs-Datum die Zei­tangabe 00:00:00 stört, weise ich dieser Spalte den Daten­typ Datum zu, auch wenn es nicht erforder­lich ist. Jet­zt ein Klick in die Über­schrift Hin­weis und die Spalte absteigend (Z..A) sortieren. Das führt dazu, dass nun die Zeilen mit den Hin­weis­tex­ten ganz oben ste­hen.

Jet­zt (und auch wirk­lich erst jet­zt) wer­den sie den Daten­typ der ersten Spalte ändern. Das geht recht gut über einen Recht­sklick in die Über­schrift Pro­dukt-ID und dann im Kon­textmenü über Typ ändern | Text die Zuweisung vornehmen. Dass das erst an dieser Stelle geschieht liegt darin begrün­det, dass offen­sichtlich nur so gewährleis­tet ist, dass beim Ent­fer­nen der Dublet­ten auch wirk­lich die oben ste­hen­den Zeilen mit den Tex­ten in der Spalte Hin­weis ste­hen bleiben. Als ich die Typzuweisung gle­ich zu Beginn vorgenom­men hat­te, wur­den die oberen, in den Text enthal­tenden Zeilen dann auch gelöscht. Warum auch immer …

Nun ein Recht­sklick in die Über­schrift Pro­dukt-ID und wählen Sie im Kon­textmenü den Punkt Dup­likate ent­fer­nen. Es bleiben 10 Zeilen mit ein­ma­li­gen Pro­dukt-IDs erhal­ten. Im let­zten Schritt wird noch genau dieser Spalte sortiert. Typ­is­cher­weise ist die Über­schrift noch in einem dun­kleren Grün markiert, also aktiviert. Am ein­fach­sten jet­zt im Menü-Reg­is­ter ein Klick auf die Schalt­fläche A↑Z und die Dat­en wer­den nach der ID auf­steigend sortiert.

Wollen Sie die durch die Abfrage erzeugte Tabelle in ein neues Blatt spe­ich­ern, dann reicht ein Klick auf Schließen & laden; möcht­en Sie die Dat­en beispiel­sweise im gle­ichen Arbeits­blatt platzieren, dann Klick­en Sie auf den Text Schließen & laden unter­halb des Sym­bols und wählen den Menüpunkt Schließen & laden in… Anschließend kön­nen Sie die linke obere Zelle auswählen bzw. in das entsprechende Feld ein­tra­gen, wo die Dat­en posi­tion­iert wer­den. Die Auf­gabe ist damit gelöst.

Soll­ten Sie mit dem Gedanken spie­len, nun die Aus­gangsta­belle zu löschen zu bedenken Sie bitte eins: Die erzeugte Abfrage basiert auf genau diesen Dat­en. Wenn es eine ein­ma­lige Aktion ist, dann kön­nen Sie die Ursprungs­dat­en prob­lem­los löschen. Soll diese Daten­ba­sis jedoch später verän­dert und dann erneut für das Ent­fer­nen von Dup­likat­en genutzt wer­den, dann muss die Liste unbe­d­ingt erhal­ten bleiben und der Name der Tabelle darf auch nicht geän­dert wor­den sein.

▲ nach oben …

Dieser Beitrag wurde unter Allgemein, Verschiedenes, Datentyp anpassen, Power Query abgelegt und mit , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.