Median der kalendarisch letzten 10 Messwerte…

Berechneter Median der letzten 10 Messwerte unterschiedlicher Regionen

  Wis­sens­stand: Lev­el 2 ⇒ Solides Basiswis­sen in PQ, etwas Erfahrung   

Im Her­ber-Excel-Forum wurde in diesem Beitrag die Frage gestellt, wie aus ein­er Rei­he von Mess­werten unter­schiedlich­er Region und mehrerer Messergeb­nisse jew­eils der Medi­an berech­net wer­den kann; dabei ist zu berück­sichti­gen, dass auss­chließlich die neuesten 10 kalen­darischen Dat­en für die Berech­nung herange­zo­gen wer­den sollen. So weit mein Ver­ständ­nis der etwas „ver­schwomme­nen” Fragestel­lung.

Das hört sich kom­pliziert an und so wirk­lich ein­fach ist es auch nicht. Ich habe Ihnen hier noch ein­mal die orig­i­nale Muster-Tabelle für den Down­load bere­it­gestellt. Die far­blichen Markierun­gen sind in dem Fall für das Ver­ständ­nis recht hil­fre­ich. Die Diskus­sion zeigte, dass die Beschrei­bung der Forderung dur­chaus inter­pretier­fähig ist. Darum ver­suche ich an dieser Stelle noch ein­mal mit meinen Worten zu erk­lären, welche Dat­en für das Ergeb­nis berech­net wer­den sollen:

  • Jede Region, hier BSK und NTG soll eigen­ständig berech­net wer­den.
  • Für jede dieser Regio­nen sollen die kalen­darisch neuesten 10 erfassten Mess­werte berück­sichtigt wer­den.
  • Es gibt 3 unter­schiedliche Stoffe, die mit einem Mess­wert erfasst wer­den: As, Pb und Cd.
  • Für jede dieser 3 Sub­stanzen soll der Medi­an-Wert getren­nt berech­net wer­den.

Die beispiel­hafte Markierung in der Muster-Tabelle gilt hier für die Region BKS, umfasst die let­zten 10 Ein­träge (aus kalen­darischen Sicht) und es wurde hier der Mess­wert für Pb gekennze­ich­net. Ich habe bere­its im Foren-Beitrag darauf hingewiesen, dass die Lösung (nach meinem derzeit­i­gen Wis­sens­stand) mit Pow­er Query mach­bar ist, jedoch ein höheres Maß an Vorar­beit bei der Ein­rich­tung erfordert als manch ein anderes Pro­jekt.

▲ nach oben …

Begin­nen Sie damit, die Dat­en in eine Intel­li­gente Tabelle umzuwan­deln und dann in den Abfrage-Edi­tor zu importieren. Prinzip­iell hät­ten sie natür­lich die Hin­weise in den Zellen F24:F28 zuvor löschen kön­nen, aber da die bei­den let­zten Spal­ten sowieso in ein­er der ersten Schritte ent­fer­nt wer­den, ist das nicht erforder­lich.

Nach dem Import soll­ten Sie die 1. Zeile löschen, sie enthält keine ver­w­ert­baren Dat­en und würde auch dem Wesen ein­er ordentlichen Tabelle/Abfrage wider­sprechen. In eine Spalte gehören auss­chließlich gle­ichar­tige Dat­en. Ide­al­er­weise geht das über den Weg des Sym­bols Zeilen ver­ringern. Im näch­sten Schritt löschen Sie die bei­den let­zten Spal­ten As2 und Pb3, dort wer­den später neue Spal­ten für die Medi­an-Berech­nun­gen erstellt.

Im Beitrag ist die Rede davon, dass die Sortierung in den Quell­dat­en stets eine andere sein kann. Der Fragesteller hat dann auch darauf hingewiesen, dass ungeachtet dessen immer die let­zten 10 Tage mit Ein­trä­gen für die Berech­nung herange­zo­gen wer­den sollen. So ver­ste­he zumin­d­est ich den Beitrag. Sortieren Sie darum als erstes die Spalte Tag WE auf­steigend. Wenn es für sie „augen­scho­nend” 😉 ist, dann kön­nen Sie den Daten­typ auch gerne auf (nur) Datum ändern. Schließen & laden in… und wählen Sie die Option Nur Verbindung erstellen.

Da es doch einige Abfra­gen mehr wer­den, gebe ich dieser Abfrage einen neuen Namen: Quell-Dat­en (zugegeben, ich ver­wende in vie­len Fällen den Namen Source-Data). Öff­nen Sie nun wieder die einzige Abfrage und erstellen daraus einen Ver­weis. Das geht entwed­er über den Menüpunkt Ver­wal­ten oder per Recht­sklick im linken Seit­en­fen­ster auf den Namen der Abfrage. Im Prinzip ist das ein Dup­likat, aber Änderun­gen in dieser Abfrage wer­den direkt in die Ver­weis-Kopie über­nom­men. Ide­al­er­weise erstellen Sie gle­ich noch einen solchen Ver­weis. Beacht­en Sie dabei unbe­d­ingt, dass Sie wiederum von der Abfrage mit den Quell­dat­en den Ver­weis erstellen. – Die Namen der Abfrage sind ja nicht so wirk­lich aus­sagekräftig, darum benen­nen Sie die Abfrage Quell-Dat­en (2) so um: Quell-Dat­en (NTG) und die 2. eben erstellte Abfrage bekommt den Namen Quell-Dat­en (BSK).

Jet­zt wird Ihnen wahrschein­lich auch klar sein, was in diesem bei­den neuen Abfra­gen geschehen wird. 😎 Fil­tern Sie jede der bei­den Abfra­gen so, dass nur noch die entsprechen­den Dat­en erhal­ten bleiben. Um die Abfrage auf die let­zten 10 Werte (Zeilen) zu begren­zen, gehen Sie den Weg über Zeilen ver­ringern | Zeilen beibehal­ten | Let­zte Zeilen beibehal­ten und geben Sie bei Anzahl von Zeilen den Wert 10 ein. Nach einem OK bleiben noch genau 10 Zeilen übrig. Und daraus soll und wird der Medi­an berech­net wer­den. – Bei der anderen Ver­weis-Abfrage gehen Sie gle­icher­maßen vor.

Aktivieren Sie nun die Abfrage Quell-Dat­en (NTG) und im Reg­is­ter Start Klick­en Sie auf das Sym­bol Kom­binieren. Erweit­ern Sie hier im Unter­menü Abfra­gen anfü­gen und wählen den Punkt Abfra­gen als neu anfü­gen. Im Dia­log-Fen­ster belassen Sie es bei Zwei Tabellen und wählen Sie als Anzufü­gende Tabelle die andere eben erstellte Abfrage: Quell-Dat­en (BSK). Da die Über­schriften bei­der Abfra­gen iden­tisch sind, wer­den die Dat­en der 2. Abfrage direkt angefügt/angehängt. Wie vorgegeben wird eine neue Abfrage erstellt, die den Namen Append1 hat. Wenn Sie möcht­en, kön­nen Sie diese umbe­nen­nen; ich belasse es bei diesem Namen, denn diese Abfrage dient wiederum als Basis für 3 weit­ere Ver­weis-Abfra­gen. Erstellen Sie also diese 3 Ver­weise. Als Namen für die Abfra­gen vergeben sie beispiel­sweise Medi­an As, Medi­an Pb und Medi­an Cd.

Am Beispiel der Abfrage Medi­an As zeige ich Ihnen auf, wie sie bei allen dieser 3 Abfra­gen vorge­hen wer­den, um den Medi­an je Bere­ich und (ver­mut­lich) Schad­stoff zu berech­nen:

  • Acht­en sie darauf, dass die Spalte Region markiert ist.
  • Grup­pieren nach Region und bei Neuer Spal­tenname geben Sie Medi­an As (oder auch nur die chemis­che Kurzbeze­ich­nung für das die jew­eilige Ele­ment) ein.
  • Bei Vor­gang wählen Sie im Drop­Down Medi­an.
  • Bei Spalte wählen Sie die passende Über­schrift, also im ersten Fall As aus.
  • Gehen Sie bei den restlichen 2 Abfra­gen gle­icher­maßen vor, natür­lich auf die chemis­chen Ele­mente angepasst.

Das Ergeb­nis ist eine 2‑spaltige Abfrage mit je einem Ein­trag für die bei­den Regio­nen, die sich in der Abfrage Medi­an As so darstellt:

Die erste Berechnung des Median

Die erste Berech­nung des Medi­an

Immer noch im Reg­is­ter Start aktivieren Sie die Abfrage Medi­an As. Im Menüband ein Klick auf Kom­binieren, erweit­ern Sie den Punkt Abfra­gen zusam­men­führen  und wählen dort Abfra­gen als neue Abfrage zusam­men­führen. Im Dia­log wer­den sie im mit­ti­gen schmalen Textfeld die Auswahl Medi­an Pb tre­f­fen und anschließend jew­eils in das Feld Region Klick­en:

Zusammenführen der beiden ersten Median-Abfragen

Zusam­men­führen der bei­den ersten Medi­an-Abfra­gen

Immer noch in der Abfrage Merge1 wer­den Sie diesen Vor­gang wieder­holen, nur dass Sie dieses Mal den direk­ten Weg Kom­binieren | Abfra­gen zusam­men­führen wählen und natür­lich die Abfrage Medi­an Cd mit der zulet­zt erstell­ten Abfrage zusam­men­führen. Und das sieht jet­zt auch schon sehr gut aus. Von allen 3 gemesse­nen Stof­fen wur­den für jede Region die Medi­an-Werte berech­net.

Jet­zt Schließen & laden und sie wer­den vielle­icht erstaunt sein, denn sie sehen, dass sie nichts sehen. 🙄 Es wurde keine Tabelle in der Excel-Arbeitsmappe erstellt. Das liegt daran, dass auch die zulet­zt erstellte Abfrage Merge1 im Modus Nur Verbindung erstellt wor­den ist. Die Lösung: Klick­en Sie im recht­en Seit­en­fen­ster mit der recht­en Maus­taste auf diese Abfrage und wählen Sie Laden in … Hier Klick­en Sie auf die Option Tabelle und wählen Beste­hen­des Arbeits­blatt und Klick­en sie dann in das Zielfeld bzw. tra­gen Sie die Adresse von Hand ein, wo die Dat­en einge­tra­gen wer­den sollen.

Das Ziel ist erre­icht und wenn die Quell-Dat­en später ergänzt oder geän­dert wer­den genügt ein Klick auf Aktu­al­isieren und die Dat­en der Abfrage wer­den automa­tisch angepasst. Dieser Weg ist in jedem Falle zielführend. Ins­beson­dere bei großen Daten­men­gen lohnt sich der etwas höhere Aufwand in jedem Fall. – Meine Lösung sende ich Ihnen gerne per E‑Mail zu, wenn Sie mir den Dateina­men PQ-Herber-Median-127995.xlsx angeben.


Ergänzung: In einem Schluss-State­ment legte der Fragesteller dar, dass es auch denkbar sei, dass ein ander­er Zeit­bere­ich mit (wahrschein­lich) früherem Ende-Datum aus­gew­ertet wer­den soll. In einem solchen Fall wäre es ein guter Weg die Quell-Dat­en im ersten Schritt so zu fil­tern, dass nur noch kalen­darische Dat­en bis zum let­zten Tag erhal­ten bleiben.

▲ nach oben …

Hat Ihnen der Beitrag gefallen?
Erleichtert dieser Beitrag Ihre Arbeit?

Dann würde ich mich über einen Beitrag Ihrer­seits freuen …

Dieser Beitrag wurde unter Daten zusammenführen, Datum & Zeit, Datum und Zeit, Filtern & Sortieren, Foren-Q&A, Ohne Makro/VBA, Power Query abgelegt und mit , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.