Frage: Berechnung von Betagewichten bei nicht erwünschten ungleichen A-priori-Wahrscheinlichkeiten
Hallo,
Wer kann mir einen Tipp geben, ob das folgende Vorgehen bei der
logistischen Regression so machbar ist?
Das Problem ist: Ich möchte zwei deutlich ungleich große Stichproben durch
logistische Regression trennen, wobei das Ergebnis nicht durch die
unterschiedlichen A-priori-Wahrscheinlichkeiten beeinflusst sein soll. Vom
Ergebnis interessieren nur die Betagewichte und die Konstante, keine
inferenzstatistische Kennzahl. Eine Kürzung der größeren Stichprobe durch
Zufallsziehung möchte ich auch gern umgehen.
Jetzt das gewählte Vorgehen: Beide Stichproben sind in der logistischen
Regression so oft mehrfach berücksichtigt, bis die Anzahl jeweils gleich groß
ist. Betragen die Stichprobengrößen zu Beginn z. B. 50 und 80, wird die erste
Stichprobe achtmal und die zweite fünfmal berücksichtigt, so dass für beide eine
Stichprobengröße von 400 resultiert.
Kann es dadurch zu unerwünschten Verzerrungen der Betagewichte bzw. der
Konstante kommen (d. h. Verzerrungen über die Veränderung der
A-priori-Wahrscheinlichkeiten hinaus)?
Vielen Dank für die Hinweise!
Kommentar schreiben
Benötigte Felder sind mit einem Stern (*) markiert.
Kobiela
Erstellt am: 18.08.2009