[Datum: 2000-06-02] Data-Mining-Cup 2000 Beschreibung der Merkmale ============================== Merkmal Typ Beschreibung ----------------------------------------------------------------------- ID ganzzahlig laufende Nummer, ID-Merkmal WO Text West/Ost REGIO 11,...,16 Regionaltyp 11 Kern von Ballungsgebieten 12 Rand von Ballungsgebieten 13 Kernstadt einer Region 14 Randgebiet einer Kernstadt 15 ländliche Zentren 16 Orte auf dem Land KAUFKRAFT -9,...,9 Kaufkraft -9 bis -7 extrem niedrige KK (Osten) -6 bis -4 sehr niedrige KK (Osten) -3 bis -1 niedrige KK (Osten) 0 fehlender Wert 1 bis 3 niedrige KK (Westen) 4 bis 6 mittlere KK (Westen) 7 bis 9 hohe KK (Westen) STRTYP Text Strassentyp 21 Wohnstrasse 22 Ladenstrasse 23 Mischform 24 Gewerbestrasse 25 extrem gewerblich genutzte Strasse BEBAU Text Bebauungstyp 00 keine sinnvolle Zuordnung möglich 31 Ein- bis Zweifamilienhäuser 32 Drei- bis Fünffamilienhäuser 33 Häuser mit ca. 6-9 HH 34 Häuser ab 10 HH ohne: keine Zuordnung STATUS Zahl Status 1 bis 3 HH mit niedrigem Status 4 bis 6 HH mit mittlerem Status 7 bis 9 HH mit hohem Status ANT_U20 Zahl Altersstruktur, Anteil unter 20 Jahre ANT_U25 Zahl Anteil 20 bis 25 Jahre, usw. ANT_U30 Zahl ANT_U35 Zahl ANT_U40 Zahl ANT_U45 Zahl ANT_U50 Zahl ANT_U55 Zahl ANT_U60 Zahl ANT_U65 Zahl ANT_U70 Zahl ANT_AE70 Zahl Anteil über 70 Jahre die Summe der Zahlen von ANT_U20 bis ANT_AE70 ist ungefähr 100; sind jedoch alle Altersstrukturzahlen in einem Datensatz 0, so sind das fehlende Werte MFAMSTAND Zahl Familienstand (Kundenangabe) [0 bis 6 -- Interpretation noch zu klären] BONITAET Zahl Prüfungsgrad Bonität 1 bis 7 gut geprüfte Bonität 8 wenig geprüfte Bonität 9 schlecht geprüfte Bonität P_EXPERT Zahl Kundentyp, Bequemer "Experte" P_VKUDE Zahl Kundentyp, Treuer Vertreterkunde P_DELEGI Zahl Kundentyp, Anspruchsvoller Delegierer P_RATION Zahl Kundentyp, Preisorientierter Rationalist P_USUCHE Zahl Kundentyp, Überforderter Unterstützungssuchender P_GGUELT Zahl Kundentyp, Skeptisch-Gleichgültiger P_KONSER Zahl Kundentyp, Distinguiert Konservativer P_DWERBG Zahl Akzeptanz von Mailings P_DVERTR Zahl Akzeptanz des Direktvertriebs alle P_*-Merkmale sind Psychonomics-Versicherungstypologien mit Werten von 1 bis 7 im Westen und 1 bis 5 im Osten je höher der Wert, desto höher die Wahrscheinlichkeit solcher Ausprägungen in einer Zelle (aus mindestens 5 HH) der Wert 0 steht für fehlenden Wert K_PKW Zahl PKW-Dichte 0 bis 1 niedrig 2 bis 5 mittel 6 bis 9 hoch K_PKWL Zahl PKW-Leistung 0 niedrig; 2,4,6 mittel; 8 hoch K_KBUSSE Zahl Neigung zu Kleinbussen 0 niedrig; 3 mittel; 6 hoch K_GWAGEN Zahl Neigung zu Gebrauchtwagen 0 niedrig; 1 mittel; 2 hoch K_GELWAG Zahl Neigung zu Geländewagen 0 Allrad-Antrieb etc. nicht vorhanden; 1 Allrad-Antrieb etc. vorhanden alle K_*-Merkmale sind KBA-Indices und auf Zellebene >= 20 HH PHARM1 Zahl Pharmatyp, Gesunder Kraftprotz PHARM2 Zahl Pharmatyp, Unkritischer Wehleidiger PHARM3 Zahl Pharmatyp, Skeptischer Verweigerer PHARM4 Zahl Pharmatyp, Informierter Körperbewußter PHARM5 Zahl Pharmatyp, Eingeschränkter Kassenpatient PHARM6 Zahl Pharmatyp, Konservativer Arztgläubiger alle PHARM-Merkmale sind Pharma-Scores für Zellebene >= 5 HH und mit Werten analog zu den Psychonomics