google Werbung

Gearbest xiaomi brand at summer sale promotion

Sonntag, 3. Mai 2015

Bondora - auf dem Weg zum eigenen Score Teil 1

Das Alleinstellungsmerkmal von Bondora ist es, dass praktisch der komplette Datensatz verfügbar ist und eigenen Analysen unterworfen werden kann. Damit könnte es möglich sein besser als der Markt zu investieren.

Der Plan

Bots sind meine Sache nicht. Das ist mir technisch zu aufwändig, ich möchte nicht große Summen unbeaufsichtigt investieren und es scheint mir auch hart am Rande der Legalität bzw. zumindest der Fairnis zu fahren. Ich möchte nur Informationen ausnutzen, die jedem zur Verfügung stehen und damit eine Investitionsentscheidung untermauern, bevor ich von Hand biete oder eben nicht.

Dazu soll mein Plugin auf der Angebotsseite Informationen wie z.B. Alter des Kreditnehmers, DTI, Zinssatz etc. pp. extrahieren und verknüpfen und daraus einen Score berechnen, der auf Statistiken der Verläufe bisheriger Kredite beruht und in Echtzeit anzeigen.

Kriterien sollen sein
  • abgeschätzes ROI
  • Defautrate
  • Recoveryrate
in Abhängigkeit von den Ausprägungen eines Merkmals.

Beispiele

 Es war immer wieder umstritten, ob der VerificationTyp einen Einfluss auf die Ausfallswahrscheinlichkeit hat. Die Statistik verblüfft hier etwas. Allerdings sind unverifizierte Kredite auch noch nicht ganz so lange verfügbar und ihr Zinssatz war 2014 um knapp 10% höher.

Das Geschlecht scheint keine große Rolle zu spielen.

Und als letztes das Wohnverhältnis - auch hier unterscheiden sich die ROI-Werte weniger als erwartet. Lediglich beim recovery gibt es deutliche Unterschiede.

Bei meinen bisherigen Analysen habe ich ROI-Werte von etwa 12% - 28% gefunden.
Dabei lasse ich sql-Anfragen gegen die Datenbank laufen und untersuche im Moment estnische Kredite aus den Jahren 2012-2014, die zustande kamen.

Erste Versuche sind jedenfalls schon mal vielversprechend. Und so könnte das dann aussehen:



Die Daten werden zwar schon alle live berechnet, bislang wird aber eher eine Tendenz ermittelt als ein echte Score.
Da die Daten über einen Vektor ausgewertet werden, sind völlig unterschiedliche Bewertungen und Gewichtungen z.B. je nach Land möglich.

Ausblick

Das Auslesen der Daten aus der Webseite ist weitgehend gelöst. Im Moment muss ich noch von den statistischen Daten zu einem Score kommen. Ich möchte dazu etwa 20 Merkmale auswerten. Schwierigkeiten bereiten mir noch Merkmale wie Alter oder Einkommen, bei denen die Werte in Intervalle einzuteilen sind. Dann sind Scoreklassen zu bilden und zu entscheiden, ob eine Zugehörigkeit tatsächlich einen Mehrwert bringt.

Wer ohne Aufwand selbst einmal ein bisschen herumspielen möchte, sei auf die Webseite http://peerlan.com/ verwiesen (danke für den Tipp, "stern").

Keine Kommentare:

Kommentar veröffentlichen