Algorithmen und statistische Modelle
Auf dem Vorzeigeprodukt der Peleda GmbH, der Kunst-Boutique, sind zahlreiche Kunstwerke unterschiedlichster Stile, mit vielfältigen Motiven und unterschiedlichem Farbmaterial (Acryl, Öl, Tempera, Wasserfarbe) zu finden.
Wie steht es mit dem Preis der Kunstwerke? Intuitiv ist klar, dass man für grössere Kunstwerke tendenziell eher mehr bezahlt. Aber lässt sich dies genauer quantifizieren ? Sind Gemälde in Acryl-Farbe etwa gleich teuer wie solche in Ölfarbe ? Zahlt man für ältere Kunstwerke eher weniger oder mehr ?
Diese Fragen lassen sich mit Hilfe von Algorithmen resp. statistischen Modellen beantworten. Wir haben uns die Daten zu den Kunstwerken in der Kunst-Boutique angeschaut, mit Hilfe von statistischen Modellen analysiert und einen Versuch gewagt, auf obenstehende Fragen Antworten zu geben.
Bei der Analyse solcher Daten kann man auf verschiedene Modelle zurückgreifen – jedes hat bestimmte Eigenheiten, und ist somit für einige Fragestellungen besser oder weniger gut geeignet. Wir werden sehen, dass es auf die obenstehenden Fragen nicht nur eine Antwort gibt.
Kern eines statistischen Modells ist, dass man basierend auf verschiedenen Attributen – auch Input-Variablen oder Features genannt – ein anderes Attribut – die abhängige oder Output-Variable genannt – vorhersagen möchte.
In den obenstehenden Fragestellung zu den Kunstwerken interessiert uns, wie hoch der Preis ausfällt, wenn wir bestimmte Eigenschaften des Kunstwerks, bspw. die Grösse oder das Alter – kennen.
Der Preis ist folglich die Output-Variable, und die Input-Variablen sind diejenigen Eigenschaften des Kunstwerks, welche wir kennen und aus welchen wir den Preis bestimmen möchten.
Neben den erwähnten Attributen Grösse und Alter interessieren uns auch das Motif, die verwendeten Farbmaterialen, sowie der Typ des Kunstwerks (Gemälde, Holzschnitt, Skulptur).
Wir werden uns verschiedene Modelle zur Vorhersage des Preises ansehen – jedes mit einem anderen analytischen Ansatz.
Mehr dazu im nächsten Beitrag.




