Team project at ENSAE, stats on paintings

Second year at ENSAE includes a year-long team project in applied statistics. The aim is to work on data, to build a model based on statistics, econometrics or time series lectures, and to tests a few hypotheses on it. As an example, last year projects I supervised with Marie Chanchole, Andrew Gelman and Nicolas Chopin were

Fractional polynomials for modeling nonlinear regression functions, with a case study on same sex marriage state law in the US, and

Study of a speed dating experiment at Columbia University.

Any potentially interested academic in stats can contact me.  Bloggers on Statisfaction are providing four projects, one of which is the following (echoing a series of posts here, here and here):

Critique statistique d’une peinture abstraite

Encadré par Julyan Arbel (E04), Pierre Jacob (F14)
julyan.arbel@ensae.fr, pierre.jacob@ensae.fr
Laboratoire de statistique, CREST

PROBLÉMATIQUE
On propose d’étudier sous un angle statistique certaines oeuvres d’art moderne ou contemporain, en particulier des peintures abstraites. Le point de départ est une oeuvre du peintre allemand Gerhard Richter, dénommée 1024 colours. On envisagera d’autres peinture du même artiste, et étendra éventuellement l’étude à d’autres peintres, par exemple Piet Mondrian.

Dans 1024 colours, on considère chaque pixel comme une variable aléatoire. Sa valeur, le plus généralement, s’exprime dans le modèle RGB, c’est à dire un triplet correspondant aux niveaux en rouge, vert et bleu. Il existe d’autres modèles de représentation de couleur (par exemple le modèle HSV) auxquels on comparera le modèle RGB en terme de résultats statistiques.

L’étude descriptive de l’oeuvre consistera à rechercher des couleurs prédominantes, déterminer les axes principaux des couleurs dans l’espace RGB par une ACP, etc.
La principale motivation statistique est l’étude de l’uniformité des couleurs dans l’oeuvre. En effet, l’auteur dit avoir choisi les couleurs de manière aléatoire; il s’agira donc de définir cette notion dans le contexte des images et de tester cette hypothèse. On se propose de tester cette hypothèse en deux temps. D’abord sans tenir compte de la disposition spatiale des pixels: on veux tester l’uniformité des 1024 couleurs dans l’espace RGB. Ensuite, en intégrant la position, on cherchera à tester la présence d’autocorrélation spatiale. Ce dernier test nécessitera une recherche bibliographique.
Le sujet reste volontairement ouvert à d’autres pistes d’étude sur l’initiative du groupe.

DONNÉES UTILISÉES
La base de données est constituée de trois matrices, R, G, B, de taille 32×32, disponibles ici. Les valeurs des trois couleurs sont exprimées sur une échelle de 0 à 256.
Les données ont été extraites par un script écrit en Python. La connaissance de ce langage n’est pas un prérequis pour le sujet, mais elle sera utile pour extraire d’autres bases avec le même script. L’analyse statistique sera de préférence programmée en langage R.

BIBLIOGRAPHIE INDICATIVE
http://www.couleur.org
Tests d’autocorrélation spatiale sur R

Published by Julyan Arbel

Researcher at Inria Grenoble Rhône-Alpes

3 thoughts on “Team project at ENSAE, stats on paintings

Leave a comment