thanksgiving-open-data-opendatasoft-02

Le ciel est gris, les feuilles tombent des arbres, le climat est morose : l’équipe OpenDataSoft attend les festivités de fin d’année avec impatience. Pour que le temps paraisse moins long, nous avons décidé de nous pencher sur Thanksgiving, cette fête commémorant les premiers repas partagés entre les colons européens et les peuples amérindiens ! Et pour respecter les traditions d’OpenDataSoft, nous y avons ajouté un twist “data” : d’où vient la nourriture utilisée pour préparer le repas de Thanksgiving aux Etats-Unis ? Prêts ? Voici le menu de Thanksgiving en Open Data !

1ère étape : la chasse aux données

Les Etats-Unis comptant plus de 320 millions d’habitants répartis sur presque 10 millions de km2, nous n’avons pas été surpris en découvrant la multitude de spécialités culinaires différentes liées à Thanksgiving.
Pour les besoins de cet article, nous avons décidé de nous concentrer sur les 5 ingrédients principaux :

  • la dinde : aux Etats-Unis, Thanksgiving et dinde sont presque synonymes,
  • les pommes de terre : la purée de pommes de terre est un grand classique de Thanksgiving,
  • les haricots verts : nous n’imaginions pas qu’il existait autant de variantes de la “green bean casserole”,
  • les canneberges : la découverte de la sauce de canneberge – qui accompagne traditionnellement la dinde – nous a mis l’eau à la bouche,
  • les citrouilles : la tarte à la citrouille est un des desserts de Thanksgiving les plus populaires.

Nous avons utilisé les données du Département américain de statistique agricole (NASS) pour créer un jeu de données sur les Etats producteurs de ces ingrédients en téléchargeant des fichiers directement depuis leur site, puis en les nettoyant et en les chargeant sur la plate-forme OpenDataSoft.

Ces données nous ont permis de découvrir la quantité de nourriture produite par Etat. Par exemple, en 2014, le Minnesota a produit pour 866 millions de dollars (814 millions d’euros) de dinde. Le prix moyen d’un kg de dinde étant d’environ 2,7$ (2,52€), cela signifie donc que plus de 320 millions de kg de dindes ont été élevées dans le Minnesota au cours de l’année !

Le poids moyen d’une dinde pour les repas de fêtes étant de 8kg, nous pouvons en déduire que chaque année plus de 40 millions de dindes sont élevées dans cet Etat. Même si ces données peuvent faire tourner la tête, on n’en est pas encore tout à fait aux 46 millions de dindes consommées uniquement pour le dîner de Thanksgiving!

Ajouter des coordonnées géographiques au jeu de données

Les données brutes nous donnaient déjà une bonne idée des métriques du menu de Thanksgiving, mais nous voulions aller plus loin en plaçant ces données sur une carte.

Thankgiving en open data

Processeurs ODS “Manipulation de champs”

Afin d’associer la production de tel ou tel ingrédient à son Etat d’origine, nous avons tout simplement utilisé les outils de traitement de données de la plate-forme OpenDataSoft. En choisissant la fonctionnalité “joindre des jeux de données”, nous avons croisé un fichier shapefile déjà disponible sur notre portail de données publiques à notre jeu de données contenant les métriques évoquées précédemment.

Placer les ingrédients du menu de Thanksgiving en Open Data, sur une carte

Suite à l’association des données géographiques aux données statistiques, nous avons pu placer toutes ces informations sur une seule et unique carte afin d’avoir une vue globale de la provenance de chaque ingrédient.

Pour réaliser cette carte, nous avons utilisé notre outil Cartographe. Cette fonctionnalité permet de placer plusieurs calques de données sur la même carte en quelques minutes (vous pouvez voir les différents calques en cliquant sur le signe “<” en haut à droite de la carte).

En quelques clics, nous avons donc ajouté 5 jeux de données sur une seule carte, associé une couleur à chaque ingrédient, et défini des dégradés de couleur en fonction des données de production de chaque ingrédient. Par exemple, le Minnesota est couvert de la teinte de marron la plus foncée car c’est cet Etat qui produit le plus de dindes.

Cette carte est non seulement très colorée, mais elle est également interactive ! Il est très facile de sélectionner tel ou tel calque pour afficher les données liées aux pommes de terre ou aux haricots verts. Et pour consulter les chiffres de production, il suffit de cliquer sur les différents Etats.

Pas de dîner de Thanksgiving sans la Californie…

Selon ces données, c’est donc l’Etat de Californie qui contribue le plus au dîner de Thanksgiving. Quatre ingrédients sur les cinq que nous avons sélectionnés y sont produits. Le Michigan produit également ces quatre ingrédients, mais la production californienne est beaucoup plus importante.

Ceci était donc un court exemple de la facilité d’utilisation d’OpenDataSoft : en quelques clics, nous avons publié des jeux de données sous forme de visualisations interactives et d’APIs.

Nous souhaitons un très joyeux Thanksgiving à tous ceux qui le fêtent !

thankgiving en open data avec Joey

 


Vous souhaitez ouvrir vos données ?

Recevez votre guide gratuit maintenant ! Il réunit les 10 étapes essentielles pour bien amorcer votre projet Open Data.



Téléchargez le guide Open Data d'OpenDataSoft