R est un langage de programmation multiparadigmes (orienté objet, impératif, fonctionnel, procédural et réflexif). Le logiciel, libre d’utilisation, est principalement utilisé pour le développement de logiciels statistiques et l’analyse de données par la communauté scientifique.
Ce guide requiert une première initiation à R et à son langage. Des notions clés du traitement de bases de données sont reprises mais ce guide a pour objectif de familiariser le corps actuariat et les modélisateurs à son utilisation dans les travaux quotidiens. Au-delà du traitement et de la visualisation des données, il présente des notions clés en tarification et en modélisation. Ce guide s’adresse à tout membre d’une Direction Technique cherchant à réaliser ses principaux travaux sous R.
Les lignes de codes utilisées sont à télécharger ici
Sommaire
INDEX
INTRODUCTION
INSTALLATION ET ILLUSTRATION DE LA COMMANDE R
Installation de R et RStudio
LES PACKAGES SUR R
- Qu’est-ce qu’un package R ?
- Comment utiliser un package R ?
- Les packages utiles en assurance
- L’aide sur R
PARTIE 1 : LE LANGAGE AU SERVICE DE LA DONNEE
DATAMINING
- Qu’est-ce qu’un data frame ?
- Le package dyplr, une référence pour le traitement de la donnée
- Les fonctions utiles dans dyplr
- Comment identifier les valeurs manquantes ?
DATAVISUALISATION
- Le package ggplot2
- Le package Esquisse
PARTIE 2 : DE LA MODELISATION A LA TARIFICATION
MODÉLISATION
- Prérequis pour la modélisation : notion de distribution et test d’adéquation
- Tests statistiques
- La fonction Q-Q plot
- Utilisation des séries temporelles
- Cum hoc sed non propter hoc (« avec ceci, cependant pas à cause de ceci »)
MODÉLISATION LINÉAIRE GÉNÉRALISÉE
- Principe du modèle
- Modèles appliqués à la fréquence des sinistres et aux coûts moyens
- Choix des variables explicatives
- Validation des hypothèses
- Comment modéliser les sinistres graves ?
ANNEXES