Title: | Applied Statistics for Economics and Management with R |
---|---|
Description: | Datasets and functions for the book "Statistiques pour l’économie et la gestion", "Théorie et applications en entreprise", F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, (2021, ISBN:9782807319448, De Boeck Supérieur, Louvain-la-Neuve). The first chapter of the book is dedicated to an introduction to statistics and their world. The second chapter deals with univariate exploratory statistics and graphics. The third chapter deals with bivariate and multivariate exploratory statistics and graphics. The fourth chapter is dedicated to data exploration with Principal Component Analysis. The fifth chapter is dedicated to data exploration with Correspondance Analysis. The sixth chapter is dedicated to data exploration with Multiple Correspondance Analysis. The seventh chapter is dedicated to data exploration with automatic clustering. The eighth chapter is dedicated to an introduction to probability theory and classical probability distributions. The ninth chapter is dedicated to an estimation theory, one-sample and two-sample tests. The tenth chapter is dedicated to an Gaussian linear model. The eleventh chapter is dedicated to an introduction to time series. The twelfth chapter is dedicated to an introduction to probit and logit models. Various example datasets are shipped with the package as well as some new functions. |
Authors: | Frederic Bertrand [cre, aut] , Claire Borsenberger [ctb], Christian Derquenne [ctb], Gilles Dufrénot [ctb], Fredj Jawadi [ctb], Myriam Maumy-Bertrand [aut] |
Maintainer: | Frederic Bertrand <[email protected]> |
License: | GPL-3 |
Version: | 0.6.0 |
Built: | 2025-01-25 03:36:33 UTC |
Source: | https://github.com/fbertran/sager |
Répartition en classes d'âge de la population des provinces et des territoires du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.
AgevsProter_Canada_full
AgevsProter_Canada_full
Un jeu de données avec 21 observations de 13 variables.
Répartition en classes d'âge et sexe de la population du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.
AgevsSexe_Canada_full
AgevsSexe_Canada_full
Un jeu de données avec 21 observations de 2 variables.
Échantillon de 50 villes (individus) tirées aléatoirement sur la pollution de l'air aux États-Unis en 1960
air_pollution
air_pollution
A data frame with 50 observations on the following 15 variables.
a factor with levels AUGUSTA
AUSTIN
BEAUMONT
BOSTON
BRIDGEPO
CHARLEST
CHARLOTT
CHATTANO
CHICAGO
CLEVELAN
COLUMBUS
DALLAS
DAYTON
DENVER
DES_MOIN
DETROIT
EL_PASO
FALL_RIV
FLINT
FORT_WOR
FRESNO
GALVESTO
HUNTINGT
INDIANAP
JACKSON
JERSEY_C
JOHNSTOW
KNOXVILL
MACON
MEMPHIS
MIAMI
MILWAUKE
MOBILE
NASHVIL
NORFOLK
OMAHA
PHOENIX
PROVIDEN
READING
ROCKFORD
SAVANNAH
SEATTLE
SIOUX_FA
SOUTH_BE
TOLEDO
TOPEKA
WINSTON
YORK
YOUNGSTO
. Ville où les données ont été observées.
a numeric vector. Taux de mortalité exprimé en 1/10000.
a numeric vector. Plus petite valeur des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
a numeric vector. Moyenne arithmétique des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
a numeric vector. Plus grande valeur des relevés réalisés deux fois par semaine de sulfate (micro-g/m3 multiplié par 10).
a numeric vector. Plus petite valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
a numeric vector. Moyenne arithmétique des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
a numeric vector. Logarithme de la plus grande valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
a numeric vector. Densité de la population par mile carré (multiplié par 0,1).
a numeric vector. Pourcentage de population blanche.
a numeric vector. Pourcentage de ménages avec un revenu au dessus du seuil de pauvreté.
a numeric vector. Pourcentage (multiplié par 10) de la population des 65 ans et plus.
a numeric vector. Logarithme (en base 10 et multiplié par 10) de la population.
a numeric vector. Logarithme de la densité de la population par mile carré (multiplié par 0,1).
a numeric vector. Logarithme de la plus grande valeur des relevés réalisés deux fois par semaine de particules suspendues dans l'air (micro-g/m3 multiplié par 10).
data(air_pollution) str(air_pollution) library(ggplot2) library(GGally) GGally::ggpairs(air_pollution[,2:4],)
data(air_pollution) str(air_pollution) library(ggplot2) library(GGally) GGally::ggpairs(air_pollution[,2:4],)
Fonction de calcul et de représentation des indices d'attraction/répulsion
att_rep_ind(data)
att_rep_ind(data)
data |
Jeux de données |
Liste à un élément qui content le tableau croisé des indices.
data(champignons) champ_sel <- champignons[,c("couleur_chapeau","contusions","odeur", "espacement_lamelle","habitat")] sageR::att_rep_ind(champ_sel)
data(champignons) champ_sel <- champignons[,c("couleur_chapeau","contusions","odeur", "espacement_lamelle","habitat")] sageR::att_rep_ind(champ_sel)
Les données de la base sont issues de Bloomberg. On s'intéresse au risque d'insolvabilité de 1060 entreprises cotées en bourse, durant l'année 2018, et appartenant à divers secteurs d'activité. Cette problématique est importante pour les investisseurs sur les marchés de capitaux internationaux qui prêtent aux entreprises, notamment en devenant actionnaires. L'information sur les risques financiers des entreprises est généralement fournie par des agences de notation : S&P, Fitch et Moody's. Dans la base, nous retenons les notations attribuées par S&P aux entreprises.
Elles portent sur une évaluation du risque de défaut (le fait que l'entreprise ayant emprunté des fonds se retrouve un jour en incapacité de rembourser), et les notes vont de AAA à CCC-. La grille de notation est la suivante :
AAA est la note la plus élevée et correspond à une sécurité maximale pour un investisseur qui détiendrait des parts dans l'entreprise concernée par la note. Le risque de défaut est quasiment nul ;
AA+, AA et AA- correspondent à une sécurité haute ou bonne (le risque de défaut est faible) ;
A+, A et A- correspondent à une qualité moyenne supérieure ;
BBB+, BBB et BBB- à une qualité moyenne inférieure ;
BB+, BB, ..., B- est un ensemble de notes classant les actifs des entreprises dans la catégorie spéculative, c'est-à-dire suffisamment risquée de telle sorte que le détenteur des parts de l'entreprise peut s'attendre à un défaut avec une probabilité forte ;
CCC+, CCC, CCC-, D est une dernière catégorie de notes qui correspond à des actifs pour lesquels le risque de défaut est très élevé.
Pour nos entreprises, les notes figurent dans la colonne du tableau 1 intitulée SP
(dernière colonne).
La variable SP
est qualitative et polytomique (puisqu'elle peut prendre plus de deux modalités).
Pour la transformer en une variable quantitative dichotomique, nous allons supposer que les agences de notation veulent envoyer un signal clair aux investisseurs, en différenciant les entreprises qui sont en bonne santé des autres.
Pour ce faire, chaque fois que la note sera supérieure à BB+, nous attribuons la valeur 1 à l'observation (entreprises en bonne santé présentant un risque de défaut ou de défaillance faible).
Et pour toute note inférieure à BB+, nous attribuons la valeur 0 (entreprises en mauvaise santé présentant un risque de défaut élevé).
Nous appelons la nouvelle variable Risque. Notons que le critère utilisé ici est arbitraire et un autre découpage pourrait être retenu.
Voir les colonnes intitulées Risque
et Défaut
.
La colonne Défaut2
correspond à un autre classement des entreprises, en les hiérarchisant des plus performantes aux moins performantes:
pour les entreprises ayant une notation comprise entre AAA et A- (de première qualité à qualité moyenne supérieure) ;
pour les entreprises ayant une notation comprise entre BBB+ à BBB- (qualité moyenne inférieure) ;
pour les entreprises ayant une notation comprise inférieure à BBB- (un investisseur achetant des actifs de ces entreprises.
#' devrait les considérées comme spéculatifs ou incorporant un risque de défaut élevé).
Variables explicatives
Dans la base de données, nous avons retenu des variables qui sont habituellement liées aux performances des entreprises :
Liquid
: un ratio de liquidité, mesuré par le rapport entre l'actif circulant et l'exigible à court terme. Cette variable capte le risque de liquidité, c'est-à-dire l'incapacité des entreprises à rembourser des dettes exigibles à court terme (moins d'un an).
ROE
: le ratio du résultat net sur les capitaux propres. C'est une mesure de la rentabilité des capitaux investis par les actionnaires de l'entreprise.
Marge
: la marge bénéficiaire nette en pourcentage, c'est-à-dire la part du chiffre d'affaires que l'entreprise conserve après paiement de ses frais d'exploitation, des remboursements d'intérêt et du paiement de ses impôts.
OPM
: la marge opérationnelle définie comme le ratio du résultat d'exploitation et du chiffre d'affaires.
Il s'agit de mesurer la performance économique de l'entreprise et donc sa viabilité à moyen/long terme. En plus de ces variables qui renseignent sur des indicateurs de fonctionnement de l'entreprise, il est important de s'intéresser à des éléments ayant un impact direct sur leurs dettes. Trois indicateurs sont retenus ici :
Benef
: le bénéfice avant intérêt, impôts et amortissement. Cette variable est un indicateur du profit de l'entreprise.
Net
: le ratio des dettes financières sur Benef
. Il s'agit de mesurer la capacité d'une entreprise à rembourser ses dettes en utilisant ses profits.
Roul
: le besoin en fonds de roulement. Il s'agit de la somme à mettre de côté pour pouvoir payer ses charges.
C'est un indicateur d'autonomie financière de l'entreprise.
bilan
bilan
A data frame with 1060 observations on the following 14 variables.
a character vector. Nom de l'entreprise.
a numeric vector. Identifiant de l'entreprise.
a numeric vector. Le ratio du résultat net sur les capitaux propres. C'est une mesure de la rentabilité des capitaux investis par les actionnaires de l'entreprise.
a numeric vector. La marge opérationnelle définie comme le ratio du résultat d'exploitation et du chiffre d'affaires.
a numeric vector. La marge bénéficiaire nette en pourcentage, c'est-à-dire la part du chiffre d'affaires que l'entreprise conserve après paiement de ses frais d'exploitation, des remboursements d'intérêt et du paiement de ses impôts.
a numeric vector. Le ratio des dettes financières sur Benef. Il s'agit de mesurer la capacité d'une entreprise à rembourser ses dettes en utilisant ses profits.
a numeric vector. Le bénéfice avant intérêt, impôts et amortissement. Cette variable est un indicateur du profit de l'entreprise.
a numeric vector. Un ratio de liquidité, mesuré par le rapport entre l'actif circulant et l'exigible à court terme. Cette variable capte le risque de liquidité, c'est-à-dire l'incapacité des entreprises à rembourser des dettes exigibles à court terme (moins d'un an).
a numeric vector. Le besoin en fonds de roulement. Il s'agit de la somme à mettre de côté pour pouvoir payer ses charges. C'est un indicateur d'autonomie financière de l'entreprise.
a character vector. Notation S&P.
a numeric vector. Risque de défaut transformé en variable binaire.
a character vector. Risque de défaut.
a character vector. Un autre classement des entreprises, en les hiérarchisant des plus performantes aux moins performantes.
a character vector. Notation S&P.
Bloomberg.
data(bilan) str(bilan) plot(bilan)
data(bilan) str(bilan) plot(bilan)
Les données décrivent l'évolution du prix journalier du Bitcoin sur la période du 31/12/2014 au 15/05/2018. Les données sont publiques et disponibles sur le site de Yahoo finance (https://fr.finance.yahoo.com/quote/BTC-EUR/history?p=BTC-EUR).
bitcoin
bitcoin
A data frame with 1233 observations on the following 2 variables.
a POSIXct
a numeric vector
Yahoo finance (https://fr.finance.yahoo.com/quote/BTC-EUR/history?p=BTC-EUR)
data(bitcoin) str(bitcoin) plot(bitcoin)
data(bitcoin) str(bitcoin) plot(bitcoin)
Calculates x-y coordinates for a set of radial axes (one per variable being plotted in radar plot)
CalculateAxisPath(var.names, min, max)
CalculateAxisPath(var.names, min, max)
var.names |
list of variables to be plotted on radar plot |
min |
MININUM value required for the plotted axes (same value will be applied to all axes) |
max |
MAXIMUM value required for the plotted axes (same value will be applied to all axes) |
a dataframe of the calculated axis paths
library(dplyr) library(scales) library(tibble) mtcars_radar <- mtcars %>% as_tibble(rownames = "group") %>% mutate_at(vars(-group), rescale) %>% tail(4) %>% select(1:10) plot.data <- as.data.frame(mtcars_radar) if(!is.factor(plot.data[, 1])) { plot.data[, 1] <- as.factor(as.character(plot.data[, 1])) } names(plot.data)[1] <- "group" var.names <- colnames(plot.data)[-1] grid.min = 0 grid.max = 1 centre.y = grid.min - ((1 / 9) * (grid.max - grid.min)) CalculateAxisPath(var.names, grid.min + abs(centre.y), grid.max + abs(centre.y))
library(dplyr) library(scales) library(tibble) mtcars_radar <- mtcars %>% as_tibble(rownames = "group") %>% mutate_at(vars(-group), rescale) %>% tail(4) %>% select(1:10) plot.data <- as.data.frame(mtcars_radar) if(!is.factor(plot.data[, 1])) { plot.data[, 1] <- as.factor(as.character(plot.data[, 1])) } names(plot.data)[1] <- "group" var.names <- colnames(plot.data)[-1] grid.min = 0 grid.max = 1 centre.y = grid.min - ((1 / 9) * (grid.max - grid.min)) CalculateAxisPath(var.names, grid.min + abs(centre.y), grid.max + abs(centre.y))
Converts variable values into a set of radial x-y coordinates
CalculateGroupPath(df)
CalculateGroupPath(df)
df |
a dataframe with Col 1 is group ('unique' cluster / group ID of entity) and Col 2-n are v1.value to vn.value - values (e.g. group/cluser mean or median) of variables v1 to v.n |
a dataframe of the calculated axis paths
Code adapted from a solution posted by Tony M to https://stackoverflow.com/questions/9614433/creating-radar-chart-a-k-a-star-plot-spider-plot-using-ggplot2-in-r.
library(dplyr) library(scales) library(tibble) mtcars_radar <- mtcars %>% as_tibble(rownames = "group") %>% mutate_at(vars(-group), rescale) %>% tail(4) %>% select(1:10) plot.data <- as.data.frame(mtcars_radar) if(!is.factor(plot.data[, 1])) { plot.data[, 1] <- as.factor(as.character(plot.data[, 1])) } names(plot.data)[1] <- "group" CalculateGroupPath(plot.data)
library(dplyr) library(scales) library(tibble) mtcars_radar <- mtcars %>% as_tibble(rownames = "group") %>% mutate_at(vars(-group), rescale) %>% tail(4) %>% select(1:10) plot.data <- as.data.frame(mtcars_radar) if(!is.factor(plot.data[, 1])) { plot.data[, 1] <- as.factor(as.character(plot.data[, 1])) } names(plot.data)[1] <- "group" CalculateGroupPath(plot.data)
Caractéristiques de 1000 champignons.
champignons
champignons
A data frame with 1000 observations on the following 8 variables.
a numeric vector. Numéro du champignon.
a factor with levels comestible
veneneux
. Classes.
a factor with levels blanc
gris
jaune
marron
rouge
. Couleur du chapeau.
a factor with levels abime
non
. Contusions.
a factor with levels amande
anis
apre
inodore
. Odeur du champignon.
a factor with levels ferme
serre
. Espacement des lamelles.
a factor with levels blanc
gris
rose
. Couleur du dessus de la tige.
a factor with levels foret
pelouse
prairies
sentier
urbain
. Habitat.
data(champignons) str(champignons) summary(champignons)
data(champignons) str(champignons) summary(champignons)
Consommation d'électricité journalière en France de l'année 2003?
conso_temp
conso_temp
A data frame with 365 observations on the following 8 variables.
a factor with levels 01/01/2003
01/02/2003
01/03/2003
01/04/2003
01/05/2003
01/06/2003
01/07/2003
01/08/2003
01/09/2003
01/10/2003
01/11/2003
01/12/2003
02/01/2003
02/02/2003
02/03/2003
02/04/2003
02/05/2003
02/06/2003
02/07/2003
02/08/2003
02/09/2003
02/10/2003
02/11/2003
02/12/2003
03/01/2003
03/02/2003
03/03/2003
03/04/2003
03/05/2003
03/06/2003
03/07/2003
03/08/2003
03/09/2003
03/10/2003
03/11/2003
03/12/2003
04/01/2003
04/02/2003
04/03/2003
04/04/2003
04/05/2003
04/06/2003
04/07/2003
04/08/2003
04/09/2003
04/10/2003
04/11/2003
04/12/2003
05/01/2003
05/02/2003
05/03/2003
05/04/2003
05/05/2003
05/06/2003
05/07/2003
05/08/2003
05/09/2003
05/10/2003
05/11/2003
05/12/2003
06/01/2003
06/02/2003
06/03/2003
06/04/2003
06/05/2003
06/06/2003
06/07/2003
06/08/2003
06/09/2003
06/10/2003
06/11/2003
06/12/2003
07/01/2003
07/02/2003
07/03/2003
07/04/2003
07/05/2003
07/06/2003
07/07/2003
07/08/2003
07/09/2003
07/10/2003
07/11/2003
07/12/2003
08/01/2003
08/02/2003
08/03/2003
08/04/2003
08/05/2003
08/06/2003
08/07/2003
08/08/2003
08/09/2003
08/10/2003
08/11/2003
08/12/2003
09/01/2003
09/02/2003
09/03/2003
09/04/2003
09/05/2003
09/06/2003
09/07/2003
09/08/2003
09/09/2003
09/10/2003
09/11/2003
09/12/2003
10/01/2003
10/02/2003
10/03/2003
10/04/2003
10/05/2003
10/06/2003
10/07/2003
10/08/2003
10/09/2003
10/10/2003
10/11/2003
10/12/2003
11/01/2003
11/02/2003
11/03/2003
11/04/2003
11/05/2003
11/06/2003
11/07/2003
11/08/2003
11/09/2003
11/10/2003
11/11/2003
11/12/2003
12/01/2003
12/02/2003
12/03/2003
12/04/2003
12/05/2003
12/06/2003
12/07/2003
12/08/2003
12/09/2003
12/10/2003
12/11/2003
12/12/2003
13/01/2003
13/02/2003
13/03/2003
13/04/2003
13/05/2003
13/06/2003
13/07/2003
13/08/2003
13/09/2003
13/10/2003
13/11/2003
13/12/2003
14/01/2003
14/02/2003
14/03/2003
14/04/2003
14/05/2003
14/06/2003
14/07/2003
14/08/2003
14/09/2003
14/10/2003
14/11/2003
14/12/2003
15/01/2003
15/02/2003
15/03/2003
15/04/2003
15/05/2003
15/06/2003
15/07/2003
15/08/2003
15/09/2003
15/10/2003
15/11/2003
15/12/2003
16/01/2003
16/02/2003
16/03/2003
16/04/2003
16/05/2003
16/06/2003
16/07/2003
16/08/2003
16/09/2003
16/10/2003
16/11/2003
16/12/2003
17/01/2003
17/02/2003
17/03/2003
17/04/2003
17/05/2003
17/06/2003
17/07/2003
17/08/2003
17/09/2003
17/10/2003
17/11/2003
17/12/2003
18/01/2003
18/02/2003
18/03/2003
18/04/2003
18/05/2003
18/06/2003
18/07/2003
18/08/2003
18/09/2003
18/10/2003
18/11/2003
18/12/2003
19/01/2003
19/02/2003
19/03/2003
19/04/2003
19/05/2003
19/06/2003
19/07/2003
19/08/2003
19/09/2003
19/10/2003
19/11/2003
19/12/2003
20/01/2003
20/02/2003
20/03/2003
20/04/2003
20/05/2003
20/06/2003
20/07/2003
20/08/2003
20/09/2003
20/10/2003
20/11/2003
20/12/2003
21/01/2003
21/02/2003
21/03/2003
21/04/2003
21/05/2003
21/06/2003
21/07/2003
21/08/2003
21/09/2003
21/10/2003
21/11/2003
21/12/2003
22/01/2003
22/02/2003
22/03/2003
22/04/2003
22/05/2003
22/06/2003
22/07/2003
22/08/2003
22/09/2003
22/10/2003
22/11/2003
22/12/2003
23/01/2003
23/02/2003
23/03/2003
23/04/2003
23/05/2003
23/06/2003
23/07/2003
23/08/2003
23/09/2003
23/10/2003
23/11/2003
23/12/2003
24/01/2003
24/02/2003
24/03/2003
24/04/2003
24/05/2003
24/06/2003
24/07/2003
24/08/2003
24/09/2003
24/10/2003
24/11/2003
24/12/2003
25/01/2003
25/02/2003
25/03/2003
25/04/2003
25/05/2003
25/06/2003
25/07/2003
25/08/2003
25/09/2003
25/10/2003
25/11/2003
25/12/2003
26/01/2003
26/02/2003
26/03/2003
26/04/2003
26/05/2003
26/06/2003
26/07/2003
26/08/2003
26/09/2003
26/10/2003
26/11/2003
26/12/2003
27/01/2003
27/02/2003
27/03/2003
27/04/2003
27/05/2003
27/06/2003
27/07/2003
27/08/2003
27/09/2003
27/10/2003
27/11/2003
27/12/2003
28/01/2003
28/02/2003
28/03/2003
28/04/2003
28/05/2003
28/06/2003
28/07/2003
28/08/2003
28/09/2003
28/10/2003
28/11/2003
28/12/2003
29/01/2003
29/03/2003
29/04/2003
29/05/2003
29/06/2003
29/07/2003
29/08/2003
29/09/2003
29/10/2003
29/11/2003
29/12/2003
30/01/2003
30/03/2003
30/04/2003
30/05/2003
30/06/2003
30/07/2003
30/08/2003
30/09/2003
30/10/2003
30/11/2003
30/12/2003
31/01/2003
31/03/2003
31/05/2003
31/07/2003
31/08/2003
31/10/2003
31/12/2003
. Date.
a numeric vector. Consommation d'électricité en MWH.
a numeric vector. Numéro du jour.
a factor with levels Dimanche
Jeudi
Lundi
Mardi
Mercredi
Samedi
Vendredi
. Nom du jour de la semaine.
a factor with levels Août
Avril
Décembre
Février
Janvier
Juillet
Juin
Mai
Mars
Novembre
Octobre
Septembre
. Nom du mois.
a numeric vector. Température en degrés Celsius.
a numeric vector. Statut du jour EDF (spécial = 1 ; non spécial = 0).
a factor with levels non
oui
. Statut du jour annuel (férié ou non).
data(conso_temp) str(conso_temp) plot(conso_temp$conso)
data(conso_temp) str(conso_temp) plot(conso_temp$conso)
Notes de deux correcteurs (A et B) pour les mêmes trente copies.
Copies
Copies
Un jeu de données avec 30 observations de 2 variables.
dotchart3 est une version améliorée des fonctions dotchart et dotchart2 qui permettent de construire des diagrammes à points de Cleveland.
dotchart3( x, labels = NULL, groups = NULL, gdata = NULL, cex = par("cex"), pch = 21, gpch = 21, bg = par("bg"), color = par("fg"), gcolor = par("fg"), lcolor = "gray", xlim = range(x[is.finite(x)]), main = NULL, xlab = NULL, ylab = NULL, cex.axis = cex, ... )
dotchart3( x, labels = NULL, groups = NULL, gdata = NULL, cex = par("cex"), pch = 21, gpch = 21, bg = par("bg"), color = par("fg"), gcolor = par("fg"), lcolor = "gray", xlim = range(x[is.finite(x)]), main = NULL, xlab = NULL, ylab = NULL, cex.axis = cex, ... )
x |
soit un tableau ou une matrice de valeurs numériques (les |
labels |
un vecteur d'étiquettes pour chaque point. Pour les vecteurs, la valeur par défaut est d'utiliser |
groups |
un facteur optionnel indiquant comment les éléments de |
gdata |
les valeurs des données pour les groupes. Il s'agit généralement d'un résumé tel que la médiane ou la moyenne de chaque groupe. |
cex |
la taille des caractères à utiliser. Fixer |
pch |
le caractère ou le symbole de traçage à utiliser. |
gpch |
le caractère ou le symbole de tracé à utiliser pour les valeurs de groupe. |
bg |
la couleur de fond des caractères ou symboles à utiliser pour le tracé ; utilisez |
color |
la (les) couleur(s) à utiliser pour les points et les étiquettes. |
gcolor |
la couleur unique à utiliser pour les étiquettes et les valeurs de groupe. |
lcolor |
la (les) couleur(s) à utiliser pour les lignes horizontales. |
xlim |
largeur horizontale de la zone de tracé, voir |
main |
titre général du graphique, voir |
xlab |
les annotations de l'axe des abscisses définies comme dans |
ylab |
les annotations de l'axe des ordonnées définies comme dans |
cex.axis |
la taille des caractères à utiliser pour les annotations des axes. |
... |
les paramètres graphiques peuvent également être spécifiés comme arguments. |
Un dotplot de la série statistique.
Frederic Bertrand, [email protected]
F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, Statistiques pour l’économie et la gestion, De Boeck Supérieur, Louvain-la-Neuve, 2021.
Other plot functions:
plotcdf3()
data(Total_Secteur) NameX <- Total_Secteur$NameX Effectif <- Total_Secteur$Effectif dotchart3(Effectif,labels=NameX,pch=19,col="#00FFFF",cex=1.6,cex.axis=1.2) dotchart3(Effectif,labels=NameX,pch=19,col="#00FFFF")
data(Total_Secteur) NameX <- Total_Secteur$NameX Effectif <- Total_Secteur$Effectif dotchart3(Effectif,labels=NameX,pch=19,col="#00FFFF",cex=1.6,cex.axis=1.2) dotchart3(Effectif,labels=NameX,pch=19,col="#00FFFF")
Les colonnes 2, 3 et 4 du tableau 2.8 contiennent les taux d’emploi, au troisième trimestre 2020, selon le niveau d’études : premier cycle du second degré (PCSD), deuxième cycle du second degré (DCSD), supérieur (SUP). Le taux d’emploi est le pourcentage d’actifs occupés dans la population en âge de travailler. Les actifs occupés sont les personnes qui travaillent au moins une heure par semaine en tant que salarié ou à titre lucratif, ou qui ont un emploi, mais sont temporairement absentes de leur travail pour maladie, congé ou conflit social. Cet indicateur donne le pourcentage des actifs occupés âgés de 25 à 64 ans dans la population des individus âgés de 25 à 64 ans. Les trois dernières colonnes du tableau 2.8 contiennent le taux d’emploi, au troisième trimestre 2020, d’une classe d’âge. Cet indicateur se mesure en fonction du nombre des actifs occupés d’un âge donné rapporté à l’effectif total de cette classe d’âge. Les actifs occupés sont les personnes de 15 ans et plus qui, durant la semaine de référence, déclarent avoir effectué un travail rémunéré pendant une heure au moins ou avoir occupé un emploi dont elles étaient absentes. Les taux d’emploi sont présentés pour trois classes d’âge : les personnes âgées de 15 à 24 ans sont celles qui font leur entrée sur le marché du travail à l’issue de leur scolarité, les personnes âgées de 25 à 54 ans sont celles qui sont au plus fort de leur activité professionnelle, et les personnes âgées de 55 à 64 ans sont celles qui ont dépassé le pic de leur carrière professionnelle et approchent de l’âge de la retraite. Cet indicateur est désaisonnalisé et est mesuré en pourcentage de l’effectif total de la classe d’âge.
Emploi_Etude_Age
Emploi_Etude_Age
A data frame with 37 observations on the following 6 variables.
a numeric vector
a numeric vector
a numeric vector
a numeric vector
a numeric vector
a numeric vector
doi:10.1787/6e3d44f3-fr, doi:10.1787/b01db125-fr.
data(Emploi_Etude_Age) str(Emploi_Etude_Age) plot(Emploi_Etude_Age)
data(Emploi_Etude_Age) str(Emploi_Etude_Age) plot(Emploi_Etude_Age)
Prix de l'essence sans plomb 95 en avril 2021 dans deux départements français, l'aube et la marne.
Essence
Essence
Un jeu de données avec 60 observations de 2 variables.
Le taux d'emploi d'une classe d'âge se mesure en fonction du nombre des actifs occupés d'un âge donné rapporté à l'effectif total de cette classe d'âge. Les actifs occupés sont les personnes de 15 ans et plus qui, durant la semaine de référence, déclarent avoir effectué un travail rémunéré pendant une heure au moins ou avoir occupé un emploi dont elles étaient absentes. Les taux d'emploi sont présentés pour quatre classes d'âge : les personnes âgées de 15 à 64 ans (personnes en âge de travailler); les personnes âgées de 15 à 24 ans sont celles qui font leur entrée sur le marché du travail à l'issue de leur scolarité, les personnes âgées de 25 à 54 ans sont celles qui sont au plus fort de leur activité professionnelle, et les personnes âgées de 55 à 64 ans sont celles qui ont dépassé le pic de leur carrière professionnelle et approchent de l'âge de la retraite. Cet indicateur est désaisonnalisé et est mesuré en pourcentage de l'effectif total de la classe d'âge. OCDE (2021), Taux d'emploi par groupe d'âge (indicateur).
Europe
Europe
Un jeu de données avec 35 observations de 6 variables.
Generate coordinates to draw a circle.
funcCircleCoords(center = c(0, 0), r = 1, npoints = 100)
funcCircleCoords(center = c(0, 0), r = 1, npoints = 100)
center |
coordinate for centroid |
r |
radius |
npoints |
number of coordinates to generate |
a dataframe
Adapted from Joran's response to https://stackoverflow.com/questions/6862742/draw-a-circle-with-ggplot2.
funcCircleCoords(c(1,2),1) plot(funcCircleCoords(c(1,2),1))
funcCircleCoords(c(1,2),1) plot(funcCircleCoords(c(1,2),1))
Diagrammes en radar avancés pour ggplot2 (Enhanced Radar Plots for ggplot2)
ggradar( plot.data, base.size = 15, font.radar = "sans", values.radar = c("0%", "50%", "100%"), axis.labels = colnames(plot.data)[-1], grid.min = 0, grid.mid = 0.5, grid.max = 1, centre.y = grid.min - ((1/9) * (grid.max - grid.min)), plot.extent.x.sf = 1, plot.extent.y.sf = 1.2, x.centre.range = 0.02 * (grid.max - centre.y), label.centre.y = FALSE, grid.line.width = 0.5, gridline.min.linetype = "longdash", gridline.mid.linetype = "longdash", gridline.max.linetype = "longdash", gridline.min.colour = "grey", gridline.mid.colour = "#007A87", gridline.max.colour = "grey", grid.label.size = 6, gridline.label.offset = -0.1 * (grid.max - centre.y), label.gridline.min = TRUE, label.gridline.mid = TRUE, label.gridline.max = TRUE, axis.label.offset = 1.15, axis.label.size = 5, axis.line.colour = "grey", group.line.width = 1.5, group.point.size = 6, group.colours = NULL, background.circle.colour = "#D7D6D1", background.circle.transparency = 0.2, plot.legend = if (nrow(plot.data) > 1) TRUE else FALSE, legend.title = "", plot.title = "", legend.text.size = 14, legend.position = "left" )
ggradar( plot.data, base.size = 15, font.radar = "sans", values.radar = c("0%", "50%", "100%"), axis.labels = colnames(plot.data)[-1], grid.min = 0, grid.mid = 0.5, grid.max = 1, centre.y = grid.min - ((1/9) * (grid.max - grid.min)), plot.extent.x.sf = 1, plot.extent.y.sf = 1.2, x.centre.range = 0.02 * (grid.max - centre.y), label.centre.y = FALSE, grid.line.width = 0.5, gridline.min.linetype = "longdash", gridline.mid.linetype = "longdash", gridline.max.linetype = "longdash", gridline.min.colour = "grey", gridline.mid.colour = "#007A87", gridline.max.colour = "grey", grid.label.size = 6, gridline.label.offset = -0.1 * (grid.max - centre.y), label.gridline.min = TRUE, label.gridline.mid = TRUE, label.gridline.max = TRUE, axis.label.offset = 1.15, axis.label.size = 5, axis.line.colour = "grey", group.line.width = 1.5, group.point.size = 6, group.colours = NULL, background.circle.colour = "#D7D6D1", background.circle.transparency = 0.2, plot.legend = if (nrow(plot.data) > 1) TRUE else FALSE, legend.title = "", plot.title = "", legend.text.size = 14, legend.position = "left" )
plot.data |
dataframe comprising one row per group |
base.size |
text size |
font.radar |
text font family |
values.radar |
values to print at minimum, 'average', and maximum gridlines |
axis.labels |
names of axis labels if other than column names supplied via plot.data |
grid.min |
value at which mininum grid line is plotted |
grid.mid |
value at which 'average' grid line is plotted |
grid.max |
value at which maximum grid line is plotted |
centre.y |
value of y at centre of plot |
plot.extent.x.sf |
controls relative size of plot horizontally |
plot.extent.y.sf |
controls relative size of plot vertically |
x.centre.range |
controls axis label alignment |
label.centre.y |
whether value of y at centre of plot should be labelled |
grid.line.width |
width of gridline |
gridline.min.linetype |
line type of minimum gridline |
gridline.mid.linetype |
line type of 'average' gridline |
gridline.max.linetype |
line type of maximum gridline |
gridline.min.colour |
colour of minimum gridline |
gridline.mid.colour |
colour of 'average' gridline |
gridline.max.colour |
colour of maximum gridline |
grid.label.size |
text size of gridline label |
gridline.label.offset |
displacement to left/right of central vertical axis |
label.gridline.min |
whether or not to label the mininum gridline |
label.gridline.mid |
whether or not to label the 'mininum'average' gridline |
label.gridline.max |
whether or not to label the maximum gridline |
axis.label.offset |
vertical displacement of axis labels from maximum grid line, measured relative to circle diameter |
axis.label.size |
text size of axis label |
axis.line.colour |
colour of axis line |
group.line.width |
line width of group |
group.point.size |
point size of group |
group.colours |
colour of group |
background.circle.colour |
colour of background circle/radar |
background.circle.transparency |
transparency of background circle/radar |
plot.legend |
whether to include a plot legend |
legend.title |
title of legend |
plot.title |
title of radar plot |
legend.text.size |
text size in legend |
legend.position |
position of legend, valid values are "top", "right", "bottom", "left" |
a ggplot object
Most of the code is from https://rstudio-pubs-static.s3.amazonaws.com/5795_e6e6411731bb4f1b9cc7eb49499c2082.html.
library(dplyr) library(scales) library(tibble) mtcars_radar <- mtcars %>% as_tibble(rownames = "group") %>% mutate_at(vars(-group), rescale) %>% tail(4) %>% select(1:10) mtcars_radar ggradar(mtcars_radar)
library(dplyr) library(scales) library(tibble) mtcars_radar <- mtcars %>% as_tibble(rownames = "group") %>% mutate_at(vars(-group), rescale) %>% tail(4) %>% select(1:10) mtcars_radar ggradar(mtcars_radar)
Répartition par région française du nombre de personnes hospitalisées et atteintes du Covid 19 le 21 février 2021.
HospitFull
HospitFull
Un jeu de données avec 19 observations de 12 variables.
Valeurs d'articles de qualité équivalente en fonction de leur marque.
Marque.Valeur
Marque.Valeur
Un jeu de données avec 90 observations de 2 variables.
Valeurs d'articles de qualité équivalente en fonction de leur marque.
Marque.Valeur.large
Marque.Valeur.large
Un jeu de données avec 30 observations de 3 variables.
Pour une distribution groupée, cette fonction la moyenne, la variance et la variance corrigée à l'aide de la correction de Sheppard.
moments.grouped(gp.data, population = FALSE)
moments.grouped(gp.data, population = FALSE)
gp.data |
Un objet de classe grouped.data créé avec le package |
population |
Un booléen qui indique si le calcul est réalisé à partir d'une population ( |
Une liste comportant trois éléments :
La moyenne de la distribution groupée mu
La variance de la distribution non corrigée avec la correction de Sheppard sigma2
La variance de la distribution corrigée avec la correction de Sheppard sigma2Adj
L'asymétrie de Fisher de la distribution sigma2
L'asymétrie de Pearson de la distribution sigma2
L'applatissement de Pearson de la distribution corrigée avec la correction de Sheppard sigma2
L'applatissement de Fisher de la distribution corrigée avec la correction de Sheppard sigma2
lims <- c(40, 45, 50, 55, 60, 65, 70, 75) counts <- c(1,2,3,4,0,0,1) grouped.example <- actuar::grouped.data(Group = lims, Frequency = counts) moments.grouped(grouped.example)
lims <- c(40, 45, 50, 55, 60, 65, 70, 75) counts <- c(1,2,3,4,0,0,1) grouped.example <- actuar::grouped.data(Group = lims, Frequency = counts) moments.grouped(grouped.example)
Ménages par taille du ménage en 2017, source INSEE.
Personnes_Foyer
Personnes_Foyer
Un jeu de données avec 6 observations de 2 variables xi
et ni
.
Nombres de personnes dans un foyer
Nombres de foyers
Cette fonction construit un stéréogramme permettant de juger de l'association entre deux variables discrètes ou groupées en classes.
plotcdf3( x, y, f, xaxe, yaxe, col = NULL, border = FALSE, Nxy = 200, theme = "0" )
plotcdf3( x, y, f, xaxe, yaxe, col = NULL, border = FALSE, Nxy = 200, theme = "0" )
x |
Valeurs observées ou modalités de la première variable discrète |
y |
Valeurs observées ou modalités de la seconde variable discrète |
f |
Si f=0 (donc length(f)=0), x et y sont deux séries statistiques. Si length(f)>1, f est un tableau de fréquences et x et y les noms des lignes et des colonnes de f. |
xaxe |
Nom de l'axe des abscisses |
yaxe |
Nom de l'axe des ordonnées |
col |
Couleur du stéréogramme |
border |
Le maillage du graphique doit-il être affiché ? |
Nxy |
Pas du maillage pour chaque axe |
theme |
Le thème détermine la palette de couleurs utilisées. Il y a quatre choix possibles en couleurs "0", "1", "2", "3" et un en nuances de gris "bw" |
Un stéréogramme des deux séries statistiques groupées ou des deux séries statistiques discrètes étudiées.
Frederic Bertrand, [email protected]
F. Bertrand, Ch. Derquenne, G. Dufrénot, F. Jawadi and M. Maumy, C. Borsenberger editor, Statistiques pour l’économie et la gestion, De Boeck Supérieur, Louvain-la-Neuve, 2021.
Other plot functions:
dotchart3()
ff=table(cut(Europe$Partiel_H,c(0,10,20,30)), cut(Europe$Partiel_F,c(0,10,20,30,40,50,60,70,80)))/ sum(table(cut(Europe$Partiel_H,c(0,10,20,30)), cut(Europe$Partiel_F,c(0,10,20,30,40,50,60,70,80)))) plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="0") plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="1") plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="2") plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="cyan") plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="cyan",border=TRUE) plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="bw") xx=seq(1.5,12.5) yy=seq(0.5,6.5) p=c(1/36,0,0,0,0,0, 2/36,0,0,0,0,0, 2/36,1/36,0,0,0,0, 2/36,2/36,0,0,0,0, 2/36,2/36,1/36,0,0,0, 2/36,2/36,2/36,0,0,0, 0,2/36,2/36,1/36,0,0, 0,0,2/36,2/36,0,0, 0,0,0,2/36,1/36,0, 0,0,0,0,2/36,0, 0,0,0,0,0,1/36) p=matrix(p,byrow=TRUE,ncol=6) plotcdf3(xx,yy,p,"somme des des","valeur du plus petit")
ff=table(cut(Europe$Partiel_H,c(0,10,20,30)), cut(Europe$Partiel_F,c(0,10,20,30,40,50,60,70,80)))/ sum(table(cut(Europe$Partiel_H,c(0,10,20,30)), cut(Europe$Partiel_F,c(0,10,20,30,40,50,60,70,80)))) plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="0") plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="1") plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="2") plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="cyan") plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="cyan",border=TRUE) plotcdf3(c(0,10,20,30),c(0,10,20,30,40,50,60,70,80), f=ff,xaxe="Hommes",yaxe="Femmes",theme="bw") xx=seq(1.5,12.5) yy=seq(0.5,6.5) p=c(1/36,0,0,0,0,0, 2/36,0,0,0,0,0, 2/36,1/36,0,0,0,0, 2/36,2/36,0,0,0,0, 2/36,2/36,1/36,0,0,0, 2/36,2/36,2/36,0,0,0, 0,2/36,2/36,1/36,0,0, 0,0,2/36,2/36,0,0, 0,0,0,2/36,1/36,0, 0,0,0,0,2/36,0, 0,0,0,0,0,1/36) p=matrix(p,byrow=TRUE,ncol=6) plotcdf3(xx,yy,p,"somme des des","valeur du plus petit")
Précipitations relevées dans soixante villes aux États-Unis d'Amérique en 1975.
Precipitations_USA
Precipitations_USA
Un jeu de données avec 60 observations de 4 variables.
Résultats par département au premier tour des élections présidentielles françaises de 2012.
presid_2012
presid_2012
A data frame with 96 observations on the following 13 variables.
a factor with levels Ain
Aisne
Allier
Alpes-de-Haute-Provence
Alpes-Maritimes
Ardèche
Ardennes
Ariège
Aube
Aude
Aveyron
Bas-Rhin
Bouches-du-Rhône
Calvados
Cantal
Charente
Charente-Maritime
Cher
Corrèze
Corse-du-Sud
Côte-d'Or} \code{Côtes-d'Armor
Creuse
Deux-Sèvres
Dordogne
Doubs
Drôme
Essonne
Eure
Eure-et-Loir
Finistère
Gard
Gers
Gironde
Haut-Rhin
Haute-Corse
Haute-Garonne
Haute-Loire
Haute-Marne
Haute-Saône
Haute-Savoie
Haute-Vienne
Hautes-Alpes
wuaNVkQGbiffVtIJE7mbKd6pbDZqBuEe-44Hauts-de-Seine
Hérault
Ille-et-Vilaine
Indre
Indre-et-Loire
Isère
Jura
Landes
Loir-et-Cher
Loire
Loire-Atlantique
Loiret
Lot
Lot-et-Garonne
Lozère
Maine-et-Loire
Manche
Marne
Mayenne
Meurthe-et-Moselle
Meuse
Morbihan
Moselle
Nièvre
Nord
Oise
Orne
Paris
Pas-de-Calais
Puy-de-Dôme
wuaNVkQGbiffVtIJE7mbKd6pbDZqBuEe-75wuaNVkQGbiffVtIJE7mbKd6pbDZqBuEe-76Rhône
Saône-et-Loire
Sarthe
Savoie
Seine-et-Marne
Seine-Maritime
Seine-Saint-Denis
Somme
Tarn
Tarn-et-Garonne
Territoire_de_Belfort
Val-dOise
Val-de-Marne
Var
Vaucluse
Vendée
Vienne
Vosges
Yonne
Yvelines
. Nom du département (métropole) où les suffrages ont été dénombrés.
a numeric vector. Abstentions du 1er tour.
a numeric vector. Bulletins blancs ou nuls au 1er tour.
a numeric vector. Candidat Bayrou.
a numeric vector. Candidat Hollande au 1er tour.
a numeric vector. Candidat Cheminade.
a numeric vector. Candidat Mélenchon.
a numeric vector. Candidat Dupont-Aignan.
a numeric vector. Candidat Sarkozy au 1er tour.
a numeric vector. Candidat Poutou.
a numeric vector. Candidate Joly.
a numeric vector. Candidate Le Pen.
a numeric vector. Candidate Arthaud.
data(presid_2012) str(presid_2012) plot(presid_2012) library(vcd) vcd::mosaic(t(as.table(as.matrix(presid_2012[1:5,-1]))), rot_labels=c(0,90,0,0), just_labels = "right")
data(presid_2012) str(presid_2012) plot(presid_2012) library(vcd) vcd::mosaic(t(as.table(as.matrix(presid_2012[1:5,-1]))), rot_labels=c(0,90,0,0), just_labels = "right")
Répartition de la population des provinces et des territoires du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.
Proter_Canada
Proter_Canada
A data frame with 13 observations on the following 2 variables.
a character vector
a numeric vector
data(Proter_Canada) str(Proter_Canada) barplot(Proter_Canada$Population, names.arg=Proter_Canada$ProTer, las=2)
data(Proter_Canada) str(Proter_Canada) barplot(Proter_Canada$Population, names.arg=Proter_Canada$ProTer, las=2)
Répartition en provinces et territoires et sexe de la population du Canada en 2020. Statistique Canada. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et sexe.
ProtervsSexe_Canada
ProtervsSexe_Canada
Un jeu de données avec 13 observations de 2 variables.
Répartition par région française du nombre de personne en réanimation et atteintes de la Covid 19 le 21 février 2021.
ReaFull
ReaFull
Un jeu de données avec 19 observations de 12 variables.
Résistance à l'éclatement.
Resistance
Resistance
Un vecteur avec 30 observations.
Répartitition du revenu par quantiles - enquêtes EU-SILC et PCM (ILC_DI01).
Richesse
Richesse
Un jeu de données avec 10 observations de 36 variables.
Emploi par secteur d'activité et par pays (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021). ‘INDUSCONSTR désigne l’activité industrielle AVEC la construction.
Secteur
Secteur
Un jeu de données avec 34 observations de 6 variables .
Nombres de personnes dans un foyer
Nombres de foyers
Nombres de foyers
Nombres de foyers
Nombres de foyers
Nombres de foyers
Calcul de la correction de Sheppard pour la variance.
sheppardCorrection(gp.data, order = 2, population = FALSE)
sheppardCorrection(gp.data, order = 2, population = FALSE)
gp.data |
Un objet de classe grouped.data créé avec le package |
order |
Choix de l'ordre pour la correction de Sheppard. Ne peut être égal qu'à 2 ou 4. |
population |
Un booléen qui indique si le calcul est réalisé à partir d'une population ( |
Un vecteur contenant la valeur de la correction de Sheppard pour le calcul de la variance d'une distribution groupée.
lims <- c(40, 45, 50, 55, 60, 65, 70, 75) counts <- c(1,2,3,4,0,0,1) grouped.example <- actuar::grouped.data(Group = lims, Frequency = counts) sheppardCorrection(grouped.example) sheppardCorrection(grouped.example, order=4)
lims <- c(40, 45, 50, 55, 60, 65, 70, 75) counts <- c(1,2,3,4,0,0,1) grouped.example <- actuar::grouped.data(Group = lims, Frequency = counts) sheppardCorrection(grouped.example) sheppardCorrection(grouped.example, order=4)
Nombre de sièges et de voix dans l'Union européenne.
Sieges_Voix
Sieges_Voix
Un jeu de données avec 27 observations de 4 variables.
Emploi total par pays (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021).
Total_Pays
Total_Pays
Un jeu de données avec 34 observations de 2 variables.
Acronyme du pays
Nombres de personnes
Emploi total par secteur d'activité (indicateur). OCDE (2021). doi:10.1787/6b2fff89-fr. (Consulté le 11 février 2021).
L'industrie (INDUSwithoutCONSTR
) désigne l'activité industrielle SANS la construction.
Total_Secteur
Total_Secteur
Un jeu de données avec 5 observations de 3 variables.
Acronyme du secteur d'actvité
Nom du secteur d'actvité
Nombres de personnes