Title: | Initiation à La Statistique Avec R |
---|---|
Description: | Datasets and functions for the book "Initiation à la Statistique avec R", F. Bertrand and M. Maumy-Bertrand (2022, ISBN:978-2100782826 Dunod, fourth edition). |
Authors: | Frederic Bertrand [cre, aut] , Myriam Maumy-Bertrand [aut] |
Maintainer: | Frederic Bertrand <[email protected]> |
License: | GPL-3 |
Version: | 4.0.1 |
Built: | 2025-02-08 04:52:23 UTC |
Source: | https://github.com/fbertran/biostatr |
Cette fonction permet de calculer plusieurs types d'intervalles de confiance pour une proportion.
binom.ci(x, n, conf.level = 0.95, method = c("Wilson", "exact", "Wald", "all"))
binom.ci(x, n, conf.level = 0.95, method = c("Wilson", "exact", "Wald", "all"))
x |
Nombre de succès |
n |
Nombre d'essais |
conf.level |
Niveau de confiance recherché pour l'intervalle |
method |
Type d'intervalle de confiance à calculer : intervalle de "Wilson", intervalle "exact" de Clopper-Pearson, intervalle asymptotique de "Wald" ou tous les trois "all" |
matrix |
Limites des intervalles de confiance demandés. |
Frédéric Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~fbertran/
Maumy-Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~mmaumy/
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
binom.ci(5,10,method="all")
binom.ci(5,10,method="all")
Motivation: Package compagnon du livre Initiation à la statistique avec R. Il contient les codes des chapitres du livre ainsi que les solutions des exercices mais aussi d'autres compléments à découvrir.
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, 4ème édition, ISBN:9782100847945, Dunod, Paris, 2023
Initiation à la Statistique avec R, Frédéric Bertrand, Myriam Maumy-Bertrand, 2023, , https://www.dunod.com/sciences-techniques/initiation-statistique-avec-r-cours-exemples-exercices-et-problemes-corriges-1, https://github.com/fbertran/BioStatR/ et https://fbertran.github.io/BioStatR/
set.seed(314)
set.seed(314)
Calcule coefficent de variation d'une série statistique
cvar(x)
cvar(x)
x |
Un vecteur numérique |
Le coefficient de variation est égal à l'écart-type corrigé divisé par la moyenne. Il est exprimé en pourcents.
num |
Valeur du coefficient de variation exprimé en pourcents |
Frédéric Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~fbertran/
Maumy-Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~mmaumy/
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
data(Europe) cvar(Europe[,2])
data(Europe) cvar(Europe[,2])
Cette fonction calcule le rapport de corrélation qui est une
mesure d'association importante entre une variable quantitative et une
variable qualitative.
eta2(x, y)
eta2(x, y)
x |
Un vecteur associé à la variable quantitative |
y |
Un facteur associé à la variable qualitative |
num |
La valeur du rapport de corrélation empirique |
Frédéric Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~fbertran/
Maumy-Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~mmaumy/
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
eta2(Mesures5$taille,Mesures5$espece)
eta2(Mesures5$taille,Mesures5$espece)
This dataset provide mean weekly cumulated work durations for several European countries.
A data frame with 25 observations on the following 2 variables.
a factor with the some of the European countries as levels
weekly cumulative work duration
The duration is given in hours
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
data(Europe)
data(Europe)
This dataset measurements of several features of the fruits of small trees such as their mass (in g) or their length (in cm).
A data frame with 252 observations on the following 5 variables.
a numeric vector
a numeric vector
a factor with levels bignone
,
glycine blanche
, glycine violette
and lauriers roses
This dataset was made during the summer 2009 in the south of France. It provides measurements of several features of the fruits of small trees such as their mass or their length.
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
data(Extrait_Taille)
data(Extrait_Taille)
Dessine le graphique des quantiles ou qqplot
et la droite
interquartile (passant par le premier et le troisième quartile à la manière
de la fonction qqline
) avec la bibliothèque graphique
ggplot2
.
gg_qqplot( df, var, qdist = qnorm, params = list(), qq.line = TRUE, color = "red", alpha = 0.5 )
gg_qqplot( df, var, qdist = qnorm, params = list(), qq.line = TRUE, color = "red", alpha = 0.5 )
df |
Un jeu de données (dataframe) |
var |
Le nom d'une variable de df |
qdist |
La fonction quantile d'une (famille de) distribution. Par défaut celle de la famille des lois normales. |
params |
Une liste de paramètres pour spécifier la loi à utiliser. Par
défaut la loi normale centrée et réduite. Les paramètres peuvent être
estimés avec la fonction |
qq.line |
Une valeur logique. Affiche ou masque la droite interquartile. |
color |
Le nom d'une couleur. Spécifie la couleur à utiliser pour la droite interquartile. |
alpha |
Indice de transparence. Spécifie la transparence à utiliser pour représenter les valeurs de l'échantillon. |
ggplot |
Un graphique utilisant la bibliothèque ggplot2. Affiche les valeurs des quartiles théoriques par lesquels passe la droite ainsi que son ordonnée à l'origine et sa pente si le tracé de celle-ci est demandé. |
Frédéric Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~fbertran/
Maumy-Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~mmaumy/
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 3e, 2018.
glycine.blanche<-subset(Mesures,subset=(Mesures$espece=="glycine blanche")) gg_qqplot(glycine.blanche,"taille") #bonus ajustement avec une autre loi (ici Student (car dist = qt) dont on estime les ddl) lauriers.roses<-subset(Mesures,subset=(Mesures$espece=="laurier rose")) shapiro.test(lauriers.roses$taille) #pas issu d'une loi normale au risque alpha=5% gg_qqplot(lauriers.roses,"taille") gg_qqplot(lauriers.roses,"taille",qq.line=FALSE) #essayons un qqplot avec une loi de Student ## Not run: require(MASS) params <- as.list(fitdistr(lauriers.roses$taille, "t")$estimate) #avec la droite gg_qqplot(lauriers.roses,"taille",qt,params) #essayons un qqplot avec une loi gamma params <- as.list(fitdistr(lauriers.roses$taille,"gamma")$estimate) #avec la droite gg_qqplot(lauriers.roses,"taille",qgamma,params) #essayons un qqplot avec une loi du chi-deux params <- list(df=fitdistr(lauriers.roses$taille,"chi-squared",start=list(df=5), method="Brent",lower=1,upper=40)$estimate) #avec la droite gg_qqplot(lauriers.roses,"taille",qchisq,params) ## End(Not run)
glycine.blanche<-subset(Mesures,subset=(Mesures$espece=="glycine blanche")) gg_qqplot(glycine.blanche,"taille") #bonus ajustement avec une autre loi (ici Student (car dist = qt) dont on estime les ddl) lauriers.roses<-subset(Mesures,subset=(Mesures$espece=="laurier rose")) shapiro.test(lauriers.roses$taille) #pas issu d'une loi normale au risque alpha=5% gg_qqplot(lauriers.roses,"taille") gg_qqplot(lauriers.roses,"taille",qq.line=FALSE) #essayons un qqplot avec une loi de Student ## Not run: require(MASS) params <- as.list(fitdistr(lauriers.roses$taille, "t")$estimate) #avec la droite gg_qqplot(lauriers.roses,"taille",qt,params) #essayons un qqplot avec une loi gamma params <- as.list(fitdistr(lauriers.roses$taille,"gamma")$estimate) #avec la droite gg_qqplot(lauriers.roses,"taille",qgamma,params) #essayons un qqplot avec une loi du chi-deux params <- list(df=fitdistr(lauriers.roses$taille,"chi-squared",start=list(df=5), method="Brent",lower=1,upper=40)$estimate) #avec la droite gg_qqplot(lauriers.roses,"taille",qchisq,params) ## End(Not run)
This dataset measurements of several features of the fruits of small trees such as their mass or their length.
A data frame with 252 observations on the following 3 variables.
a numeric vector
a numeric vector
a factor with levels bignone
,
glycine blanche
, glycine violette
and lauriers roses
This dataset was made during the summer 2009 in the south of France. It provides measurements of several features of the fruits of small trees such as their mass or their length.
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
data(Mesures)
data(Mesures)
This dataset measurements of several features of the fruits of small trees such as their mass or their length.
A data frame with 252 observations on the following 5 variables.
a numeric vector
a numeric vector
a numeric vector
a numeric vector
a factor
with levels bignone
, glycine blanche
, glycine violette
and lauriers roses
This dataset was made during the summer 2009 in the south of France. It provides measurements of several features of the fruits of small trees such as their mass or their length.
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
data(Mesures5)
data(Mesures5)
Sert à représenter des histogrammes dans les graphiques matriciels
panel.hist(x, ...)
panel.hist(x, ...)
x |
Un vecteur numérique |
... |
Des arguments à transmettre à la fonction qui créé les histogrammes |
Cette fonction s'utilise avec la fonctions graphique pairs.
Frédéric Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~fbertran/
Maumy-Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~mmaumy/
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
data(Mesures5) pairs(Mesures5,diag.panel="panel.hist")
data(Mesures5) pairs(Mesures5,diag.panel="panel.hist")
Cette fonction construit un stéréogramme permettant de juger de l'association entre deux variables discrètes ou groupées en classes.
plotcdf2( x, y, f, xaxe, yaxe, col = NULL, border = FALSE, Nxy = 200, theme = "0" )
plotcdf2( x, y, f, xaxe, yaxe, col = NULL, border = FALSE, Nxy = 200, theme = "0" )
x |
Valeurs observées ou modalités de la première variable discrète |
y |
Valeurs observées ou modalités de la seconde variable discrète |
f |
Si |
xaxe |
Nom de l'axe des abscisses |
yaxe |
Nom de l'axe des ordonnées |
col |
Couleur du stéréogramme |
border |
Le maillage du graphique doit-il être affiché ? |
Nxy |
Pas du maillage pour chaque axe |
theme |
Le thème détermine la palette de couleurs utilisées. Il y a quatre choix possibles en couleurs "0", "1", "2", "3" et un en nuances de gris "bw" |
Un stéréogramme des deux séries statistiques groupées ou des deux variables discrètes étudiées.
Frédéric Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~fbertran/
Maumy-Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~mmaumy/
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
xx=c(1.83,1.72,1.65,1.70,2.05,1.92,1.85,1.70,1.75,1.9) yy=c(75,70,70,60,90,92,75,68,71,87) plotcdf2(xx,yy,f=0,"taille en m","poids en kg") xx=seq(2,12) yy=seq(1,6) p=c(1/36,0,0,0,0,0, 2/36,0,0,0,0,0, 2/36,1/36,0,0,0,0, 2/36,2/36,0,0,0,0, 2/36,2/36,1/36,0,0,0, 2/36,2/36,2/36,0,0,0, 0,2/36,2/36,1/36,0,0, 0,0,2/36,2/36,0,0, 0,0,0,2/36,1/36,0, 0,0,0,0,2/36,0, 0,0,0,0,0,1/36) p=matrix(p,byrow=TRUE,ncol=6) plotcdf2(xx,yy,p,"somme des dés","valeur du plus petit")
xx=c(1.83,1.72,1.65,1.70,2.05,1.92,1.85,1.70,1.75,1.9) yy=c(75,70,70,60,90,92,75,68,71,87) plotcdf2(xx,yy,f=0,"taille en m","poids en kg") xx=seq(2,12) yy=seq(1,6) p=c(1/36,0,0,0,0,0, 2/36,0,0,0,0,0, 2/36,1/36,0,0,0,0, 2/36,2/36,0,0,0,0, 2/36,2/36,1/36,0,0,0, 2/36,2/36,2/36,0,0,0, 0,2/36,2/36,1/36,0,0, 0,0,2/36,2/36,0,0, 0,0,0,2/36,1/36,0, 0,0,0,0,2/36,0, 0,0,0,0,0,1/36) p=matrix(p,byrow=TRUE,ncol=6) plotcdf2(xx,yy,p,"somme des dés","valeur du plus petit")
Créé un intervalle de confiance pour le paramètre d'une loi de Poisson.
poi.ci(x, conf.level = 0.95)
poi.ci(x, conf.level = 0.95)
x |
Un vecteur de données |
conf.level |
Niveau de confiance de l'intervalle |
matrix |
Limites des intervalles de confiance demandés. |
Frédéric Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~fbertran/
Maumy-Bertrand
[email protected]
http://www-irma.u-strasbg.fr/~mmaumy/
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
poi.ci(rpois(20,10))
poi.ci(rpois(20,10))
Ce jeu de données contient des mesures de masse et de taille pour permettre le calcul de l'indice de masse corporelle (aussi dit de Quetelet).
Un data frame avec 66 observations de 3 variables.
un facteur donnant le sexe de l'individu
le poids de l'individu
la hauteur de l'individu
Le poids est exprimée en kg et la hauteur en cm
F. Bertrand, M. Maumy-Bertrand, Initiation à la Statistique avec R, Dunod, 4ème édition, 2023.
data(Quetelet)
data(Quetelet)