Title: | Statistical Modelling in Action with R |
---|---|
Description: | Datasets and functions for the book "Modélisation statistique par la pratique avec R", F. Bertrand, E. Claeys and M. Maumy-Bertrand (2019, ISBN:9782100793525, Dunod, Paris). The first chapter of the book is dedicated to an introduction to the R statistical software. The second chapter deals with correlation analysis: Pearson, Spearman and Kendall simple, multiple and partial correlation coefficients. New wrapper functions for permutation tests or bootstrap of matrices of correlation are provided with the package. The third chapter is dedicated to data exploration with factorial analyses (PCA, CA, MCA, MDA) and clustering. The fourth chapter is dedicated to regression analysis: fitting and model diagnostics are detailed. The exercises focus on covariance analysis, logistic regression, Poisson regression, two-way analysis of variance for fixed or random factors. Various example datasets are shipped with the package: for instance on pokemon, world of warcraft, house tasks or food nutrition analyses. |
Authors: | Frederic Bertrand [cre, aut] , Emmanuelle Claeys [aut], Myriam Maumy-Bertrand [aut] |
Maintainer: | Frederic Bertrand <[email protected]> |
License: | GPL-3 |
Version: | 1.3.2 |
Built: | 2024-11-03 04:05:13 UTC |
Source: | https://github.com/fbertran/modstatr |
Intervalles de confiance bootstrap pour une matrice de corrélation de Bravais-Pearson
boot.mcor.ic(mat, boot.mcor.res, conflevel = 0.95)
boot.mcor.ic(mat, boot.mcor.res, conflevel = 0.95)
mat |
Matrice des données |
boot.mcor.res |
Résultat du bootstrap de la matrice de corrélation de Bravais-Pearson |
conflevel |
Niveau de confiance pour les intervalles |
Liste de quatre éléments : matrice des limites inférieures des intervalles de confiance bootstrap percentile, matrice des limites supérieures des intervalles de confiance bootstrap percentile, matrice des limites inférieures des intervalles de confiance bootstrap BCa, matrice des limites supérieures des intervalles de confiance bootstrap BCa
data(Mesures5,package="BioStatR") Mes5_red_lr = subset(Mesures5[,-5],subset=Mesures5$espece=="laurier rose") library(boot) boot.mcor <- boot(Mes5_red_lr[,c("masse","taille","masse_sec")], rho.mult, R=1000) boot.mcor boot.mcor.ic.res <- boot.mcor.ic(Mes5_red_lr[,c("masse", "taille","masse_sec")],boot.mcor) boot.mcor.ic.res
data(Mesures5,package="BioStatR") Mes5_red_lr = subset(Mesures5[,-5],subset=Mesures5$espece=="laurier rose") library(boot) boot.mcor <- boot(Mes5_red_lr[,c("masse","taille","masse_sec")], rho.mult, R=1000) boot.mcor boot.mcor.ic.res <- boot.mcor.ic(Mes5_red_lr[,c("masse", "taille","masse_sec")],boot.mcor) boot.mcor.ic.res
Jeu de données cancer du sein.
CancerSein
CancerSein
Un objet data.frame
avec trois variables et 62 observations :
Factor w/ 3 levels, Type de traitement administré
Numerical vector, Âge de la patiente au début du traitement
Numerical vector, Durée de survie de la patiente
Modèle linéaire : Comparaison de groupes et régression de B. Prum aux Éditions de l’INSERM, 1996.
Jeu de données navette spatiale.
chal
chal
Un objet data.frame
avec deux variables et 24 observations :
Integer vector, Température au moment du décollage
Integer vector, Défaillance de l'un des o-ring
Densité de rho chapeau, estimateur du coefficient de corrélation de Bravais-Pearson
corrdist(rho, rho_0, n)
corrdist(rho, rho_0, n)
rho |
Valeur en laquelle la densité est évaluée |
rho_0 |
Valeur de référence pour le coefficient de corrélation de Bravais-Pearson |
n |
Effectif de l'échantillon |
Valeur numérique, densité au point rho
de l'estimateur, construit à partir d'un échantillon de taille n
, du coefficient de corrélation de Bravais-Pearson, de valeur théorique égale à rho0
, sous hypothèse de normalité multivariée
corrdist(.7,.8,30)
corrdist(.7,.8,30)
Approximation de la densité de rho chapeau, estimateur du coefficient de corrélation de Bravais-Pearson
corrdistapprox(rho, rho_0, n)
corrdistapprox(rho, rho_0, n)
rho |
Valeur en laquelle la densité est évaluée |
rho_0 |
Valeur de référence pour le coefficient de corrélation de Bravais-Pearson |
n |
Effectif de l'échantillon |
Valeur numérique, approximation de la densité au point rho
de l'estimateur, construit à partir d'un échantillon de taille n
, du coefficient de corrélation de Bravais-Pearson, de valeur théorique égale à rho0
, sous hypothèse de normalité multivariée
corrdistapprox(.7,.8,30)
corrdistapprox(.7,.8,30)
Meilleure approximation de la densité de rho chapeau, estimateur du coefficient de corrélation de Bravais-Pearson
corrdistapprox2(rho, rho_0, n)
corrdistapprox2(rho, rho_0, n)
rho |
Valeur en laquelle la densité est évaluée |
rho_0 |
Valeur de référence pour le coefficient de corrélation de Bravais-Pearson |
n |
Effectif de l'échantillon |
Valeur numérique, approximation de la densité au point rho
de l'estimateur, construit à partir d'un échantillon de taille n
, du coefficient de corrélation de Bravais-Pearson, de valeur théorique égale à rho0
, sous hypothèse de normalité multivariée
corrdistapprox2(.7,.8,30)
corrdistapprox2(.7,.8,30)
Jeu de données hotels (nom des hotels dans la variable NOM).
d_hotels
d_hotels
Un objet data.frame
avec neuf variables et 39 observations :
Factor w/ 39 levels, Nom de l'hôtel
Factor w/ 5 levels, Pays où est situé l'hôtel
Integer vector, Catégorie de l'hôtel
Integer vector, Note de confort
Integer vector, Nombre de chambres
Integer vector, Note de la cuisine
Integer vector, Note des instructures sprotives
Integer vector, Note de la plage
Integer vector, Prix moyen pour une nuit
Jeu de données hotels (nom des hotels en rownames).
d_hotels_n
d_hotels_n
Un objet data.frame
avec huit variables et 39 observations :
Factor w/ 5 levels, Pays où est situé l'hôtel
Integer vector, Catégorie de l'hôtel
Integer vector, Note de confort
Integer vector, Nombre de chambres
Integer vector, Note de la cuisine
Integer vector, Note des instructures sprotives
Integer vector, Note de la plage
Integer vector, Prix moyen pour une nuit
Jeu de données sur des aliments vendus au McDonald.
d_macdo
d_macdo
Un objet data.frame
avec 24 variables et 260 observations :
Factor w/ 9 levels, Type d'aliment
Factor w/ 260 levels, Nom de l'aliment
Factor w/ 107 levels, Taille
Integer vector, Calories
Integer vector, Calories dues à la graisse
Numerical vector, Graisse totale
Integer vector, % de la quantité de graisse totale attendue par jour
Numerical vector, Graisse saturée
Integer vector, % de la quantité de graisse saturée attendue par jour
Numerical vector, Trans.Fat
Integer vector, Cholesterol
Integer vector, % de la quantité de cholesterol attendue par jour
Integer vector, Sel
Integer vector, % de la quantité de sel attendue par jour
Integer vector, Carbohydrates
Integer vector, % de la quantité de carbohydrates attendue par jour
Integer vector, Fibres
Integer vector, % de la quantité de fibres attendue par jour
Integer vector, Sucres
Integer vector, Protéines
Integer vector, % de la quantité de vitamine A attendue par jour
Integer vector, % de la quantité de vitamine C attendue par jour
Integer vector, % de la quantité de calcium attendue par jour
Integer vector, % de la quantité de fer attendue par jour
Ce jeu de données a été extrait de kaggle où il est possible de trouver une description complémentaire des variables.
Kaggle.
Jeu de données sur le premier tour des élections présidentielles de 2002. Les noms des lignes indiquent les régions.
d_pres2002
d_pres2002
Un objet data.frame
avec 12 variables et 8 observations :
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Jeu de données sur le premier tour des élections présidentielles de 2002. Les noms des lignes indiquent les régions.
d_pres2007
d_pres2007
Un objet data.frame
avec 12 variables et 23 observations :
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Integer vector, Nombre de votes par région
Répartition des tâches ménagèrs dans différents foyers. Les noms des lignes correspondent aux tâches ménagères.
d_TM
d_TM
Un objet data.frame
avec 13 lignes et 4 variables :
Wife
Integer vector, Nombre de fois que la tâche est réalisée exclusivement par une femme
Alternating
Integer vector, Nombre de fois que la tâche est réalisée alternativement par une femme et un homme
Husband
Integer vector, Nombre de fois que la tâche est réalisée exclusivement par un homme
Jointly
Integer vector, Nombre de fois que la tâche est réalisée en même temps par une femme et un homme
Ce jeu de données croise le type de séjours de vacances avec l'occupation des individus. L'occupation des individus correspond au nom des lignes du jeu de données.
d_vac
d_vac
Un objet data.frame
avec 8 lignes et 8 variables :
Hotel
Integer vector, Séjour à l'hotel
Location
Integer vector, Séjour en location
Res.Second
Integer vector, Séjour dans une résidence secondaire
Parents
Integer vector, Séjour chez les parents
Amis
Integer vector, Séjour chez des amis
Camping
Integer vector, Séjour au camping
Sej.org
Integer vector, Séjour organisé
Autres
Integer vector, Autres
Ce jeu données est constitué des caractéristiques de zones du jeu World of Warcraft.
d_wow
d_wow
Un objet data.frame
avec 160 lignes et 12 variables :
Continent
Factor w/ 7 levels, Nom du continent
Area
Factor w/ 12 levels, Nom de la région
Zone
Factor w/ 80 levels, Nom de la zone
Subzone
Factor w/ 38 levels, Nom de la sous-zone
Type
Factor w/ 8 levels, Type de zone
Size
Integer vector, Taille
Controlled
Factor w/ 5 levels, Faction contrôlant la zone
Min_req_level
Integer vector, Niveau minimum requis pour pouvoir accéder à la zone
Min_rec_level
Integer vector, Niveau minimum recommandé pour s'aventurer dans la zone
Max_rec_level
Integer vector, Niveau maximum recommandé pour s'aventurer dans la zone
Min_bot_level
Integer vector, Niveau minimum pour pouvoir utiliser un bot dans la zone
Max_bot_level
Integer vector, Niveau maximum pour pouvoir utiliser un bot dans la zone
Ce jeu de données a été extrait de kaggle où il est possible de trouver une description complémentaire des variables.
Kaggle.
Ce fichier de données fournit une vue granulaire de 208 446 matchs de football joués en France depuis la saison 2011/2012 à la saison 2016/2017.
data_event
data_event
Un objet data.frame
avec 208446 lignes et 40 variables :
X
Integer vector, identifiant unique de ligne
id_odsp
Factor w/ 2076 levels, identifiant unique de match
id_event
Factor w/ 208446, unique identifier of event (id_odsp + sort_order)
sort_order
Integer vector, chronological sequence of events in a game
time
Integer vector, minute of the game
text
Factor w/ 79629 levels, text commentary
event_type
Integer vector, primary event. 11 unique events (1-Attempt(shot), 2-Corner, 3-Foul, 4-Yellow Card, 5-Second yellow card, 6-(Straight) red card, 7-Substitution, 8-Free kick won, 9-Offside, 10-Hand Ball, 11-Penalty conceded)
event_type2
Integer vector, secondary event. 4 unique events (12 - Key Pass, 13 - Failed through ball, 14-Sending off, 15-Own goal)
side
Integer vector, 1-Home, 2-Away
event_team
Factor w/ 30 levels, Équipe de football qui est à l’origine de l’événement. In case of Own goals, event team is the team that beneficiated from the own goal
opponent
Factor w/ 30 levels, team that the event happened against
player
Factor w/ 1609, name of the player involved in main event (converted to lowercase and special chars were removed)
player2
Factor w/ 1498, name of player involved in secondary event
player_in
Factor w/ 1277, player that came in (only applies to substitutions)
player_out
Factor w/ 1204, player substituted (only applies to substitutions)
shot_place
Integer vector, placement of the shot (13 possible placement locations, available in the dictionary, only applies to shots)
shot_outcome
Integer vector, 4 possible outcomes (1-On target, 2-Off target, 3-Blocked, 4-Hit the post)
is_goal
Integer vector, binary variable if the shot resulted in a goal (own goals included)
location
Integer vector, location on the pitch where the event happened (19 possible locations, available in the dictionary)
bodypart
Integer vector, (1- right foot, 2-left foot, 3-head)
assist_method
Integer vector, in case of an assisted shot, 5 possible assist methods (details in the dictionary)
situation
Integer vector, 4 types: 1-Open Play, 2-Set piece (excluding Direct Free kicks), 3-Corner, 4-Free kick
fast_break
Integer vector, binary
link_odsp
Factor w/ 2076 levels lien vers la page oddsportal
adv_stats
Logical vector, boolean if the game has detailed event data
date
Factor w/ 592 levels, Date of game
league
Factor w/ 1 level, Club League
season
Integer vector, Year Played
country
Factor w/ 1 level, Host Nation of League
ht
Factor w/ 30 levels, home team
at
Factor w/ 30 levels, away team
fthg
Integer vector, full time home goals
ftag
Integer vector, full time away goals
odd_h
Numerical vector, highest home win market odds
odd_d
Numerical vector, highest draw market odds
odd_a
Numerical vector, highest away market odds
odd_over
Numerical vector, highest over 2.5 market odds
odd_under
Numerical vector, highest under 2.5 market odds
odd_bts
Numerical vector, highest both teams to score market odds
odd_bts_n
Numerical vector, highest both teams NOT to score market odds
Ces données sont une version « nettoyée » d’un fichier original, events_France.csv, qu’il est possible de télécharger depuis la plate-forme Kaggle : https://www.kaggle.com/secareanualin/football-events. Certains matchs contiennent cependant des données manquantes (environ 10
Kaggle.
Jeu de données école avec les résultats des tests de mathématiques et de sport. Ces données ont été simulées.
ecole2
ecole2
Un objet data.frame
avec 119 lignes et 2 variables :
Maths
Numerical vector, Note en mathématiques
Sport
Numerical vector, Note en sport
Jeu de données école avec non seulement les résultats des tests de mathématiques et de sport mais aussi l'âge des élèves. Ces données ont été simulées.
ecole3
ecole3
Un objet data.frame
avec 119 lignes et 3 variables :
Maths
Numerical vector, Note en mathématiques
Sport
Numerical vector, Note en sport
Age
Numerical vector, Âge de l'élève
Fonction hypergéométrique de Gauss (hypergeo)
Gauss2F1(a, b, c, x)
Gauss2F1(a, b, c, x)
a |
Paramètre pour Gauss2F1 |
b |
Paramètre pour Gauss2F1 |
c |
Paramètre pour Gauss2F1 |
x |
Argument principal, nombre réel ou complexe |
Valeur numérique, l'évaluation de la fonction hypergéométrique de Gauss pour les paramètres a
, b
, c
et x
Gauss2F1(1/2,1/2,(40-2)/2,1-.75^2)
Gauss2F1(1/2,1/2,(40-2)/2,1-.75^2)
Fonction hypergéométrique de Gauss (gsl)
Gauss2F1gsl(a, b, c, x)
Gauss2F1gsl(a, b, c, x)
a |
Paramètre pour Gauss2F1 |
b |
Paramètre pour Gauss2F1 |
c |
Paramètre pour Gauss2F1 |
x |
Argument principal, nombre réel ou complexe |
Valeur numérique, l'évaluation de la fonction hypergéométrique de Gauss pour les paramètres a
, b
, c
et x
Gauss2F1gsl(1/2,1/2,(40-2)/2,1-.75^2)
Gauss2F1gsl(1/2,1/2,(40-2)/2,1-.75^2)
Motivation: Package compagnon du livre Modélisation statistique par la pratique avec R. Il contient les codes des chapitres du livre ainsi que les solutions des exercices mais aussi d'autres compléments à découvrir.
Modélisation statistique par la pratique avec R, Frédéric Bertrand, Emmanuelle Claeys, Myriam Maumy-Bertrand, 2019, ISBN:9782100793525, Dunod, Paris, https://www.dunod.com/sciences-techniques/modelisation-statistique-par-pratique-avec-r-cours-et-exercices-corriges, https://github.com/fbertran/ModStatR/ et https://fbertran.github.io/ModStatR/
set.seed(314)
set.seed(314)
Ellipse ou intervalles de confiance pour une paire de paramètres d'un modèle linéaire
my.confidence.region(g, a = 2, b = 3, which = 0, col = "pink")
my.confidence.region(g, a = 2, b = 3, which = 0, col = "pink")
g |
Modele linéaire |
a |
Premier paramètre de l'ellipse |
b |
Second paramtère de l'ellipse |
which |
Type de région de confiance : 1 (ellipse autour des deux paramètres), 2 (rectangle autour du premier paramètre, axe des x) et 3 (rectangle autour du second paramètre, axes des y) |
col |
Couleur de remplissage de la région de confiance |
data(Mesures,package="BioStatR") Mes.B = subset(Mesures,Mesures$espece=="bignone") model2<-lm(masse~taille+I(taille^2),data=Mes.B) my.confidence.region(model2, which=1) my.confidence.region(model2, which=2) my.confidence.region(model2, which=3)
data(Mesures,package="BioStatR") Mes.B = subset(Mesures,Mesures$espece=="bignone") model2<-lm(masse~taille+I(taille^2),data=Mes.B) my.confidence.region(model2, which=1) my.confidence.region(model2, which=2) my.confidence.region(model2, which=3)
Jeu de données sur léthalité de la cypermethrine sur des parasites.
parasites
parasites
Un objet data.frame
avec 12 lignes et 4 variables :
Total
Integer vector, Nombre total de parasites
N.morts
Integer vector, Nombre de parasites morts
Niveau.de.dose
Integer vector, Niveau de dose utilisé
Sexe
Factor w/ 2 levels, Sexe de l'hôte
Test par permutation d'une matrice de corrélations de Bravais-Pearson
perm.cor.mtest( mat, alternative = "two.sided", method = "pearson", num.sim = 20000, ... )
perm.cor.mtest( mat, alternative = "two.sided", method = "pearson", num.sim = 20000, ... )
mat |
Matrice des données |
alternative |
Type d'hypothèses bilatéral, unilatéral inférieur ou supérieur |
method |
Méthode de calcul de corrélation Pearson ou Spearman |
num.sim |
Nombre de simulations |
... |
Paramètre suplémentaires transmis à la fonction cor |
Liste de deux éléments : matrice p.mat (matrice des p-valeurs des tests) et matrice cor.mat (matrice des valeurs observées des coefficients de corrélation de Bravais-Pearson)
data(Mesures5,package="BioStatR") Mes5_red_gv = subset(Mesures5[,-5],subset=Mesures5$espece=="glycine violette") perm.cor.mtest(Mes5_red_gv,num.sim=100)
data(Mesures5,package="BioStatR") Mes5_red_gv = subset(Mesures5[,-5],subset=Mesures5$espece=="glycine violette") perm.cor.mtest(Mes5_red_gv,num.sim=100)
Jeu de données contenant les caractéristiques de pokemons. Les pokemons concernés apparaissent dans les jeux et non dans les cartes pokemon ou Pokemon Go..
poke
poke
Un objet data.frame
avec 800 lignes et 13 variables :
X.
Integer vector, PokeDex index number
Name
Factor w/ 800 levels, Name of the Pokemon
Type.1
Factor w/ 18 levels, Type of pokemon
Type.2
Factor w/ 18 levels, Other Type of Pokemon
Total
Integer vector, Sum of Attack, Sp. Atk, Defense, Sp. Def, Speed and HP
HP
Integer vector, Hit Points
Attack
Integer vector, Attack Strength
Defense
Integer vector, Defensive Strength
Sp..Atk
Integer vector, Special Attack Strength
Sp..Def
Integer vector, Special Defensive Strength
Speed
Speed
Generation
Integer vector, Number of generation
Legendary
Factor w/ 2 levels, True if Legendary Pokemon False if not (more revision on mythical vs legendary needed)
Ce jeu de données a été extrait de kaggle où il est possible de trouver une description complémentaire des variables.
Kaggle.
Nombre de polypes chez des sujets lors d'un essai clinique.
polypes
polypes
Un objet data.frame
avec 20 lignes et 3 variables :
nombre
Integer vector, Nombre de polypes après 12 mois
traitement
Factor w/ 2 levels, Bras de l'essai, un facteur avec deux niveaux placebo et medicament
age
Integer vector, Âge du patient
M. Giardiello, S. R. Hamilton, A. J. Krush, S. Piantadosi, L. M. Hylind, P. Celano, S. V. Booker, C. R. Robinson and G. J. A. Offerhaus (1993), Treatment of colonic and rectal adenomas with sulindac in familial adenomatous polyposis. New England Journal of Medicine, 328(18), 1313–1316. S. Piantadosi (1997), Clinical Trials: A Methodologic Perspective. John Wiley and Sons, New York.
Test exact matriciel du corrélation de Bravais-Pearson avec une référence non nécessairement nulle
ref.cor.mtest(mat, matrho_0)
ref.cor.mtest(mat, matrho_0)
mat |
Matrice des données |
matrho_0 |
Matrice des valeurs de référence pour chacun des coefficients de corrélation de Bravais-Pearson |
Liste comportant trois matrices : la matrice des p-valeurs, la matrice des coefficients de corrélations observés et la matrice des effectifs ayant servis au calcul de ces coefficients de corrélation
data(Mesures5,package="BioStatR") Mes5_red_lr = subset(Mesures5[,-5],subset=Mesures5$espece=="laurier rose") ref.cor.mtest(Mes5_red_lr[,c("masse","taille","masse_sec")],0.7)
data(Mesures5,package="BioStatR") Mes5_red_lr = subset(Mesures5[,-5],subset=Mesures5$espece=="laurier rose") ref.cor.mtest(Mes5_red_lr[,c("masse","taille","masse_sec")],0.7)
Test exact du coefficient de corrélation de Bravais-Pearson avec une référence non nécessairement nulle
ref.cor.test(corobs, rho_0, n)
ref.cor.test(corobs, rho_0, n)
corobs |
Valeur observée du coefficient de corrélation de Bravais-Pearson |
rho_0 |
Valeur de référence pour le coefficient de corrélation de Bravais-Pearson |
n |
Effectif de l'échantillon |
Valeur numérique, p$valeur calculée de manière exacte du test avec la référence rho0
du coefficient de corrélation de Bravais-Pearson sous hypothèse de normalité multivariée
ref.cor.test(corobs=.7,rho_0=.8,n=30)
ref.cor.test(corobs=.7,rho_0=.8,n=30)
Jeu de données contenant les résultats d'une expérience évaluant la résistance d'un ciment.
resistance
resistance
Un objet data.frame
avec 36 lignes et 3 variables :
Melangeur
Factor w/ 3, COLUMN_DESCRIPTION
Casseur
Factor w/ 3, COLUMN_DESCRIPTION
Resistance
Integer vector, résistance en livres par pouces carrés
Davies et Goldsmith ont récolté les données d’une expérience dont le but était d’étudier les différentes sources de variabilité possibles de la résistance d’un ciment fabriqué à Portland. L’expérience s’est déroulée ainsi : plusieurs petits prélèvements d’un même type de ciment ont été mélangés à de l’eau et travaillés par trois personnes différentes, les « mélangeurs ». On a alors formé douze cubes à l’aide de chacune des préparations des « mélangeurs ». Puis on a donné ces 36 cubes à trois personnes chargées d’évaluer leur résistance, les « casseurs ». La répartition des 36 cubes entre ces « casseurs » a été faite de telle sorte que chaque « casseur » reçoive quatre cubes provenant de chacune des préparations des « mélangeurs » soit douze cubes au total. Tous les tests de résistance ont été faits sur la même machine. L’objectif principal de cette expérience était d’étudier et de quantifier l’importance de la variabilité dans les tests de résistance qui pouvait provenir des différences individuelles entre les « mélangeurs » et les « casseurs ». Les données ci-dessous, exprimées dans les unités d’origine c’est-à-dire .
Davies, O.L. et Goldsmith, P.L. (Eds.), Statistical Methods in Research and Production, 4th edition, Oliver and Boyd, Edinburgh, 1972.
Corrélation de Bravais-Pearson pour bootstrap ou permutation
rho(x, y, indices)
rho(x, y, indices)
x |
un vecteur numérique |
y |
un vecteur numérique |
indices |
un vecteur d'indices de même longueur que x et y |
Valeur numérique, le coefficient de corrélation de Bravais-Pearson calculé pour la permutation des vecteurs x
et y
spécifiée par le vecteur indices
set.seed(1133) rho(rnorm(30),rnorm(30),sample(30))
set.seed(1133) rho(rnorm(30),rnorm(30),sample(30))
Matrice de corrélation de Bravais-Pearson, bootstrap ou permutation
rho.mult(mat, indices)
rho.mult(mat, indices)
mat |
Matrice des données |
indices |
Vecteur d'indices dont la longueur est égale au nombre de lignes de la matrice |
Matrice des corrélations de Bravais-Pearson des données permutées
data(Mesures5,package="BioStatR") Mes5_red_gv = subset(Mesures5[,-5],subset=Mesures5$espece=="glycine violette") set.seed(1133) rho.mult(Mes5_red_gv[,c("masse","taille","masse_sec")],sample(nrow(Mes5_red_gv)))
data(Mesures5,package="BioStatR") Mes5_red_gv = subset(Mesures5[,-5],subset=Mesures5$espece=="glycine violette") set.seed(1133) rho.mult(Mes5_red_gv[,c("masse","taille","masse_sec")],sample(nrow(Mes5_red_gv)))
Taux de leucocytes
SidaChat
SidaChat
Un objet data.frame
avec 33 lignes et 3 variables :
Sexe
Factor w/ 2 levels, Sexe de l'animal
Jours
Integer vector, Nombre de jours après l'inoculation
LnT4
Numerical vector, Logarithme népérien du taux de leucocytes T4
Le taux de leucocytes T4 chez le chat a été mesuré plusieurs jours (valeur de la variable Jours) après avoir inoculé à l’animal le virus FeLV, analogue au HIV. Nous appellons LnT4 le logarithme népérien de ce taux de leucocytes T4.
Modèle linéaire : Comparaison de groupes et régression de B. Prum aux Éditions de l’INSERM, 1996.
Influence de différents régimes alimentaires sur des rats de laboratoire.
vitamines
vitamines
Un objet data.frame
avec 32 lignes et 3 variables :
Calorie
Integer vector, COLUMN_DESCRIPTION
Vitamine
Integer vector, COLUMN_DESCRIPTION
Poids
Integer vector, COLUMN_DESCRIPTION
Le gain de poids des rats est désigné par la variable Poids, exprimée en grammes, les deux facteurs sont les variables Calorie et Vitamine. La variable Calorie vaut 1 si les rats n’ont pas suivi un régime hypercalorique et 2 s’ils ont suivi un tel régime hypercalorique. La variable Vitamine vaut 1 si les rats n’ont pas reçu de compléments vitaminés et 2 s’ils ont reçu de tels compléments.
D’après B. Falissard. Comprendre et utiliser les statistiques dans les sciences de la vie. Masson, 2005.