Calcul de la valeur moyenne. Comment calculer la valeur moyenne dans Excel

Moyenne arithmétique dans excel. Les feuilles de calcul Excel sont les mieux adaptées à toutes sortes de calculs. Après avoir étudié Excel, vous pourrez résoudre des problèmes en chimie, physique, mathématiques, géométrie, biologie, statistiques, économie et bien d'autres. On ne pense même pas à quoi outil puissant se trouve sur nos ordinateurs, ce qui signifie que nous ne l'utilisons pas à son plein potentiel. De nombreux parents pensent qu'un ordinateur n'est qu'un jouet coûteux. Mais en vain! Bien sûr, pour que l'enfant puisse vraiment l'étudier, vous devez vous-même apprendre à travailler dessus, puis à l'enseigner. Eh bien, c'est un autre sujet, mais aujourd'hui, je veux vous parler de la façon de trouver la moyenne arithmétique dans Excel.

Comment trouver la moyenne arithmétique dans Excel

Nous avons déjà parlé de rapide dans Excel, et aujourd'hui nous parlerons de la moyenne arithmétique.

Sélectionnez une cellule C12 et avec l'aide Assistants de fonction écrivez-y la formule de calcul de la moyenne arithmétique. Pour cela, dans la barre d'outils Standard, cliquez sur le bouton - Insertion d'une fonction −effet (dans l'image ci-dessus, la flèche rouge est en haut). Une boîte de dialogue s'ouvrira Maître de fonction .

  • Sélectionnez dans le champ CatégoriesStatistique ;
  • Dans le champ Sélectionner la fonction: MOYEN ;
  • Cliquez sur le bouton d'accord .

La fenêtre suivante s'ouvrira Arguments et fonctions .

Dans le champ Numéro 1 vous verrez l'entrée S2:S11- le programme lui-même a déterminé la gamme de cellules pour laquelle il est nécessaire trouver la moyenne arithmétique.

Cliquez sur le bouton d'accord et dans la cellule C12 la moyenne arithmétique des scores apparaîtra.

Il s'avère que le calcul de la moyenne arithmétique dans Excel n'est pas du tout difficile. Et j'ai toujours eu peur des formules. Eh, pas à ce moment-là, nous avons étudié.

Dans la plupart des cas, les données sont concentrées autour d'un point central. Ainsi, pour décrire n'importe quel ensemble de données, il suffit d'indiquer la valeur moyenne. Considérons successivement trois caractéristiques numériques qui permettent d'estimer la valeur moyenne de la distribution : la moyenne arithmétique, la médiane et le mode.

Moyen

La moyenne arithmétique (souvent appelée simplement la moyenne) est l'estimation la plus courante de la moyenne d'une distribution. C'est le résultat de la division de la somme de toutes les valeurs numériques observées par leur nombre. Pour un échantillon de nombres X 1, X 2, ..., Xn, la moyenne de l'échantillon (désignée par le symbole ) équivaut à \u003d (X 1 + X 2 + ... + Xn) / n, ou

où est la moyenne de l'échantillon, n- taille de l'échantillon, Xjei-ème élémentéchantillons.

Télécharger note au format ou, exemples au format

Envisagez de calculer la moyenne arithmétique des rendements annuels moyens sur cinq ans de 15 fonds communs de placement haut niveau risque (fig. 1).

Riz. 1. Rendement annuel moyen de 15 fonds communs de placement à très haut risque

La moyenne de l'échantillon est calculée comme suit :

Il s'agit d'un bon rendement, surtout si on le compare au rendement de 3 à 4 % que les déposants des banques ou des coopératives de crédit ont reçu au cours de la même période. Si vous triez les valeurs de rendement, il est facile de voir que huit fonds ont un rendement supérieur et sept - inférieur à la moyenne. La moyenne arithmétique agit comme un point d'équilibre, de sorte que les fonds à faible revenu compensent les fonds à revenu élevé. Tous les éléments de l'échantillon interviennent dans le calcul de la moyenne. Aucun des autres estimateurs de la moyenne de distribution n'a cette propriété.

Quand calculer la moyenne arithmétique.Étant donné que la moyenne arithmétique dépend de tous les éléments de l'échantillon, la présence de valeurs extrêmes affecte considérablement le résultat. Dans de telles situations, la moyenne arithmétique peut fausser la signification des données numériques. Par conséquent, lors de la description d'un ensemble de données contenant des valeurs extrêmes, il est nécessaire d'indiquer la médiane ou la moyenne arithmétique et la médiane. Par exemple, si le rendement du fonds RS Emerging Growth est retiré de l'échantillon, la moyenne de l'échantillon du rendement des 14 fonds diminue de près de 1 % à 5,19 %.

Médian

La médiane est la valeur médiane d'un tableau ordonné de nombres. Si le tableau ne contient pas de nombres répétés, alors la moitié de ses éléments seront inférieurs et l'autre moitié supérieurs à la médiane. Si l'échantillon contient des valeurs extrêmes, il est préférable d'utiliser la médiane plutôt que la moyenne arithmétique pour estimer la moyenne. Pour calculer la médiane d'un échantillon, il faut d'abord le trier.

Cette formule est ambiguë. Son résultat dépend si le nombre est pair ou impair. n:

  • Si l'échantillon contient un nombre impair d'items, la médiane est (n+1)/2-ème élément.
  • Si l'échantillon contient un nombre pair d'éléments, la médiane se situe entre les deux éléments médians de l'échantillon et est égale à la moyenne arithmétique calculée sur ces deux éléments.

Pour calculer la médiane d'un échantillon de 15 fonds communs de placement à très haut risque, il faut d'abord trier les données brutes (figure 2). Alors la médiane sera opposée au numéro de l'élément médian de l'échantillon ; dans notre exemple numéro 8. Excel a une fonction spéciale =MEDIAN() qui fonctionne également avec des tableaux non ordonnés.

Riz. 2. Médiane 15 fonds

Ainsi, la médiane est de 6,5. Cela signifie que la moitié des fonds à très haut risque ne dépasse pas 6,5, tandis que l'autre moitié le dépasse. Notez que la médiane de 6,5 est légèrement supérieure à la médiane de 6,08.

Si nous supprimons la rentabilité du fonds RS Emerging Growth de l'échantillon, la médiane des 14 fonds restants diminuera à 6,2 %, c'est-à-dire moins significativement que la moyenne arithmétique (Fig. 3).

Riz. 3. Médiane 14 fonds

Mode

Le terme a été introduit pour la première fois par Pearson en 1894. La mode est le nombre qui apparaît le plus souvent dans l'échantillon (le plus à la mode). La mode décrit bien, par exemple, la réaction typique des conducteurs à un feu de circulation pour arrêter la circulation. Exemple classique utilisation de la mode - le choix de la taille du lot de chaussures produit ou de la couleur du papier peint. Si une distribution a plusieurs modes, on dit alors qu'elle est multimodale ou multimodale (a deux "pics" ou plus). La multimodalité de la distribution donne une information important sur la nature de la variable étudiée. Par exemple, dans les enquêtes sociologiques, si une variable représente une préférence ou une attitude envers quelque chose, alors la multimodalité pourrait signifier qu'il existe plusieurs opinions distinctement différentes. La multimodalité sert également d'indicateur que l'échantillon n'est pas homogène et que les observations peuvent être générées par deux ou plusieurs distributions "chevauchées". Contrairement à la moyenne arithmétique, les valeurs aberrantes n'affectent pas le mode. Pour les variables aléatoires distribuées en continu, telles que les rendements annuels moyens des fonds communs de placement, le mode n'existe parfois pas du tout (ou n'a pas de sens). Étant donné que ces indicateurs peuvent prendre une variété de valeurs, les valeurs répétitives sont extrêmement rares.

quartiles

Les quartiles sont des mesures les plus couramment utilisées pour évaluer la distribution des données lors de la description des propriétés de grands échantillons numériques. Alors que la médiane divise le tableau ordonné en deux (50 % des éléments du tableau sont inférieurs à la médiane et 50 % sont supérieurs), les quartiles divisent l'ensemble de données ordonné en quatre parties. Les valeurs Q 1 , médiane et Q 3 sont respectivement les 25e, 50e et 75e centiles. Le premier quartile Q 1 est un nombre qui divise l'échantillon en deux parties : 25 % des éléments sont inférieurs à et 75 % sont supérieurs au premier quartile.

Le troisième quartile Q 3 est un nombre qui divise également l'échantillon en deux parties : 75 % des éléments sont inférieurs à et 25 % sont supérieurs au troisième quartile.

Pour calculer les quartiles dans les versions d'Excel antérieures à 2007, la fonction = QUARTILE (tableau, partie) a été utilisée. A partir d'Excel 2010, deux fonctions s'appliquent :

  • =QUARTILE.ON(tableau, partie)
  • =QUARTILE.EXC(tableau, partie)

Ces deux fonctions donnent un peu diverses significations(Fig. 4). Par exemple, lors du calcul des quartiles d'un échantillon contenant des données sur le rendement annuel moyen de 15 fonds communs de placement à très haut risque, Q 1 = 1,8 ou -0,7 pour QUARTILE.INC et QUARTILE.EXC, respectivement. Soit dit en passant, la fonction QUARTILE utilisée précédemment correspond à la fonction moderne QUARTILE.ON. Pour calculer les quartiles dans Excel à l'aide des formules ci-dessus, le tableau de données peut être laissé non ordonné.

Riz. 4. Calculer les quartiles dans Excel

Insistons à nouveau. Excel peut calculer des quartiles pour univarié série discrète, contenant les valeurs d'une variable aléatoire. Le calcul des quartiles pour une distribution basée sur la fréquence est donné dans la section ci-dessous.

Moyenne géométrique

Contrairement à la moyenne arithmétique, la moyenne géométrique mesure l'évolution d'une variable au fil du temps. La moyenne géométrique est la racine nème degré du produit n valeurs (dans Excel, la fonction = CUGEOM est utilisée) :

g= (X 1 * X 2 * ... * X n) 1/n

Un paramètre similaire - la moyenne géométrique du taux de rendement - est déterminé par la formule :

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

R je- taux de retour je-ème période de temps.

Par exemple, supposons que l'investissement initial est de 100 000 $. À la fin de la première année, il tombe à 50 000 $ et, à la fin de la deuxième année, il retrouve les 100 000 $ d'origine. Le taux de rendement de cet investissement sur une période de deux ans la période de l'année est égale à 0, puisque le montant initial et le montant final des fonds sont égaux l'un à l'autre. Cependant, la moyenne arithmétique des taux de rendement annuels est = (-0,5 + 1) / 2 = 0,25 ou 25 %, puisque le taux de rendement de la première année R 1 = (50 000 - 100 000) / 100 000 = -0,5 , et dans le second R 2 = (100 000 - 50 000) / 50 000 = 1. Dans le même temps, la moyenne géométrique du taux de rendement sur deux ans est : G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Ainsi, la moyenne géométrique reflète plus fidèlement l'évolution (plus précisément, l'absence de variation) du volume des investissements au cours de l'exercice biennal que la moyenne arithmétique.

Faits intéressants. Premièrement, la moyenne géométrique sera toujours inférieure à la moyenne arithmétique des mêmes nombres. Sauf dans le cas où tous les nombres pris sont égaux entre eux. Deuxièmement, compte tenu des propriétés triangle rectangle, vous pouvez comprendre pourquoi la moyenne s'appelle la moyenne géométrique. La hauteur d'un triangle rectangle, abaissé à l'hypoténuse, est la moyenne proportionnelle entre les projections des jambes sur l'hypoténuse, et chaque jambe est la moyenne proportionnelle entre l'hypoténuse et sa projection sur l'hypoténuse (Fig. 5). Cela donne une manière géométrique de construire la moyenne géométrique de deux (longueurs) segments : il faut construire un cercle sur la somme de ces deux segments comme diamètre, puis la hauteur, restituée du point de leur raccordement à l'intersection avec le cercle, donnera la valeur désirée :

Riz. 5. La nature géométrique de la moyenne géométrique (figure de Wikipedia)

La deuxième propriété importante des données numériques est leur variation caractérisant le degré de dispersion des données. Deux échantillons différents peuvent différer à la fois en valeurs moyennes et en variations. Cependant, comme le montre la fig. 6 et 7, deux échantillons peuvent avoir la même variation mais des moyennes différentes, ou la même moyenne et une variation complètement différente. Les données correspondant au polygone B de la Fig. 7 changent beaucoup moins que les données à partir desquelles le polygone A a été construit.

Riz. 6. Deux distributions symétriques en forme de cloche avec le même écart et des valeurs moyennes différentes

Riz. 7. Deux distributions symétriques en forme de cloche avec les mêmes valeurs moyennes et une dispersion différente

Il existe cinq estimations de la variation des données :

  • envergure,
  • gamme interquartile,
  • dispersion,
  • écart-type,
  • le coefficient de variation.

portée

La plage est la différence entre les éléments les plus grands et les plus petits de l'échantillon :

Glisser = XMax-XMin

La fourchette d'un échantillon contenant des données sur les rendements annuels moyens de 15 fonds communs de placement à très haut risque peut être calculée à l'aide d'un tableau ordonné (voir la figure 4) : fourchette = 18,5 - (-6,1) = 24,6. Cela signifie que la différence entre les rendements annuels moyens les plus élevés et les plus bas pour les fonds à très haut risque est de 24,6 %.

La plage mesure la répartition globale des données. Bien que la plage d'échantillonnage soit une estimation très simple de la dispersion totale des données, sa faiblesse est qu'elle ne tient pas compte exactement de la manière dont les données sont réparties entre les éléments minimum et maximum. Cet effet est bien visible sur la Fig. 8 qui illustre des échantillons ayant la même gamme. L'échelle B montre que si l'échantillon contient au moins une valeur extrême, la plage de l'échantillon est une estimation très imprécise de la dispersion des données.

Riz. 8. Comparaison de trois échantillons avec la même gamme ; le triangle symbolise le support de la balance, et son emplacement correspond à la valeur moyenne de l'échantillon

Gamme interquartile

La plage interquartile, ou moyenne, est la différence entre le troisième et le premier quartile de l'échantillon :

Intervalle interquartile \u003d Q 3 - Q 1

Cette valeur permet d'estimer l'étalement de 50% des éléments et de ne pas tenir compte de l'influence des éléments extrêmes. L'intervalle interquartile d'un échantillon contenant des données sur les rendements annuels moyens de 15 fonds communs de placement à risque très élevé peut être calculé à l'aide des données de la figure 2. 4 (par exemple, pour la fonction QUARTILE.EXC) : Etendue interquartile = 9,8 - (-0,7) = 10,5. L'intervalle entre 9,8 et -0,7 est souvent appelé la moitié médiane.

Il est à noter que les valeurs de Q 1 et Q 3, et donc l'écart interquartile, ne dépendent pas de la présence d'outliers, puisque leur calcul ne prend en compte aucune valeur qui serait inférieure à Q 1 ou supérieure à Q 3 . Les caractéristiques quantitatives totales, telles que la médiane, les premier et troisième quartiles et l'intervalle interquartile, qui ne sont pas affectées par les valeurs aberrantes, sont appelées indicateurs robustes.

Alors que la plage et la plage interquartile fournissent une estimation de la dispersion totale et moyenne de l'échantillon, respectivement, aucune de ces estimations ne tient compte exactement de la manière dont les données sont distribuées. Variance et écart type libre de ce défaut. Ces indicateurs permettent d'évaluer le degré de fluctuation des données autour de la moyenne. Écart d'échantillon est une approximation de la moyenne arithmétique calculée à partir des différences au carré entre chaque élément de l'échantillon et la moyenne de l'échantillon. Pour un échantillon de X 1 , X 2 , ... X n la variance de l'échantillon (notée par le symbole S 2 est donnée par la formule suivante :

En général, la variance de l'échantillon est la somme des différences au carré entre les éléments de l'échantillon et la moyenne de l'échantillon, divisée par une valeur égale à la taille de l'échantillon moins un :

- moyenne arithmétique, n- taille de l'échantillon, X je - je-ème élément échantillon X. Dans Excel avant la version 2007, la fonction =VAR() était utilisée pour calculer la variance de l'échantillon, depuis la version 2010, la fonction =VAR.V() est utilisée.

L'estimation la plus pratique et la plus largement acceptée de la dispersion des données est écart-type. Cet indicateur est désigné par le symbole S et est égal à racine carrée de la variance de l'échantillon :

Dans Excel avant la version 2007, la fonction =STDEV() était utilisée pour calculer l'écart type, à partir de la version 2010 la fonction =STDEV.B() est utilisée. Pour calculer ces fonctions, le tableau de données peut être non ordonné.

Ni la variance de l'échantillon ni l'écart-type de l'échantillon ne peuvent être négatifs. La seule situation dans laquelle les indicateurs S 2 et S peuvent être nuls est celle où tous les éléments de l'échantillon sont égaux. Dans ce cas totalement improbable, l'intervalle et l'intervalle interquartile sont également nuls.

Les données numériques sont par nature volatiles. Toute variable peut prendre un ensemble différentes valeurs. Par exemple, différents fonds communs de placement ont des taux de rendement et de perte différents. En raison de la variabilité des données numériques, il est très important d'étudier non seulement les estimations de la moyenne, qui sont de nature sommative, mais aussi les estimations de la variance, qui caractérisent la dispersion des données.

La variance et l'écart-type nous permettent d'estimer la dispersion des données autour de la moyenne, c'est-à-dire de déterminer combien d'éléments de l'échantillon sont inférieurs à la moyenne et combien sont supérieurs. La dispersion a des propriétés mathématiques intéressantes. Cependant, sa valeur est le carré d'une unité de mesure - un pourcentage carré, un dollar carré, un pouce carré, etc. Par conséquent, une estimation naturelle de la variance est l'écart type, qui est exprimé dans les unités de mesure habituelles - pourcentage du revenu, dollars ou pouces.

L'écart type vous permet d'estimer la quantité de fluctuation des éléments de l'échantillon autour de la valeur moyenne. Dans presque toutes les situations, la majorité des valeurs observées se situent à plus ou moins un écart type de la moyenne. Par conséquent, connaissant la moyenne arithmétique des éléments de l'échantillon et l'écart type de l'échantillon, il est possible de déterminer l'intervalle auquel appartient la majeure partie des données.

L'écart-type des rendements de 15 fonds communs de placement à très haut risque est de 6,6 (figure 9). Cela signifie que la rentabilité de la majeure partie des fonds ne diffère pas de la valeur moyenne de plus de 6,6 % (c'est-à-dire qu'elle fluctue dans la plage allant de –S= 6,2 – 6,6 = –0,4 à +S= 12,8). En fait, cet intervalle contient un rendement annuel moyen sur cinq ans de 53,3 % (8 sur 15) des fonds.

Riz. 9. Écart type

Notez que lors du processus d'addition des différences au carré, les éléments les plus éloignés de la moyenne gagnent plus de poids que les éléments les plus proches. Cette propriété est la principale raison pour laquelle la moyenne arithmétique est le plus souvent utilisée pour estimer la moyenne d'une distribution.

Le coefficient de variation

Contrairement aux estimations de dispersion précédentes, le coefficient de variation est une estimation relative. Il est toujours mesuré en pourcentage, et non dans les unités de données d'origine. Le coefficient de variation, désigné par les symboles CV, mesure la dispersion des données autour de la moyenne. Le coefficient de variation est égal à l'écart type divisé par la moyenne arithmétique et multiplié par 100 % :

S- écart-type de l'échantillon, - moyenne de l'échantillon.

Le coefficient de variation permet de comparer deux échantillons dont les éléments sont exprimés dans des unités de mesure différentes. Par exemple, le responsable d'un service de livraison de courrier a l'intention de moderniser la flotte de camions. Lors du chargement des colis, il y a deux types de restrictions à considérer : le poids (en livres) et le volume (en pieds cubes) de chaque colis. Supposons que dans un échantillon contenant 200 paquets, poids moyen est de 26,0 livres, l'écart type de poids est de 3,9 livres, le volume moyen du colis est de 8,8 pieds cubes et l'écart type de volume est de 2,2 pieds cubes. Comment comparer la répartition du poids et du volume des colis ?

Étant donné que les unités de mesure du poids et du volume diffèrent les unes des autres, le gestionnaire doit comparer la répartition relative de ces valeurs. Le coefficient de variation de poids est CV W = 3,9 / 26,0 * 100 % = 15 %, et le coefficient de variation de volume CV V = 2,2 / 8,8 * 100 % = 25 %. Ainsi, la dispersion relative des volumes de paquets est beaucoup plus grande que la dispersion relative de leurs poids.

Formulaire de distribution

La troisième propriété importante de l'échantillon est la forme de sa distribution. Cette distribution peut être symétrique ou asymétrique. Pour décrire la forme d'une distribution, il est nécessaire de calculer sa moyenne et sa médiane. Si ces deux mesures sont identiques, la variable est dite symétriquement distribuée. Si la valeur moyenne d'une variable est supérieure à la médiane, sa distribution a une asymétrie positive (Fig. 10). Si la médiane est supérieure à la moyenne, la distribution de la variable est asymétrique négativement. Une asymétrie positive se produit lorsque la moyenne augmente jusqu'à des valeurs anormalement élevées. Une asymétrie négative se produit lorsque la moyenne diminue jusqu'à des valeurs anormalement petites. Une variable est distribuée symétriquement si elle ne prend aucune valeur extrême dans les deux sens, de sorte que les grandes et les petites valeurs de la variable s'annulent.

Riz. 10. Trois types de distributions

Les données représentées sur l'échelle A ont une asymétrie négative. Cette figure montre une longue traîne et une inclinaison vers la gauche causées par des valeurs anormalement petites. Ces valeurs extrêmement petites déplacent la valeur moyenne vers la gauche et celle-ci devient inférieure à la médiane. Les données présentées sur l'échelle B sont réparties symétriquement. Les moitiés gauche et droite de la distribution sont leurs images miroir. Les grandes et les petites valeurs s'équilibrent, et la moyenne et la médiane sont égales. Les données affichées sur l'échelle B ont une asymétrie positive. Cette figure montre une longue traîne et un biais vers la droite, causés par la présence de valeurs anormalement élevées. Ces valeurs trop grandes déplacent la moyenne vers la droite, et celle-ci devient plus grande que la médiane.

Dans Excel, des statistiques descriptives peuvent être obtenues à l'aide du complément Forfait d'analyse. Parcourez le menu DonnéesL'analyse des données, dans la fenêtre qui s'ouvre, sélectionnez la ligne Statistiques descriptives et cliquez D'accord. Dans la fenêtre Statistiques descriptives n'oubliez pas d'indiquer intervalle d'entrée(Fig. 11). Si vous souhaitez voir les statistiques descriptives sur la même feuille que les données d'origine, sélectionnez le bouton radio intervalle de sortie et spécifiez la cellule où vous souhaitez placer le coin supérieur gauche des statistiques affichées (dans notre exemple, $C$1). Si vous souhaitez envoyer des données à nouvelle feuille ou dans nouveau livre sélectionnez simplement le bouton radio approprié. Cochez la case à côté de Statistiques finales. En option, vous pouvez également choisir Niveau de difficulté,k-ième plus petit etke plus grand.

Si en dépôt Données dans la région de Analyse vous ne voyez pas l'icône L'analyse des données, vous devez d'abord installer le module complémentaire Forfait d'analyse(voir, par exemple,).

Riz. 11. Statistiques descriptives des rendements annuels moyens sur cinq ans des fonds présentant des niveaux de risque très élevés, calculés à l'aide de l'add-on L'analyse des données Programmes Excel

Excel calcule toute la ligne statistiques discutées ci-dessus : moyenne, médiane, mode, écart-type, variance, intervalle ( intervalle), minimum, maximum et taille d'échantillon ( Chèque). De plus, Excel calcule pour nous de nouvelles statistiques : erreur standard, aplatissement et asymétrie. erreur standard est égal à l'écart type divisé par la racine carrée de la taille de l'échantillon. asymétrie caractérise l'écart à la symétrie de la distribution et est une fonction qui dépend du cube des différences entre les éléments de l'échantillon et la valeur moyenne. L'aplatissement est une mesure de la concentration relative des données autour de la moyenne par rapport aux queues de la distribution, et dépend des différences entre l'échantillon et la moyenne élevée à la quatrième puissance.

Calcul de statistiques descriptives pour la population générale

La moyenne, la dispersion et la forme de la distribution décrites ci-dessus sont des caractéristiques basées sur un échantillon. Cependant, si l'ensemble de données contient des mesures numériques de l'ensemble de la population, ses paramètres peuvent être calculés. Ces paramètres comprennent la moyenne, la variance et l'écart type de la population.

Valeur attendue est égal à la somme de toutes les valeurs de la population générale divisée par le volume de la population générale :

µ - valeur attendue, Xje- je-ième observation variable X, N- le volume de la population générale. Dans Excel, pour calculer l'espérance mathématique, on utilise la même fonction que pour la moyenne arithmétique : =AVERAGE().

Écart démographiqueégale à la somme des écarts au carré entre les éléments de la population générale et mat. espérance divisée par la taille de la population :

σ2 est la variance de la population générale. Dans Excel avant la version 2007, la fonction =VAR() est utilisée pour calculer la variance de la population, à partir de la version 2010 =VAR.G().

écart-type de la population est égal à la racine carrée de la variance de la population :

Avant Excel 2007, la fonction =SDV() était utilisée pour calculer l'écart type de la population, à partir de la version 2010 =SDV.Y(). Notez que les formules pour la variance de la population et l'écart type sont différentes des formules pour la variance de l'échantillon et l'écart type. Lors du calcul des statistiques d'échantillon S2 Et S le dénominateur de la fraction est n-1, et lors du calcul des paramètres σ2 Et σ - le volume de la population générale N.

règle d'or

Dans la plupart des situations, une grande partie des observations sont concentrées autour de la médiane, formant un cluster. Dans les ensembles de données avec une asymétrie positive, ce groupe est situé à gauche (c'est-à-dire en dessous) de l'espérance mathématique, et dans les ensembles avec une asymétrie négative, ce groupe est situé à droite (c'est-à-dire au-dessus) de l'espérance mathématique. Les données symétriques ont la même moyenne et la même médiane, et les observations se regroupent autour de la moyenne, formant une distribution en forme de cloche. Si la distribution n'a pas une asymétrie prononcée et que les données sont concentrées autour d'un certain centre de gravité, une règle empirique peut être utilisée pour estimer la variabilité, qui dit : si les données ont une distribution en forme de cloche, alors environ 68 % des observations se situent à moins d'un écart-type de l'espérance mathématique, environ 95 % des observations se situent à moins de deux écarts-types de la valeur attendue et 99,7 % des observations se situent à moins de trois écarts-types de la valeur attendue.

Ainsi, l'écart-type, qui est une estimation de la fluctuation moyenne autour de l'espérance mathématique, aide à comprendre comment les observations sont distribuées et à identifier les valeurs aberrantes. Il découle de la règle empirique que pour les distributions en forme de cloche, seule une valeur sur vingt diffère de l'espérance mathématique de plus de deux écarts-types. Par conséquent, les valeurs en dehors de l'intervalle µ ± 2σ, peuvent être considérés comme des valeurs aberrantes. De plus, seules trois observations sur 1000 diffèrent de l'espérance mathématique de plus de trois écarts-types. Ainsi, les valeurs en dehors de l'intervalle µ ± 3σ sont presque toujours des valeurs aberrantes. Pour les distributions fortement asymétriques ou non en forme de cloche, la règle empirique de Biename-Chebyshev peut être appliquée.

Il y a plus de cent ans, les mathématiciens Bienamay et Chebyshev ont découvert indépendamment propriété utileécart-type. Ils ont constaté que pour tout ensemble de données, quelle que soit la forme de la distribution, le pourcentage d'observations situées à une distance ne dépassant pas kécarts-types par rapport à l'espérance mathématique, pas moins (1 – 1/ 2)*100 %.

Par exemple, si k= 2, la règle de Biename-Chebyshev stipule qu'au moins (1 - (1/2) 2) x 100 % = 75 % des observations doivent se situer dans l'intervalle µ ± 2σ. Cette règle est vraie pour tout k dépassant un. La règle Biename-Chebyshev est très caractère général et est valable pour les distributions de toute nature. Il indique le nombre minimum d'observations, la distance à partir de laquelle l'espérance mathématique ne dépasse pas une valeur donnée. Cependant, si la distribution est en forme de cloche, la règle empirique estime plus précisément la concentration de données autour de la moyenne.

Calcul de statistiques descriptives pour une distribution basée sur la fréquence

Si les données d'origine ne sont pas disponibles, la distribution de fréquence devient la seule source d'information. Dans de telles situations, vous pouvez calculer les valeurs approximatives des indicateurs quantitatifs de la distribution, tels que la moyenne arithmétique, l'écart type, les quartiles.

Si les données de l'échantillon sont présentées sous forme de distribution de fréquence, une valeur approximative de la moyenne arithmétique peut être calculée, en supposant que toutes les valeurs de chaque classe sont concentrées au milieu de la classe :

- moyenne de l'échantillon, n- nombre d'observations, ou taille de l'échantillon, à partir de- le nombre de classes dans la distribution de fréquence, mj- point médian j-ème classe, Fj- fréquence correspondant à j-ème classe.

Pour calculer l'écart type à partir de la distribution de fréquence, on suppose également que toutes les valeurs de chaque classe sont concentrées au milieu de la classe.

Pour comprendre comment les quartiles de la série sont déterminés en fonction des fréquences, considérons le calcul du quartile inférieur basé sur les données de 2013 sur la répartition de la population russe par revenu monétaire moyen par habitant (Fig. 12).

Riz. 12. La part de la population de la Russie avec un revenu monétaire par habitant en moyenne par mois, en roubles

Pour calculer le premier quartile de la série de variation d'intervalle, vous pouvez utiliser la formule :

où Q1 est la valeur du premier quartile, xQ1 est la borne inférieure de l'intervalle contenant le premier quartile (l'intervalle est déterminé par la fréquence cumulée, la première dépassant 25 %) ; i est la valeur de l'intervalle ; Σf est la somme des fréquences de l'ensemble de l'échantillon ; probablement toujours égal à 100 % ; SQ1–1 est la fréquence cumulée de l'intervalle précédant l'intervalle contenant le quartile inférieur ; fQ1 est la fréquence de l'intervalle contenant le quartile inférieur. La formule pour le troisième quartile diffère en ce que partout, au lieu de Q1, vous devez utiliser Q3 et remplacer ¾ au lieu de ¼.

Dans notre exemple (Fig. 12), le quartile inférieur est compris entre 7 000,1 et 10 000, dont la fréquence cumulée est de 26,4 %. La limite inférieure de cet intervalle est de 7000 roubles, la valeur de l'intervalle est de 3000 roubles, la fréquence cumulée de l'intervalle précédant l'intervalle contenant le quartile inférieur est de 13,4%, la fréquence de l'intervalle contenant le quartile inférieur est de 13,0%. Ainsi: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 roubles.

Les pièges associés aux statistiques descriptives

Dans cette note, nous avons examiné comment décrire un ensemble de données à l'aide de diverses statistiques qui estiment sa moyenne, sa dispersion et sa distribution. L'étape suivante consiste à analyser et interpréter les données. Jusqu'à présent, nous avons étudié les propriétés objectives des données, et nous nous tournons maintenant vers leur interprétation subjective. Deux erreurs guettent le chercheur : un sujet d'analyse mal choisi et une mauvaise interprétation des résultats.

L'analyse de la performance de 15 fonds communs de placement à très haut risque est assez impartiale. Il a abouti à des conclusions tout à fait objectives : tous les fonds communs de placement ont des rendements différents, l'écart des rendements des fonds varie de -6,1 à 18,5 et le rendement moyen est de 6,08. L'objectivité de l'analyse des données est assurée le bon choix total des indicateurs quantitatifs de distribution. Plusieurs méthodes d'estimation de la moyenne et de la dispersion des données ont été envisagées, et leurs avantages et inconvénients ont été indiqués. Comment choisir les bonnes statistiques qui fournissent une analyse objective et impartiale ? Si la distribution des données est légèrement asymétrique, faut-il choisir la médiane plutôt que la moyenne arithmétique ? Quel indicateur caractérise le plus précisément la dispersion des données : écart-type ou fourchette ? Faut-il indiquer l'asymétrie positive de la distribution ?

D'autre part, l'interprétation des données est un processus subjectif. Personnes différentes arrivent à des conclusions différentes, interprétant les mêmes résultats. Chacun a son propre point de vue. Quelqu'un considère que les rendements annuels moyens totaux de 15 fonds avec un niveau de risque très élevé sont bons et est assez satisfait des revenus perçus. D'autres peuvent penser que ces fonds ont des rendements trop faibles. Ainsi, la subjectivité devrait être compensée par l'honnêteté, la neutralité et la clarté des conclusions.

Questions éthiques

L'analyse des données est inextricablement liée aux questions éthiques. Il faut être critique vis-à-vis des informations diffusées par les journaux, la radio, la télévision et Internet. Au fil du temps, vous apprendrez à être sceptique non seulement sur les résultats, mais aussi sur les objectifs, le sujet et l'objectivité de la recherche. Le célèbre politicien britannique Benjamin Disraeli l'a dit le mieux : « Il y a trois sortes de mensonges : les mensonges, les maudits mensonges et les statistiques.

Comme indiqué dans la note, des questions éthiques se posent lors du choix des résultats qui doivent être présentés dans le rapport. Les résultats positifs et négatifs doivent être publiés. De plus, lors de la rédaction d'un rapport ou d'un rapport écrit, les résultats doivent être présentés de manière honnête, neutre et objective. Faites la distinction entre les présentations mauvaises et malhonnêtes. Pour ce faire, il est nécessaire de déterminer quelles étaient les intentions du locuteur. Parfois, le locuteur omet des informations importantes par ignorance, et parfois délibérément (par exemple, s'il utilise la moyenne arithmétique pour estimer la moyenne de données clairement biaisées afin d'obtenir le résultat souhaité). Il est également malhonnête de supprimer des résultats qui ne correspondent pas au point de vue du chercheur.

Les matériaux du livre Levin et al Statistiques pour les gestionnaires sont utilisés. - M. : Williams, 2004. - p. 178–209

La fonction QUARTILE est laissée à combiner avec plus premières versions exceller

17.02.2017

Excel est un tableur. Il peut être utilisé pour créer une variété de rapports. Dans ce programme, il est très pratique d'effectuer divers calculs. Beaucoup n'utilisent même pas la moitié des capacités d'Excel.

Vous devrez peut-être trouver la valeur moyenne des nombres à l'école, ainsi que pendant le travail. La manière classique déterminer la moyenne arithmétique sans utiliser de programmes consiste à additionner tous les nombres, puis le montant résultant doit être divisé par le nombre de termes. Si les nombres sont suffisamment importants ou si l'opération doit être effectuée plusieurs fois à des fins de génération de rapports, les calculs peuvent prendre beaucoup de temps. C'est une perte de temps et d'efforts irrationnelle, il est bien préférable d'utiliser les capacités d'Excel.

Trouver la moyenne arithmétique

De nombreuses données sont déjà initialement enregistrées dans Excel, mais si cela ne se produit pas, il est nécessaire de transférer les données dans un tableau. Chaque nombre pour le calcul doit être dans une cellule séparée.

Méthode 1 : Calculer la valeur moyenne via "l'assistant de fonction"

Dans cette méthode, vous devez écrire une formule pour calculer la moyenne arithmétique et l'appliquer aux cellules spécifiées.


Le principal inconvénient de cette méthode est que vous devez entrer manuellement des cellules pour chaque terme. En présence de un grand nombre les chiffres ne sont pas très pratiques.

Méthode 2 : Calcul automatique du résultat dans les cellules sélectionnées

Dans cette méthode, le calcul de la moyenne arithmétique est effectué en quelques clics de souris. Très pratique pour n'importe quel nombre de numéros.


L'inconvénient de cette méthode est le calcul de la valeur moyenne uniquement pour les nombres situés à proximité. Si les termes nécessaires sont dispersés, ils ne peuvent pas être sélectionnés pour le calcul. Il n'est même pas possible de sélectionner deux colonnes, auquel cas les résultats seront présentés séparément pour chacune d'elles.

Méthode 3 : Utiliser la barre de formule

Une autre façon d'accéder à la fenêtre de fonction :


Plus manière rapide, dans lequel vous n'avez pas besoin de rechercher des éléments dans le menu pendant une longue période.

Méthode 4 : Saisie manuelle

Il n'est pas nécessaire d'utiliser les outils du menu Excel pour calculer la valeur moyenne, vous pouvez écrire manuellement la fonction nécessaire.


Vite et moyen pratique pour ceux qui préfèrent créer des formules de leurs propres mains, plutôt que de chercher des programmes prêts à l'emploi dans le menu.

Grâce à ces fonctionnalités, il est très facile de calculer la valeur moyenne de n'importe quel nombre, quel que soit son nombre, et vous pouvez également compiler des statistiques sans les calculer manuellement. Avec l'aide des outils du programme Excel, tous les calculs sont beaucoup plus faciles à faire que dans l'esprit ou à l'aide d'une calculatrice.

Pour vous préparer à réussir le problème 19 de la partie 3, vous devez connaître certaines fonctions d'Excel. L'une de ces fonctions est MOYEN. Considérons-le plus en détail.

exceller permet de trouver la moyenne arithmétique des arguments. La syntaxe de cette fonction est :

MOYENNE(nombre1, [nombre2],…)

N'oubliez pas que la saisie d'une formule dans une cellule commence par le signe "=".

Entre parenthèses, on peut lister les nombres dont on veut trouver la moyenne. Par exemple, si nous écrivons dans une cellule =MOYENNE(1, 2, -7, 10, 7, 5, 9), alors nous obtenons 3,857142857. C'est facile à vérifier - si nous additionnons tous les nombres entre parenthèses (1 + 2 + (-7) + 10 + 7 + 5 + 9 = 27) et divisons par leur nombre (7), nous obtenons 3,857142857142857.

Remarquez les chiffres entre parenthèses séparés par un point virgule (; ). Ainsi, nous pouvons spécifier jusqu'à 255 numéros.

Pour des exemples, j'utilise Microsort Excel 2010.

De plus, avec l'aide Fonctions MOYENNE nous pouvons trouver valeur moyenne d'une plage de cellules. Supposons que nous ayons des nombres stockés dans la plage A1: A7 et que nous voulions trouver leur moyenne arithmétique.

Mettons dans la cellule B1 la moyenne arithmétique de la plage A1:A7. Pour cela, placez le curseur dans la cellule B1 et écrivez =MOYENNE(A1:A7). Entre parenthèses, j'ai indiqué la plage de cellules. Notez que le délimiteur est le caractère côlon (: ). Ce serait encore plus facile à faire - écrivez dans la cellule B1 =MOYENNE(, puis sélectionnez la plage souhaitée avec la souris.

En conséquence, dans la cellule B1, nous obtiendrons le nombre 15,85714286 - c'est la moyenne arithmétique de la plage A1:A7.

En guise d'échauffement, je propose de trouver la valeur moyenne des nombres de 1 à 100 (1, 2, 3, etc. jusqu'à 100). La première personne à répondre correctement dans les commentaires recevra 50 roubles au téléphone Nous travaillons.

    Le programme Excel est multi-facettes, il existe donc plusieurs options qui vous permettront de trouver la moyenne :

    Première possibilité. Vous additionnez simplement toutes les cellules et divisez par leur nombre;

    Deuxième option. Utilisez une commande spéciale, écrivez dans la cellule requise la formule = MOYENNE (et spécifiez ici la plage de cellules) quot ;;

    Troisième choix. Si vous sélectionnez la plage requise, notez que sur la page ci-dessous, la valeur moyenne dans ces cellules est également affichée.

    Ainsi, il existe de nombreuses façons de trouver la valeur moyenne, il vous suffit de choisir celle qui vous convient le mieux et de l'utiliser constamment.

    Commençons par le début et dans l'ordre. Que signifie moyenne ?

    La valeur moyenne est la valeur qui est la moyenne arithmétique, c'est-à-dire est calculé en ajoutant un ensemble de nombres, puis en divisant la somme totale des nombres par leur nombre. Par exemple, pour les nombres 2, 3, 6, 7, 2 ce sera 4 (la somme des nombres 20 est divisée par leur nombre 5)

    Dans une feuille de calcul Excel, pour moi personnellement, le moyen le plus simple était d'utiliser la formule = MOYENNE. Pour calculer la valeur moyenne, vous devez entrer des données dans le tableau, écrire la fonction =AVERAGE() sous la colonne de données et, entre parenthèses, indiquer la plage de nombres dans les cellules, en mettant en surbrillance la colonne avec les données. Après cela, appuyez sur ENTREE ou cliquez simplement sur n'importe quelle cellule. Le résultat sera affiché dans la cellule sous la colonne. A première vue, la description est incompréhensible, mais en fait c'est une question de minutes.

    Dans Excel, en utilisant la fonction MOYENNE, vous pouvez calculer la moyenne arithmétique simple. Pour ce faire, vous devez entrer un certain nombre de valeurs. Appuyez sur égal et sélectionnez dans la catégorie Statistique, parmi lesquels sélectionnez la fonction MOYENNE

    De plus, à l'aide de formules statistiques, vous pouvez calculer la moyenne pondérée arithmétique, qui est considérée comme plus précise. Pour le calculer, nous avons besoin des valeurs de l'indicateur et de la fréquence.

    C'est très facile si les données sont déjà saisies dans les cellules. Si vous êtes juste intéressé par un nombre, il vous suffit de sélectionner la/les plage(s) souhaitée(s), et la valeur de la somme de ces nombres, leur moyenne arithmétique et leur nombre apparaîtront dans la barre d'état en bas à droite.

    Vous pouvez sélectionner une cellule vide, cliquer sur le triangle (liste déroulante) et sélectionnez-y " Moyenne ", après quoi il acceptera la fourchette proposée pour le calcul, ou choisira la vôtre.

    Enfin, vous pouvez utiliser les formules directement - cliquez sur Insérer une fonction à côté de la barre de formule et de l'adresse de la cellule. La fonction MOYENNE est dans la catégorie "Statistiques" et prend comme arguments à la fois des nombres et des références de cellule, etc. Là, vous pouvez également choisir des options plus complexes, par exemple, MOYENNESI - calcul de la moyenne par condition.

    Peasy facile. Pour trouver la valeur moyenne dans Excel, vous n'avez besoin que de 3 cellules. Dans le premier, nous écrivons un numéro, dans le second - un autre. Et dans la troisième cellule, nous marquerons une formule qui nous donnera la valeur moyenne entre ces deux nombres des première et deuxième cellules. Si la cellule 1 s'appelle A1, la cellule 2 s'appelle B1, alors dans la cellule avec la formule, vous devez écrire comme ceci :

    Cette formule calcule la moyenne arithmétique de deux nombres.

    Pour la beauté de nos calculs, nous pouvons mettre en évidence les cellules avec des lignes, sous forme de plaque.

    Il existe également une fonction dans Excel lui-même pour déterminer la valeur moyenne, mais j'utilise la méthode à l'ancienne et j'entre la formule dont j'ai besoin. Ainsi, je suis sûr qu'Excel calculera exactement ce dont j'ai besoin et ne proposera pas une sorte d'arrondi.

    Ici tu peux donner plein de conseils, mais à chaque nouveau conseil tu auras une nouvelle question, ça peut et bien, d'une part, ça va être une incitation à améliorer ton niveau sur ce site, donc je ne vais pas te donner un tas de conseils, mais je vais donner un lien vers la chaîne YouTube avec un cours sur la maîtrise de tels application souhaitée comme Excel, votre droit de l'utiliser ou non, vous aurez un lien vers un cours détaillé où vous pourrez toujours trouver la réponse à votre question sur Excel

    encerclez les valeurs qui seront impliquées dans le calcul, cliquez sur l'onglet Formules, là vous verrez à gauche qu'il y a et à côté se trouve un triangle pointant vers le bas. cliquez sur ce triangle et sélectionnez 'Moyenne'. Voila, c'est fait) en bas de la colonne vous verrez la valeur moyenne :)