Covid-19 / France : corrélation tests et positifs… par mois, classe d’âge, région et département !

Godlak
5 min readDec 8, 2020

--

Sans transition…

Pour mémoire: (fin confinement 1 : 11/05/20), puis:

20/07/20 : obligations masques dans lieux clos recevant du public
01/09/20 : obligations masques en entreprise (sauf bureaux individuels)
30/10/20 : 2e confinement “light”
28/11 : les petits commerces peuvent rouvrir + déplacement, avec une attestation, dans un rayon de 20 km autour de son domicile, pendant trois heures

Données bruts: données par département et par date

Chaque petit cercle représente donc le nombre de positifs — nombre de tests par jour et par département; ca fait un paquet

La droite rouge correspond à un ajustement linéaire, c.a.d. un ajustement “moyen” qui “résume” de façon “synthétique” la tendance du nuage de points

Un paquet de points est condensé en bas à gauche puis les points s’éparpillent et s’estompent…

La forme allongée présage un ajustement linéaire “correct”; la droite d’ajustement n’est pas une bissectrice à 45°, la pente est plus faible; par ex. pour 2000 tests on a “en moyenne” 300 positifs

On pourrait être tenté de dire que plus on “teste” moins on trouve de “positifs”…

Qu’en est il dans le temps ?

Même exercice que précédemment mais cette fois ci en découpant la période par mois, de mai (incomplet) à décembre (incomplet). On constate que les nuages sont “petits” et quasi plats jusqu’en juillet… A partir du mois d’août, les nuages “s’épaississent” et se “redressent”… Plus on teste, plus on trouve de positifs… “apogée” aux mois d’octobre et de novembre… les mois d’automne avec leurs lors de virus divers et variés (?) Pour l’instant décembre semble montrer une pente plutôt faible… Les masques de juillet puis de septembre… bonne question… Le confinement 2… bref…

Données agrégées par jour: on somme les tests et les positifs par jour (on “neutralise” les départements), histoire de “voir plus clair”

On obtient des nuages moins “touffus” et des coordonnées plus élevées (jusqu’à 300.000 tests par jour par ex.)

Les tendances restent similaires que dans les 2 premiers graphiques

Le graphique de gauche indique une forme de “seuil” à partir d’environ 200.000 tests par jour => le nombre de positifs devient “sur proportionnel”; en effet jusqu’à ce “seuil”, les points sont sur et sous la droite d’ajustement — en gros pour 100.000 tests on trouve entre 10.000 positifs (“taux positivité” moyen 10%) et quasiment 0… Vers 200.000 tests on trouve entre 10.000 et 20.000 positifs, soit entre 5% et 10% de “taux de positivité” moyen… puis vers 300.000 tests on trouve environ 70.000 positifs soit plus de 20% !

On retrouve les mêmes tendances par mois que précédemment: les mois d’automne restent des mois d’automne… avec beaucoup de tests, beaucoup de positifs… Les masques… Le confinement 2… bref…

Même exercice, avec données bruts puis agrégées par classe d’âge et par date, pour voir la relation positifs — tests par classe d’âge justement. Sur données bruts on voit, sans surprise, que ce sont surtout les 20–29 et 30–39 qui sont “sur-représentés” dans les tests et donc dans les positifs… Les 40–49 et 50–59 suivent mais chacune de ces classes correspond à “la moitié” du nuage des plus jeunes… Sur données agrégées, on voit “plus clair” et on constate à nouveau cette “non linéarité ascendante” aux environs de 40.000 tests environ où on trouve “plus de positifs” pour un nombre de tests donné… surtout chez les classes 29 et 39 mais également 49 et 59…

Que nous disent les moyennes ?

A gauche, les moyennes par classe d’âge. Sans surprise, la classe 29 “tire” à droite: la plus testée et donc la plus positive… vient derrière la 39 puis le 49 puis la 59 et la 19. Les autres classes sont moins testées et donc moins positives… La relation est quasi parfaitement linéaire à quasi 45°… A droite, par mois, même combat que précédemment: le mois d’octobre très propice aux tests et aux positifs avec les mêmes “rankings” des classes d’âge que sur le graphique de gauche.

Qu’en est il des (grandes…) régions?

Sans surprise, IDF remporte la pole position, énormément de tests et donc de positifs. ARA derrière mais avec plus de positifs par tests (au dessus de la droite d’ajustement). Les autres régions loin derrière, “en paquet” assez serré, avec plusieurs régions en dessous de la droite, donc moins de positifs par tests. Par mois, même combat que d’habitude: le mois d’octobre très testé et très positif… “ranking” des régions similaire au graphique de gauche.

Et par département?

C’est le 59 qui gagne en moyenne, avec Paris et Marseille derrière (mais en dessous de la droite donc moins de positifs par tests), et Lyon en “champion” au dessus de la droite (plus de positifs par tests). Les autres départements loin derrière, avec un paquet “dense” en bas à gauche. Par mois, à nouveau même combat, le mois d’octobre excellent pour les tests et les positifs, avec le ranking des départements similaire au graphique de gauche…

Il serait intéressant de savoir quelle métropoles ont introduit les masques à l’extérieur et à quelles dates…

Je vais tenter désormais de faire quelque chose de similaire en introduisant les données hospitalières en rapport avec la fameuse “incidence” (nombre de positifs / population)…

A suivre !

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

Godlak
Godlak

Written by Godlak

0 Followers

amator

No responses yet

Write a response