I have the following dataframe:
YYYYMM | avg(monthly) | categorie |
---|---|---|
202001 | 0.6666666666666666 | cat1 |
202002 | 0.75 | cat1 |
202003 | 1.0 | cat1 |
202004 | 1.0 | cat1 |
202005 | 1.0 | cat1 |
202006 | 1.0 | cat1 |
202007 | 1.0 | cat1 |
202008 | 1.0 | cat1 |
202009 | 0.3333333333333333 | cat1 |
202010 | 0.375 | cat1 |
202011 | 0.4 | cat1 |
202012 | 0.8 | cat1 |
202101 | 0.8333333333333334 | cat1 |
202102 | 1.0 | cat1 |
202103 | 0.8571428571428571 | cat1 |
202104 | 0.5714285714285714 | cat1 |
202105 | 1.0 | cat1 |
202106 | 0.8333333333333334 | cat1 |
202107 | 0.6666666666666666 | cat1 |
202001 | 0.5294117647058824 | cat2 |
202002 | 0.6666666666666666 | cat2 |
202003 | 0.6842105263157895 | cat2 |
202004 | 0.4 | cat2 |
202005 | 0.7916666666666666 | cat2 |
202006 | 0.48 | cat2 |
202007 | 0.5789473684210527 | cat2 |
202008 | 0.4117647058823529 | cat2 |
202009 | 0.4666666666666667 | cat2 |
202010 | 0.5454545454545454 | cat2 |
202011 | 0.4583333333333333 | cat2 |
202012 | 0.7241379310344828 | cat2 |
202101 | 0.6111111111111112 | cat2 |
202102 | 0.5135135135135135 | cat2 |
202103 | 0.56 | cat2 |
202104 | 0.35 | cat2 |
202105 | 0.5333333333333333 | cat2 |
202106 | 0.625 | cat2 |
202107 | 0.0 | cat2 |
...
with many more categories
I now want to calculate a 12 month rolling average per categorie. The problem ive had with the pd.rolling function is that it takes data from cat1 when calculating the rolling average in cat2. And data from cat 2 in the calculation for cat 3 and so on.
Kind regards,