Ile nóg ma pies statystyka? Czyli jak wykorzystać metody szacowania do tworzenia i przewidywania KPI

Od dawna wiadomo, że decyzje oparte na danych obarczone są mniejszą liczbą błędów oraz podejmowane są szybciej (pisaliśmy o tym w artykule: Co utrudnia nam podejmowanie decyzji i jak mogą pomóc w tym kluczowe wskaźniki? – Kokpit Zarządzania Biznesem). Jednak czasem, aby dowiedzieć się, jak jeden miernik przyczynia się do wzrostu lub spadku innego, warto je ze sobą zestawić. Należy wtedy zwrócić się w stronę dziedziny matematyki, która umożliwia lepsze i głębsze zrozumienie danych – statystyki. Wokół niej wyrosło sporo nieporozumień, które po części tutaj rozwieję. Pokażę również, jak wykorzystać statystykę w budowaniu kluczowych wskaźników efektywności (KPI) oraz jak stworzenie odpowiedniego modelu regresji pomoże w przewidywaniu, które działanie wybrać, aby podnieść najważniejsze mierniki biznesowe. 

statystyka a KPI

Czy statystycznie z psem mam trzy nogi? 

Część osób podchodzi  do statystyki z lekceważeniem. Dyskusję na jej temat kończą anegdotą, że statystycznie to z psem mają po trzy nogi. Stwierdzenie to nie jest uprawomocnione już na ogólnym poziomie. Pies i człowiek należą do innych populacji, więc nie można wyciągać wniosków statystycznych. Po drugie nawet jeśli uznać, że mówimy o populacji ssaków, to statystyka nie nadaje się do stosowania w przypadku tak małej grupy. Po prostu jest niepotrzebna. Widzimy, ile pies ma nóg, a ile człowiek. Nie potrzebujemy dokonywać kolejnych obliczeń. Statystykę używamy wtedy, kiedy nie mamy pełnych danych o całej populacji, a chcemy wiedzieć, jak wygląda jakaś zmienna np. poparcie dla partii politycznych w społeczeństwie. Zamiast pytać każdego obywatela, pytamy reprezentatywną próbę (dla Polski to ok. 1000 osób). Oczywiście takie dane są obarczone błędem, ale jest on niewielki, a koszty znacznie, znacznie mniejsze. Ponadto statystyka identyfikuje, czy sprzedaż opon zimowych związana jest z temperaturą powietrza (badan korelację) lub kto więcej wydaje na smartfony – kobiety czy mężczyźni (sprawdza różnicę międzygrupowe). 

Jeżeli chodzi o wskaźniki efektywności najczęściej używamy statystyk opisowych. Poniżej przyjrzę się trzem z nich – średniej, medianie i dominancie.  

Średnia jako KPI

Najbardziej powszechną i najczęściej używaną statystyką jest średnia arytmetyczna. Daje nam ona znać, o tym jak np.  wygląda przeciętne natężenie jakieś cechy w badanej populacji. Średnia, z powodzeniem, może być wykorzystywana jako wskaźnik. Przykładowo w sklepach, stacjonarnych czy internetowych, można liczyć średnią wartość koszyka, czyli za jaką kwotę przeciętny Kowalski kupuje w naszym sklepie. Taki wskaźnik może pokazać, że co prawda mamy wielu klientów, ale raczej wydają oni małe kwoty. W takim wypadku pewnie warto próbować proponować im inne produkty. Średnia to jednak nie zawsze najlepsza metoda statystyczna. Sprawdza się ona najlepiej wtedy, kiedy przypadki, z których ją liczymy, są do siebie zbliżone. Dlaczego? Bo średnia jest podatna na wartości skrajne. Jeżeli w naszym sklepie internetowym 4 osoby wydały 20 zł, a jedna osoba 1000 zł, średnia wyniesie 216 zł – nie będzie to jednak statystyka, która opisuje doskonale, jakie zakupy robią klienci w naszym sklepie. W takim wypadku pewnie lepszą miarą okazałaby się dominanta, czyli wartość, która występuje najczęściej. W naszym przykładzie byłoby to 20 zł. 

rozkład normalny, miary tendencji centralnej, mediana, średnia, dominanta

Wskaźniki oparte na medianie

Jeszcze inną miarą tendencji centralnych (do których zaliczamy średnią i dominantę) jest mediana. Pozwala ona wskazać wartość środkową – zarówno powyżej jak i poniżej tej wartości znajduje się połowa mierzonych przypadków. Jeżeli wartość poszczególnych koszyków wynosiłaby odpowiednio: 

 20 zł, 40 zł, 60 zł, 89 zł, 99 zł, 101 zł 1000 zł – mediana wynosiłaby 89 zł. 

Innym wskaźnikiem opartym na medianie może być przeciętna liczba klientów pozyskanych w danym miesiącu przez przedstawiciela handlowego. Nawet jeśli jeden z nich wykazał się ponadprzeciętnymi umiejętnościami i zdobył ich 24, a pozostałych 6 sprzedawców zdobyło 3 klientów, to mediana, która wyniesie właśnie 3, będzie bardziej odpowiednia do wyznaczenia targetu nowych klientów na kolejny okres. 

Zobaczmy, jak do tego doszliśmy: 

[ramka 1]



PH1 – 3

PH2 – 3

PH3 – 3

PH4 – 3 – mediana

PH5 – 3

PH6 – 3

PH7 – 24. 


W tym wypadku średnia wynosi średnia=6, czyli dwa razy więcej niż ilość nowych klientów zdobyta przez zdecydowaną większość handlowców. 

Zobacz więcej: Przeczytaj nasz artykuł o KPI w sprzedaży 

Statystykę jednak można wykorzystać do sprawdzania współzależności między wskaźnikami. Zobaczmy, jak ją wykorzystać na przykładzie korelacji i regresji. 

Korelacja, czyli współzmienność

Zacznijmy od tego, czym jest korelacja. Jest to statystyka, która potrafi pokazać współzmienność (inaczej współzależność) dwóch zmiennych. Taka korelacja może być dodatnia tzn. że im wyższy poziom pierwszej badanej zmiennej, tym wyższy jest poziom drugiej zmiennej. Jeżeli prowadzimy sklepy spożywcze możemy zauważyć taką dodatnią korelację: im cieplej na dworze, tym większa sprzedaż napojów chłodzących. Jednak korelacja może być też ujemna – czyli im wyższa wartość pierwszej zmiennej, tym niższa wartość drugiej. Na przykład im wyższa cena samochodu, tym mniej osób wysyła o niego zapytanie. Z matematycznego punktu widzenia, korelacja przyjmuje wartości od -1 do 1. Interpretacja poszczególnych wartości znajduje się w ramce. 

[ramka 2]


0,0 – 0,09 – brak korelacji

0,1 – 0,2 – bardzo niska korelacja

0,21 – 0,39 – niska korelacja

0,4 – 0,69 – umiarkowana korelacja

0,7 – 0,89 –  wysoka korelacja 

0,9 – 1 – bardzo wysoka korelacja


regresja, korelacja, statystyka a KPI

Po co liczyć korelacje w biznesie? 

Wynik korelacji niezwykle rzadko sam w sobie jest KPI, chociaż pewnie znajdą się takie cele biznesowe, które będą używać współzmienności do weryfikowania strategii biznesowej. Jednak korelacje można zastosować do sprawdzania, czy dane wskaźniki są ze sobą związane. Co nam to da? Jeżeli jakieś dwie zmienne są ze sobą złączone, być może wystarczy zadziałać na jedną z nich, aby podniosła się wartość drugiej. Jeżeli stwierdzimy, że jedynym działaniem zwiększającym sprzedaż jest wielkość budżetu marketingowego – wiemy, że aby ją zwiększyć, trzeba dołożyć do promocji. Jednak sprzedaż, czy inne zmienne biznesowe, zazwyczaj związane są z wieloma, różnymi zmiennymi, a nie tylko jedną. W tym momencie z pomocą przychodzi regresja. 

Jak wykorzystać regresję w biznesie? 

Wyznaczenie tzw. równania regresji pomoże nam dowiedzieć się, jakie i ile zmiennych wpływa na nasz główny wskaźnik. Sprzedaż, poza wspomnianym budżetem marketingowym, może być związana np. z ilością handlowców w firmie, z poziomem marży lub ilością obsługiwanych regionów sprzedaży. Właśnie dzięki regresji możemy wyznaczyć współwystępowanie tych zmiennych i określić, jak wygląda matematyczny model połączenia tych zmiennych. Dzięki niej z większą precyzją oszacujemy, który z tych czynników jest bardziej związany ze sprzedażą, a zatem, na którym się skupić, aby podnieść kluczowy wskaźnik sprzedaży.  Co więcej, równanie regresji pomoże nam również w przewidywaniu, jak zmieni się sprzedaż, jeśli podniesiemy jeden ze wskaźników, które znalazły się w modelu. Czyli będziemy mogli ocenić, o ile wzrośnie sprzedaż, kiedy wydamy na marketing o 1000 zł więcej lub jeżeli zmniejszymy marżę o 1%. 

Ze statystyką Ci do twarzy

Powyższe rozważania na temat statystyki i KPI są w znacznym stopniu uproszczone. Nie ulega jednak wątpliwości, że używając wskaźników w firmie, warto, od czasu do czasu, pokusić się o wykonanie bardziej zaawansowanych analiz, które mogą pokazać współzmienność niektórych mierników. Właśnie dlatego warto zadbać o to, żeby zbierane dane były wysokiej jakości oraz, aby informacje potrzebne do ich wyliczenia był gromadzone na bieżąco. Warto również wizualizować wskaźniki. To znacznie ułatwi stawianie hipotez dotyczących korelacji między zmiennymi, które później będzie można przetestować używając metod statystycznych. Pomocne w tym bywają różne narzędzia (dashboardy), w tym Kokpit Zarządzania Biznesem, który pozwala na solidne zbieranie danych, dzięki którym późniejsza ich dokładna analiza będzie znacznie uproszczona. 

Statystyka, to dziedzina matematyki, która od wielu lat jest rozwijana i stosowana w wielu naukach do opisywania rzeczywistości. Chociaż jest krytykowana, szczególnie przez laików,  często to jedyna metoda, pozwalająca oszacować i przewidywać, jak zachowają elementy otaczającej nas rzeczywistości gospodarczej, politycznej, społecznej i biznesowej.