Otwieram na prosbe jednego forumowicza temat ze statystykami z Wyscouta/Instata, konta ktore posiadam tam sa glownie pod ogladanie skrotow meczow z kilkunastu europejskich lig ale dodatkowym bonusem sa niesamowicie szczegolowe statystyki, wciaz jestem na etapie nauki obydwu platform (do tej pory bazowalem glownie na Wyscoucie) ale potencjal (szczegolnie Instata) jest olbrzymi, jesli sa jakies pytania o zawodnikow ktorymi sie interesujemy, porownania pilkarzy/zespolow to prosze pisac w tym temacie albo na priv, postaram sie wrzucac co jakis czas ciekawsze informacje, licze ze pozwoli to rozprawic sie z kilkoma mitami funkcjonujacymi na forum na temat niektorych zawodnikow/zespolow a osobom zrazonym do statystyki uswiadomienie ze bycie kibicem tak losowej gry jak pilka nozna wiaze sie z popelnianiem błędow poznawczych przy wyznaczaniu założeń, wyciąganiu wniosków, ktore to bledy statystyka jest w stanie (przynajmniej czesciowo) zniwelowac :)
na poczatek raport meczowy Instat z meczu z Lechia:
https://www.docdroid.net/wSgST1t/15-11-2018-match-10112018.pdf
mapa strzalow (przy tylu strzalach w centralnej strefie pola karnego nic dziwnego ze kazdy exG model ktory "przetworzy" ten mecz postawi teze ze zasluzylismy na zwyciestwo)
CRA
[img]https://i.imgur.com/QBlapH0.png[/img]
LGD
[img]https://i.imgur.com/5IcreQU.png[/img]
i porownanie calosciowych statystyk z meczu:
https://imgur.com/a/WLn3heC
-
-
Kacik statystyczny
Możesz mi tylko napisać czy każdy może mieć tam konto czy wymaga to jakiegoś papierka np trenerka czy coś? :)
Od nas nie wymagali zadnego papierka, kazda osoba fizyczna moze otworzyc konto (byc moze okazanie papierka skauta/trenera uprawnia do jakis znizek ale nie jestem pewny).
Ceny zaleza od typu pakietu i ilosci lig - hitem jesli chodzi o przystepnosc cenowa jest konto Wyscouta za 10 euro miesiecznie ktore wprawdzie oferuje dostep do jedynie 20 minut nagran miesiecznie ale posiada statystyki meczowe dla wszystkich rozgrywek, w tym niedawno wprowadzony przez Wyscouta model exG dla wszystkich rozgrywek ktore maja w swojej ofercie (czyli rozgrywki ktore sa recznie ogladane i "tagowane" przez ich analitykow) - cena absurdalnie i szokujaco niska, pamietam ze jeszcze kilka miesiecy temu placilem 100 euro miesieczne za dane exG dla samej drugiej ligi szwedzkiej od zagranicznego analityka ktory zbieral te dane na wlasna reke, tutaj za 10 razy nizsza cene otrzymuje sie dostep do statystyk z kilkudziesieciu rozgrywek z calego swiata)
Świetny wątek, na coś takiego czekałem. Tak na marginesie to nawet nie wiedziałem, że Wyscout oferuje subskrypcję w takiej niskiej cenie.
Kilka moich osobistych "teorii" z obserwacji poprzednich meczow
1) Duzy progres na przestrzeni ostatnich 3-4 tygodni wylaczajac mecz pucharowy z Nieciecza (ktory ignoruje ze wzgledu na zrotowany sklad - mecze rozgrywane silnym skladem/bez wielu zawieszonych/kontuzjowanych pilkarzy/mecze w srodkowej fazie sezonu ktore nie sa "dotkniete" motywacja ktora ma olbrzymi wplyw na postawe zespolow itd = silny sygnal, mecze pucharowe/ze zrotowanym skladem/z udzialem zespolu ktory juz sobie zagwarantowal mistrzostwo/spadek = szum informacyjny, polecam swietna ksiazke Nate Silvera na ten temat "Sygnał i szum. Sztuka prognozowania w erze technologii")
Cztery ostatnie mecze za kazdym razem bylismy lepszym zespolem i zasluzylismy na zwyciestwo (poza wyrownanym meczem z Korona ktory paradoksalnie wygralismy, ot urok pilki :)) i jeden z lepszych meczow za Probierza z Lechia wedlug exG (czemu ten mecz a nie mecz z Miedzia w ktorym roznica miedzy oczekiwana iloscia goli strzelonych a straconych byla wyzsza? a no dlatego ze do meczu z Lechia przystepowalismy jako 23% underdog a gralismy jako 50% faworyt, podczas gdy w meczu z Miedzia bylismy 48% faworytem a zagralismy jak 83% faworyt (z tym ze model Wyscouta nie "rejestruje" kilku groznych sytuacji Miedzi ktore ostatecznie nie zakonczyly sie oddaniem strzalu, mi (na podstawie nieco bardziej zaawansowanego modelu niz exG Wyscouta) blizej do tego ze gralismy jak 75% faworyt dlatego to mecz z Lechia robi na mnie wieksze wrazenie)
Ostatnie 3-4 tygodnie sa o tyle dziwne ze do tej pory 90% meczow za Probierza gralismy na stalym (i oczekiwanym ze wzgledu na regres zespolu po zwolnieniu Zielinskiego) rownie slabym poziomie a tu nagle taka pozytywna metamorfoza, nie lubie takich sytuacji bo o ile gdy cos takiego sie dzieje po aktywnym okienku transferowym albo zmianie trenera to stosunkowo bezpiecznie jest zalozyc ze te czynniki mialy wplyw a i tak istnieje niebezpieczenstwo dorobienia narracji, dla jednego kibica moze miec to zwiazek z np zamrozeniem pensji, dla kogos innego moze to byc czysty przypadek i predzej czy pozniej nasza "forma" wroci do tego stalego poziomu z wczesniejszych miesiecy a moze jest cos o czym nie wiemy? inny rezim treningowy? nagly wzrost formy pojedynczych pilkarzy? milion innych mozliwych czynnikow i nigdy sie nie dowiemy co stalo za ostatnimi meczami :)
[img]https://i.imgur.com/ziLLw5Q.png[/img]
2) Czlapajacy Budzinski
Tutaj bardzo duza niespodzianka, lider zespolu jesli chodzi o kreacje - 13 wyokreowanych sytuacji bramkowych (z tego co widzialem to instat dobrze sobie radzi z "tagowaniem" tego typu sytuacji, zazwyczaj dla kazdego zespolu sa to 3-4 najgrozniejsze (z najwieksza oczekiwana wartoscia strzelenia gola) sytuacje zespolu w przecietnym meczu, dla porownania Starzynski (przez wielu uwazany za najlepszego playmakera w lidze) ma tych sytuacji tyle samo (13 ale rozegral kilka minut wiecej w tym sezonie niz Budzinski)
3) Dobra forma Dytiatieva
Opieram sie praktycznie wylacznie na Instat Index - ocenianie obroncow jest trudne ze wzgledu na brak "typowych" statystyk (takich jak wykreowane sytuacje, kluczowe podania, oczekiwane gole/asysty) ktorymi latwo okreslic "forme" zawodnika ofensywnego, maja z tym problemy nawet kluby ktore wydaly miliony funtow na rozwoj sztabu analitycznego, ciezko jest "opisac" statystykami na przyklad ustawianie sie zawodnika (jest jedna firma w Monachium ktora zrobila olbrzymi progres w tej kwestii dzieki systemowi "Packing" ktory dzieki automatycznemu rejestrowaniu pozycji zawodnikow i pilki przez 90 minut meczu jest w stanie lepiej ocenic zawodnikow defensywnych niz statystyki Opty/Wyscouta czy Instata - jako ciekawostke powiem ze rozwazali dodanie Polskiej Ekstraklasy do listy ich rozgrywek (ze wzgledu na zainstalowany w tym sezonie na wszystkich stadionach system trackingu - TRACAB) ale po zrobieniu wstepnego researchu i zetknieciu sie z dinozaurami zarzadzajacymi Polskimi klubami ktorzy wola wydawac pieniadze na przeplacony szrot uznali ze bardziej oplaca im sie zajac Rumunska liga (ktora systemu trackingu nie ma i ktorej mecze musza byc ogladane recznie (z manualnym rejestrowaniem pozycji kazdego zawodnika co sprawia ze "przetworzenie" jednego meczu zamiast 90 minut zajmuje 6 godzin) przez ludzi zatrudnionych na Filipinach :)
Wracajac do Dytiatieva - bardzo wysoki wskaznik Index Instat (najwyzszy w zespole - 266), uwazam ze warto na nim bazowac gdyz algorytmy wyliczajace go bazuja na porownaniu do innych pilkarzy w lidze, grajacych na tej samej pozycji. Brane sa takze pod uwage takie czynniki jak poziom zespolu (wspomniane wczesniej 13 wykreowanych sytuacji bramkowych Budzinskiego robi na mnie wieksze wrazenie niz np 16 sytuacji Majewskiego (lider ligi) gdyz gra w duzo mocniejszym zespole, wiec naturalnie oczekuje od niego wiekszej ilosci wykreowanych sytuacji niz od zawodnika grajacego na tej samej pozycji w slabszym zespole)
Do tego duza tendecja zwyzkowa w ostatnich meczach, rzuca sie rowniez w oczy ilosc wygranych pojedynkow w defensywie (czwarty najwyzszy wynik w lidze) moze zastapienie Helika nim mialo tak pozytywny wplyw na poprawe gry w ostatnich tygodniach?
Dodam ze w moich "ratingach" ktore uzywam do obstawiania wynikow meczow, 75% "progresu" wspomnianego na poczatku posta bierze sie z poprawy defensywy a "tylko" 25% z lepszej ofensywy
[img]https://i.imgur.com/EXDbDHG.png[/img]
- Edytowany
[quote='dangorka' pid='1347586' dateline='1542306272']
....
....
pamietam ze jeszcze kilka miesiecy temu placilem 100 euro miesieczne za dane exG dla samej drugiej ligi szwedzkiej ,,,,,,
[/quote]
Co to jest exG ?
W jakim celu można płaciłeś 100 euro za jakieś statystyki drugiej ligi szwedzkiej ?
[quote='Trapez' pid='1347601' dateline='1542315614']
[quote='dangorka' pid='1347586' dateline='1542306272']
....
....
pamietam ze jeszcze kilka miesiecy temu placilem 100 euro miesieczne za dane exG dla samej drugiej ligi szwedzkiej ,,,,,,
[/quote]
Co to jest exG ?
W jakim celu można płaciłeś 100 euro za jakieś statystyki ligi szwedzkiej ?
[/quote]
expected goals - oczekiwane gole
problem ze standardowymi statystykami strzalow jest taki ze strzal z czterdziestu metrow komfortowo wylapany przez bramkarza jest liczony w statystykach meczowych tak samo jak glowka z otwartej pozycji na piatym metrze ktora trafia w poprzeczke (a dodatkowo paradoksalnie ten pierwszy strzal bedzie liczony jako strzal celny gdyz trafia w swiatlo bramki a drugi strzal zostanie sklasyfikowany jako niecelny)
expected goals rozwiazuja ten problem i na podstawie historycznych danych o (tutaj wiele oczywiscie zalezy od modelu ale najczesciej jest to a) pozycja zawodnika b) kat strzalu c) typ zagrania (strzal/wolej/glowa), bardziej zaawansowane modele uwzgledniaja takze np presje obroncow lub akcje poprzedzajace strzal) pierwszemu strzalowi z 40 metrow przypisza wartosc okolo 0.01 gola (gdyz w usrednieniu jeden raz na sto razy taka sytuacja skonczy sie golem) a druga sytuacja moze miec wartosc np 0.40-0.50 (gdyz przecietnie raz na dwie takie sytuacje padnie bramka)
oczywiscie modele te nie sa idealne, przykladowo w Wyscoucie najwiekszym problemem jest to ze gdy w czasie jednej akcji dojdzie do dwoch strzalow z bliskiej odleglosci (powiedzmy ze kazdy z nich ma oczekiwana wartosc np 0.60 gola) to dochodzi do absurdalnej sytuacji gdzie jedna akcja bramkowa ma oczekiwana wartosc...1.2 gola co oczywiscie jest bledem logicznym
drugim problemem jest na przyklad to ze karnym z automatu przypisuje sie wartosc 0.76 (gdyz w usrednieniu 76% karnych zamieniane jest na gola) co moim zdaniem niesprawiedliwie "nagradza" zespoly ktore mialy farta i wywalczyly karnego
a generalnie najwiekszym problemem wszystkich modeli exG jest to ze nie uwzgledniaja one sytuacji ktore nie zakonczyly sie strzalem (przykladowo niskie podanie po ziemi ktore mija bramkarza a przy ktorym napastnikowi zabraklo kilku centymetrow aby dojsc do pilki i skierowac ja do pustej bramki czy sytuacje w poznej fazie meczu kiedy kontrataki 3 v 1 sa zatrzymywane przed polem karnym - wszystkie te wspomniane sytuacje maja wieksza oczekiwana wartosc gola niz przecietny strzal w srodku pola karnego ale ze wzgledu na slabosc modelu exG nie zostana one uwzglednione)
sprawia to ze zawodowi hazardzisci/syndykaty bukmacherskie takie jak Smartodds czy Football Radar uzywaja exG jako dodatkowa pomoc (mimo wspomnianych wad modele exG sa o niebo lepsze i odzwierciedlaja "sprawiedliwy" wynik meczu duzo lepiej niz strzelone bramki/tradycyjne statystyki strzalow) i bazuja glownie na bardziej zaawansowanych modelach w ktorych wymagane jest "manualnie" sklasyfikowanie zagrozenia kazdej akcji przez wykwalifikowanego analityka
- Edytowany
Dytiatiev nie daje mi spokoju wiec wygenerowalem sobie z Wyscouta defensywny raport (https://imgur.com/a/PsqA033) z jego ostatnich czterech meczow ligowych
https://www.dailymotion.com/video/x6x8tb9 (cos sie spieprzylo przy dodawaniu wiec radze odpalic od 2:12)
Analiza taktyczna nie jest moja mocna strona ale tak laickim okiem rzuca sie w oczy kilka rzeczy (porownujac do defensywnych akcji Helika)
- bardziej agresywne krycie, nie boi sie w ostatnich meczach zejsc ze swojej pozycji by na przyklad pomoc na skrzydle
- wyzej gra niz Helik (chociaz heatmapa ze wszystkich meczow tych dwoch zawodnikow tego nie potwierdza) polaczone z dobrym przyspieszeniem co pozwala na wywieranie presji na zawodnikach przeciwnych juz w srodkowej strefie boiska
- dobre przewidywanie ktore pozwala na skutecznie neutralizowanie kontratakow
Dangorka kawał dobrej roboty, wiele ciekawych rzeczy można się dowiedzieć. Odnośnie Dytiatieva to zawsze mówiłem, że to nasz najlepszy stoper. Chętnie bym zobaczył również jak wygląda sprawa Datkovica gdy gra z Dytiatievem (i jak wyglądała gdy grał w parze z Helikiem) w sumie chętnie bym też zobaczył jak wyglądał Helik z Ukraińcem i jak z innymi partnerami(bo mam przypuszczenie, że z Dytiatievem obaj grają lepiej, gdyż jest on dowodzącym naszej defensywy, natomiast żaden z nich nie jest liderem, co nie znaczy, że to źli piłkarze, tylko potrzebują "dowódcy", który krzyknie/podpowie/ustawi), chciałbym zobaczyć również statystyki Gola, porównanie Diego z Rapą, Zenjova z Wdowiakiem i statystyki Piszczka.
- Edytowany
Obawiam się ze tak zaawansowane filtrowanie danych (na podstawie grających stoperów) jest niedostępne i w Wyscoucie i w Instacie
Co do reszty:
1) Rapa vs Diego (statystyki z tego sezonu)
https://www.docdroid.net/OuPA2fz/16-11-2018-compare-player-gk.pdf
imo zgodnie z oczekiwaniami, Rapa przychodzil jako zawodnik ktory ma dac wiecej jakosci z przodu niz obecni boczni obroncy, więcej wykreowanych sytuacji i strzałów, lepsze podania
podobny Index Stat ale zakladam ze to dlatego ze roznica miedzy przecietnym prawym obronca ligi a Rapa jest podobna jak miedzy Diego a przecietnym lewym obronca ligi, nie jestem pewny ale wydaje mi sie ze samo porownanie wysokosci Instat Index miedzy Rapa a Diego moze prowadzic do blednych wnioskow (z tych statystyk dosyc jasno wynika że Rapa jest lepszym zawodnikiem w tym sezonie niz Diego)
2) Gol
ogolnie solidnie, wrzucam do Excela tak aby miec jakis punkt odniesienia (Covilo 17-18 w Cracovii v Gol 18-19)
https://docs.google.com/spreadsheets/d/13MftHr3XqYyUf7p-uS6h5be56LEHRPrUg2rrO_9l-qw/edit?usp=sharing
zgodnie z oczekiwaniami Covilo dominowal w powietrzu, trochę zaskakujące dla mnie jest jedynie statystyka podan, bylem pod wrazeniem że u Covilo ilosc podan bedzie wyzsza ze wzgledu na czeste cofanie sie do tylu w celu pomocy w rozgrywaniu a tymczasem wychodzi na to ze Gol jest odrobine "czesciej" pod gra
Co do Covilo to wrzucam jeszcze jako ciekawostkę jego profil na Instacie, algorytmy generują na podstawie meczowych statystyk automatyczną analizę zawodnika (mocne i słabe strony), mam osobistą teorię że Covilo jest najlepiej grającym w powietrzu zawodnikiem jaki pojawił się w tym wieku w Ekstraklasie i jeśli 87% oznacza że jest lepszy od 87% zawodników w całej bazie (może to mieć sens skoro tylko wielcy zawodnicy jak Messi czy Ronaldo mają pod niektórymi umiejetnosciami 100%) to ta teoria może być prawdziwa :)
[img]https://i.imgur.com/ZtLjGZz.png[/img]
3) Zenjov vs Wdowiak (2018/19)
https://docdro.id/1VG68UC
4) Piszczek
https://docs.google.com/spreadsheets/d/1YnBlW5UR35mR-LyVSANWXHkuvlktxb5r8BOdTGDGwZU/edit?usp=sharing
żenująco słabe statystyki w Sandecji, żenująco słabe u nas
mizerna jak na napastnika ilosc strzałów, bardzo duży odsetek nieudanych zagrań i strat piłki, aż 7 goli w poprzednim sezonie było pewnego rodzaju anomalią i teraz następuje stopniowy regres do średniej, wrzuciłbym porównanie z Piatkiem z poprzedniego sezonu ale nie chcę się pastwić nad chłopakiem
potwierdza się tutaj filozofia Brentford/Midtjylland która jest niesłychanie prosta a jednocześnie zabójczo skuteczna - jeśli ściągasz zawodnika ze słabszego klubu, gdzie nie był regularnie występującym zawodnikiem (przy czym regularnie oznacza zaczynanie meczu w co najmniej 80% spotkań kiedy zawodnik nie był kontuzjowany/zawieszony - jesli zaczynasz np 50% spotkań a np w 30-40% pozostałych spotkań wchodzisz z ławki, to jesteś co najwyżej 11-13tym najważniejszym graczem zespolu) to nie ma szans aby dany zawodnik odgrywał kluczową rolę (czy chociażby łapał się do najlepszej XI) w silniejszym zespole
cała ta filozofia była podstawą mojego zakładu na TT o to że Piątek strzeli w pierwszym sezonie po przyjściu do nas co najmniej 10 goli :) przychodził jako KLUCZOWY zawodnik z SILNIEJSZEGO klubu. I o ile rozumiem że problemem może być dla typowego skauta/dyrektora sportowego określenie jak silniejszy/słabszy w stosunku do nas jest na przykład przeciętny zespół 1 ligi rumuńskiej (chociaż w tym tkwił sekret największego hitu transferowego Midtjylland, według ich modeli matematycznych zespół z 2 albo 3 Bundesligi (bodajże Greuther Furth ale nie jestem pewny) grał świetny futbol i gdyby grał zamiast w Niemczech w Premier League to prawdopodobnie plasowałby się w środku tabeli i dzięki temu podejściu za grosze ściągnęli zawodnika który bodajże piąty sezon z rzędu jest ich kluczowym defensywnym pomocnikiem) tak chyba każdy powinien dosyć łatwo dojść do wniosku że Sandecja była w poprzednim sezonie jednym z dwóch najsłabszych zespołów w lidze
Dzięki. Swoją drogą dziwie się, że Filipiak nie poszedł drogą Midtjylland i nie zrobił w Pasach polskiego wydania moneyballa tym bardziej, że w naszej buraczanej lidze jestem niemal pewien, że dałoby to wymierne efekty w krótkim czasie jeżeli byłoby to robione z głową, a biorąc pod uwagę Comarch, to chyba nawet nie byłoby to takie trudne do zrealizowania. Filipiak pewnie by nawet na tym zyskał, tanio kupił drożej sprzedał, ale niestety wolimy przebierać śmietniki po omacku i sprowadzać szrot z niewiadomego pochodzenia.
Dangorka, napisz czy model matematyczny "expected goals" uwzglednia oprocz tzw historical data, statystyki konkretnego grajka, ktory oddaje strzal?
To brzmi jak branie usrednionych "field data" w postaci prawdopodobienstwa zdobycia gola z danej pozycji, przy uderzeniu noga, glowa, pod takim a nie innym katem [b]dla historycznie dostepnych danych uwzgledniajacych cala grupe grajkow na przelomie jakiegos okresu[/b], natomiast zeby model byl dokladny nalezaloby uwzglednic w przypadku konkretnej druzyny dodatkowy ulamek, ktory odzwierciedla historie danego grajka w takiej sytuacji.
Wtedy mielibysmy dodatkowo obraz tego,ze druzyna o danych umiejetnosciach(potwierdzonych statystyka, niekoniecznie wysokich) musi osiagnac wg tej metodologii pewien prog przewagi, ktory z danym prawdopodobienstwem da jej zwyciestwo.
- Edytowany
Te statystyki Piszczka to jest jakiś dramat.. Patrząc po samych statystykach nie wiem jaki może być jego atut. Facet ewidentnie unika dryblingów, nie wchodzi za bardzo w pojedynki, mało strzałów, duża ilość strat.. Inna sprawa, że w Sandecji zdawał się grać przyzwoicie, a statystyki pokazują jednak co innego. Pewnie jest to kwestia tego, że grał w bardzo słabej Sandecji.
- Edytowany
[quote='octop' pid='1347618' dateline='1542336288']
Dzięki. Swoją drogą dziwie się, że Filipiak nie poszedł drogą Midtjylland i nie zrobił w Pasach polskiego wydania moneyballa tym bardziej, że w naszej buraczanej lidze jestem niemal pewien, że dałoby to wymierne efekty w krótkim czasie jeżeli byłoby to robione z głową, a biorąc pod uwagę Comarch, to chyba nawet nie byłoby to takie trudne do zrealizowania. Filipiak pewnie by nawet na tym zyskał, tanio kupił drożej sprzedał, ale niestety wolimy przebierać śmietniki po omacku i sprowadzać szrot z niewiadomego pochodzenia.
[/quote]
:D :D :D
ogladnij wywiady z Benhamem, Bloomem albo Andersenem (ci dwaj pierwsi nie udzielaja sie zbytnio w mediach ale z Andersenem jest kilka wywiadow po angielsku na Youtubie), ludzie ktorzy tym zyja 24h na dobe, nieustannie mysla o tym jak ulepszyc dzialanie klubu, sa otwarci na nowe pomysly i dla ktorych bycie wlascicielem ukochanego klubu z dziecinstwa jest spelnieniem dzieciecych marzen, a nastepnie porownaj to do janusza ktory na przestrzeni 15 lat nie nauczyl sie czekogolwiek na temat zarzadzania klubem, zniszczyl wszystko co sie dalo, obrzydzil praktycznie kazdemu kibicowi ogladanie Pasow a kazda jego wypowiedz medialna jest obiektem drwin
ale generalnie w pelni sie zgadzam, od kilku lat uwazam niezmiennie ze pierwszy klub ktory wprowadzi tego typu filozofie w Polsce (zakladajac ze pojdzie to w parze z wyeleminowaniem roznego rodzaju patologii, od skautow robiacych kosztem klubu wlasne interesy, po ludzi pokroju Tabisza/Baldysa po kiboli w takim GTS-ie) na przestrzeni 2-3 lat stanie sie jednym z trzech najmocniejszych zespolow w lidze (a w dluzszej perspektywie klubem regularnie grajacym w pucharach). Wszystko to z prostego powodu o ktorym wspomniales, nie ma chyba drugiej takiej ligi na swiecie (mowie o najwyzszym poziomie rozgrywkowym) gdzie roznica miedzy najsilniejszym a najslabszym zespolem ligi jest tak mala (jedynie liga japonska przychodzi mi do glowy)
[quote='MakuKSC' pid='1347621' dateline='1542348677']
Dangorka, napisz czy model matematyczny "expected goals" uwzglednia oprocz tzw historical data, statystyki konkretnego grajka, ktory oddaje strzal?
To brzmi jak branie usrednionych "field data" w postaci prawdopodobienstwa zdobycia gola z danej pozycji, przy uderzeniu noga, glowa, pod takim a nie innym katem [b]dla historycznie dostepnych danych uwzgledniajacych cala grupe grajkow na przelomie jakiegos okresu[/b], natomiast zeby model byl dokladny nalezaloby uwzglednic w przypadku konkretnej druzyny dodatkowy ulamek, ktory odzwierciedla historie danego grajka w takiej sytuacji.
Wtedy mielibysmy dodatkowo obraz tego,ze druzyna o danych umiejetnosciach(potwierdzonych statystyka, niekoniecznie wysokich) musi osiagnac wg tej metodologii pewien prog przewagi, ktory z danym prawdopodobienstwem da jej zwyciestwo.
[/quote]
Modele exG nie uwzgledniaja statystyk konkretnego zawodnika glownie ze wzgledu na mala probke statystyczna. Jest to jednak cos co uwzgledniaja bardziej zaawansowane modele gdzie kazda akcja jest "manualnie" oceniania zamiast polegania na stalych takich jak odleglosc strzalu/kat/typ uderzenia.
Jesli przykladowo wezmiesz grupe 300 zawodnikow i podzielisz ich na trzy grupy (nieudacznicy, przecietni zawodnicy i wybitni zawodnicy pokroju Messiego/Ronaldo) to przy rzucie wolnym z powiedzmy 20 metrow na wprost bramki model exG automatycznie przydzieli wszystkim 300 strzalom wartosc okolo 0.10 (z tego co pamietam w usrednieniu 10% tego typu sytuacji konczy sie golem, mozliwe ze minimalnie mniej).
Model bardziej zaawansowany (z manualna ocena kazdego ataku) wezmie takze pod uwage "outcome" i uwzgledni cos co mozna nazwac "finishing skill". Najslabsza grupa zawodnikow prawdopodobnie bedzie uderzala w mur/ponad bramka, podczas gdy strzaly zawodnikow z "wybitnej" grupy beda czesciej "testowaly" bramkarza, zmuszaly go do interwencji/czy beda wpadac do bramki dlatego tez o ile przecietny strzal zawodnika z pierwszej grupy bedzie mial "przypisana" wartosc okolo powiedzmy 0.05 tak analogicznie dla zawodnika pokroju Messi/Ronaldo ta wartosc bedzie blizsza np 0.15
[quote='dangorka' pid='1347603' dateline='1542316906']
oczywiscie modele te nie sa idealne, przykladowo w Wyscoucie najwiekszym problemem jest to ze gdy w czasie jednej akcji dojdzie do dwoch strzalow z bliskiej odleglosci (powiedzmy ze kazdy z nich ma oczekiwana wartosc np 0.60 gola) to dochodzi do absurdalnej sytuacji gdzie jedna akcja bramkowa ma oczekiwana wartosc...[b]1.2 gola co oczywiscie jest bledem logicznym
[/b]
[/quote]
Nie tyle jest to błąd logiczny, co błąd modelu i to łatwy do wyeliminowania :)
Można sobie wyobrazić jeszcze bardzie absurdalne sytuacje że w jednej sytuacji strzela pięciu zawodników, po kolei, na pustą bramkę, jeden trafia w poprzeczkę, dwóch obija słupki, kiks, fenomenalna obrona, i choć zsumowane exG wyniesie coś koło 3 to przecież nie możliwe jest by w wyniku wyeliminowania pecha i poprawy skuteczności wyjść po takiej sytuacji z 0:0 na 3:0, raczej będzie góra 1:0 :)
Wystarczy traktować takie zamieszania jako jedną sytuację a granicę exG ustalić na nieprzekraczalne 1,00.
Nie tylko w tej dziedzinie, w technice także dobry model to 80% sukcesu.
Dzisiaj trochę o błędach poznawczych, czyli o wzorcach nieracjonalnego postrzegania rzeczywistości które mają wpływ na ludzkie postawy, emocje I rozumowania. Błędy te wpływają na nasze życiowe decyzje, poziom dyskusji z innymi ale szczególnie niezpieczne są w analizowaniu/dyskutowaniu o “The Beautiful Game” :)
Kilka przykładów które w celu bardziej zrozumiałego przedstawienia postaram się opisać używając przykładów piłkarskich/powiązanych z Cracovią/Ekstraklasą lub z zakładami bukmacherskimi
1) Efekt pewności wstecznej
Potocznie zwany efektem “wiedziałem-że-tak-będzie”. Na naszym forum często widoczne na przykład w tematach meczowych po utraconych golach. Wytknięcie tego że ustawienie defensywy było błędne przy stałym fragmencie gry jest łatwe, ale ilu na 100-tu kibiców w tej samej sytuacji zada sobie (dużo lepsze) pytanie “czy to samo ustawienie zapobiegło we wcześniejszych meczach utracie dużej ilości goli?”
Interesujący przykład efektu pewności wstecznej przytoczył kiedyś Tadeusz Tyszka mówiąc o tym, że jedyną osobą publiczną prognozującą w latach 80. XX wieku upadek komunizmu w Polsce był Leszek Moczulski. Mało kto traktował wówczas tą opinię poważnie. Jednak po upadku systemu komunistycznego dały się słyszeć coraz bardziej powszechne głosy, ze było to do przewidzenia.
2) Efekt wyniku
Zdecydowanie mój ulubiony I chyba najczęściej występujący w futbolu błąd poznawczy, pisałem we wcześniejszych postach o wadach modelu exG ale gdybym miał wskazać jedną, największą zaletę tego modelu, byłoby to że “zamienia” on wynik meczu który w tak losowym sporcie jak piłka nożna, gdzie gole są zdarzeniem nieprawdopodobnie (porównując do innych sportów) rzadkim, a gdzie o rezultacie meczu czy nawet o zdobyciu tytułu mistrzowskiego może zadecydować jedna pomyłka sędziowska albo jeden bląd bramkarza, w wynik ExG (różnica między oczekiwanymi strzelonymi/straconymi golami) który lepiej odzwierciedla który zespół był drużyną lepszą, a który zespół miał po prostu więcej szczęścia (albo mniej pecha :))
Gdyby właściciele Polskich klubów sportowych nie byli tak mocno podatni na “efekt wyniku” I zamiast oceniać trenerów z tego jak mocno pechowi/fartowni są postawili na bardziej miarodajne wskaźniki, być może trener Zieliński wciąż by pracował u nas :)
3) Niezrozumienie losowości
Praktycznie po każdym EURO/Mundialu słychać komentarze na temat jednego “czarnego konia” który sprawił niesłychaną niespodziankę zachodząc do dalszej fazy turnieju niż się po nim spodziewano. Jest to jednak coś, co z matematycznego punktu widzenia jest całkowicie normalne, przy 32 drużynach zaangażowanych w turniej jest sporo stosunkowo słabych drużyn których szansa na dojście powiedzmy do cwiercfinalu nie jest zbyt wysoka. Ale jeśli zsumuje się te wszystkie drużyny to nagle okazuje się że nie ma nic nietypowego (z matematycznego punktu widzenia) jeśli co najmniej jeden z tych zespołów zaszedł tak daleko.
4) Efekt “gorącej ręki”
Szczególnie popularny w koszykówce gdzie kibice często uważają że po trafieniu pierwszego rzutu osobistego, szanse na zaliczenie trafienia w drugim rzucie wzrastają (ze względu na coś co zgaduję że można by nazwać “momentum”). Bierze się to z tego że ludzki umysł ma tendencję do wyszukiwania “wzorów”. Jeśli zawodnik ma serię 10-0 w ostatnich 10 rzutach za trzy punkty, to kibice często zakładają że następny rzut za 3 punkty prawie na pewno skończy się ponownie trafieniem. W rzeczywistości naukowcy udowodnili na podstawie statystycznych danych że przekonanie, że istnieją większe szanse na kontynuowanie serii niż jej przełamanie jest tylko I wyłącznie błędem poznawczym.
5) Regresja do średniej
Mój ulubiony przykład to “klątwa Sports Illustrated” (ale rożnego rodzaju plebiscyty np na najlepszego trenera w danym sezonie również często kwalifikują się do tego przykładu). Istnieje (błędne) przekonanie że znalezienie się na takowej okładce przynosi zawodnikowi pecha I wpływa negatywnie np na jego formę w najbliższych tygodniach. Wyjaśnienie tego jest banalnie proste – na okładce lądują zawodnicy w wybitnej formie, odstającej znacznie od ich “rzeczywistych” umiejętności. Z tego powodu istnieje duże prawdopodobieństwo że ich przyszłe występy będą “dotknięte” przez regresję do średniej I ostatecznie unormowane do “regularnego poziomu”
W Polskiej Ekstraklasie najlepszym przykładem regresji do średniej jest postawa Piasta z sezonu 2015/16 który zdobył wicemistrzostwo (z dużą dozą szczęścia o której większość kibiców/dziennikarzy nie zdawała sobie sprawy) po to aby w następnym sezonie (gdy nastąpiła regresja do średniej) nie dać sobie rady z zakwalifikowaniem się do chociażby TOP 8
6) Bayessian conservatism
Nie znam niestety polskiego tłumaczenia (bayessowski konserwatyzm???) ale błąd ten polega na naszej tendencji do zauważania “dowodów” na poparcie naszej tezy w większym stopniu niż zauważanie rzeczy które tę tezę obalają.
Jeśli Budziński w następnym meczu zaliczy beznadziejne spotkanie, z milionem strat, niecelnymi podaniami itd, to założę się że że wygeneruje to duuuuużo większą aktywność na forum niż gdyby to samo spotkanie zakończyło się wykreowaniem przez niego 5 kluczowych sytuacji (zmarnowanych przez partnera z ataku), 10 kluczowymi podaniami w wolną strefę I kilkunastoma celnymi wrzutkami w pole karne
[b]cdn[/b]
Jako, że od jakiegoś czasu trwa spór kto z naszych lewych obrońców jest lepszy, to chętnie bym zobaczył porównanie Pestki i Siplaka, choć biorąc pod uwagę niewielką ilość minut Kamila pewnie nie będzie to wiarygodne, dlatego jeżeli istnieje taka możliwość to chętnie zobaczyłbym również ich porównanie na podstawie zeszłego sezonu.
[quote='octop' pid='1348046' dateline='1542753907']
Jako, że od jakiegoś czasu trwa spór kto z naszych lewych obrońców jest lepszy, to chętnie bym zobaczył porównanie Pestki i Siplaka, choć biorąc pod uwagę niewielką ilość minut Kamila pewnie nie będzie to wiarygodne, dlatego jeżeli istnieje taka możliwość to chętnie zobaczyłbym również ich porównanie na podstawie zeszłego sezonu.
[/quote]
Siplak v Pestka, dane od początku 2018 roku (podobna ilosc minut - 2000)
https://www.docdroid.net/baTT1II/22-11-2018-compare-player-gk.pdf
Dwie wazne sprawy w kontekscie wszelakich porownan pilkarzy.
1) Wszystkie tego typu statystyki to wciaz tylko i wylacznie 90 minut dnia meczowego, podczas gdy to trener widzi zawodnika kilka razy czesciej na przestrzeni calego tygodnia. Przy dwoch zawodnikach z podobnymi statystykami, jesli jeden z nich zaczyna duzo czesciej w wyjsciowej XI to zakladam ze w zdecydowanej wiekszosci przypadkow ma to zwiazek z lepsza postawa na treningach (zaden trener nie jest samobojca i idiota i nie pozwoli sobie na "oslabianie" druzyny przez wrzucanie na lawke mocniejszego na danej pozycji zawodnika, z wyjatkiem rzadkich sytuacji typu "klub kokosa" czy jakies pozasportowe problemy zawodnika)
2) Druga wazna kwestia przy tego typu porownaniach jest kontekst. Czy powyzsze statystyki dosrodkowan Siplaka jednoznacznie wskazuja ze jest on zawodnikiem lepiej dosrodkowujacym pilke? Byc moze tak, ale rownie dobrze moze to oznaczac ze przykladowo do zadan taktycznych Pestki naleza wczesniejsze dosrodkowania ze srodkowej strefy boiska podczas gdy Siplak ma za zadanie przykladowo czesciej holowac pilke do linii koncowej boiska i tam szukac dosrodkowan ktore ze wzgledu na lepsza pozycje crossa maja wieksze prawdopodobienstwo dotarcia do zawodnika z naszej druzyny.
Tego typu kontekst jest czyms co bardzo latwo mozna pominac bazujac ekskluzywnie na porownaniach statystycznych i dlatego nawet we wspomnianym wczesniej Midtjylland ktore tak mocno bazuje na statystykach, modele matematyczne ktore dokonuja selekcji zawodników ktorzy moga byc potencjalnym wzmocnieniem druzyny, sa tylko pewnego rodzaju pomoca i wszyscy wyselekcjonowani zawodnicy wciaz musza przejsc przez "tradycyjny" proces skautingu (wysylanie skautow na mecz/analiza video itd).
http://weszlo.com/2018/11/22/najlepsze-liczby-ekstraklasie-publikujemy-pelny-raport-instat/
Cześć, wygląda na to, że interesuje Cię ten temat!
Kiedy utworzysz konto, będziemy w stanie zapamiętać dokładnie to, co przeczytałeś, dzięki czemu możesz kontynuować dokładnie w miejscu, w którym skończyłeś. Otrzymasz również powiadomienia, gdy ktoś Ci odpowie. Możesz także użyć „Lubię to”, aby wyrazić swoje uznanie. Kliknij przycisk poniżej, aby utworzyć konto!
Aktualnie przeglądający (1 użytkowników)
Goście (1)