danchyy

Reputacija
4
Bodova
99
Analiza
4
Ocjena
2
Anketa
0

Analize

21.05.
Surfin USA: tko će osvojiti naslov u NBA ligi?

Ovog puta ide nešto kraći post no prethodni moji postovi.

Nisam uspio uploadati sliku (dosta sporo je trajalo) pa evo link na taj gif:

Složio sam shot chart gif za Brooka Lopeza kroz godine. Na njemu se dosta dobro vidi kako lijepo prelazi s poludistance na tricu te ima sve manje i manje takvih šuteva s poludistance. Dapače šuteva izvan reketa bi se na prste obje ruke moglo nabrojiti. Sve je veći trend takve tranzicije centara što je najbolji pokazatelj promjene stila igre u NBA ligi.

Evolucija Brooka Lopeza kroz shot chartove
Ovog puta ide nešto kraći post no prethodni moji postovi. Nisam uspio uploadati sliku (dosta sporo je trajalo) pa evo link na taj gif: Složio sam shot chart gif za Brooka Lopeza kroz godine. Na njemu se dosta dobro vidi kako lijepo prelazi s poludistance na tricu te ima sve manje i manje takvih šuteva s poludistance. Dapače šuteva izvan reketa bi se na prste obje ruke moglo nabrojiti. Sve je veći trend takve tranzicije centara što je najbolji pokazatelj promjene stila igre u NBA ligi.
Evolucija Brooka Lopeza kroz shot chartove
Ovog puta ide nešto kraći post no prethodni moji postovi. ...
Je li gif tvoj rad ili si ga negdje pronašao? - BruceWayne, 22.5.19. 15:16, 0 0 0
Moj rad da, zaboravio sam linkati https://github.com/danchyy/Basketball_Analytics/blob/master/Scripts/2018_19_season/brook_lopez_evolution/brook_lopez.ipynb, ovdje je kod - danchyy, 22.5.19. 17:56, 0 0 0
ODlično, svaka čast. - BruceWayne, 22.5.19. 18:56, 0 0 0
hvala :) - danchyy, 22.5.19. 23:42, 0 0 0
15.05.
Surfin USA: tko će osvojiti naslov u NBA ligi?

Iako smo već duboko u playoff fazi, još uvijek nije poznat MVP za prethodnu sezonu pa sam odlučio pronaći podatke i probati napraviti nekakve predikcije pomoću tehnika strojnog učenja.

Pronašao sam podatke na basketball-reference stranici. Podaci glasanja za MVP-a lige sežu sve do 1968-69 sezone, no uzeo sam samo one od 1980-81 sezone pošto su tada počeli novinari odlučivati o pobjedniku. Evo primjera kako izgledaju podaci za 2015-16 sezonu.

Također ovdje sam pasteao sažetu verziju te tablice.

Most Valuable Player Table

 Voting Per GameShootingAdvanced
RankPlayerAgeTmFirstPts WonPts MaxShareGMPPTSTRBASTSTLBLKFG%3P%FT%WSWS/48
1 Stephen Curry 27 GSW 131.0 1310.0 1310 1.000 79 34.2 30.1 5.4 6.7 2.1 0.2 .504 .454 .908 17.9 .318
2 Kawhi Leonard 24 SAS 0.0 634.0 1310 0.484 72 33.1 21.2 6.8 2.6 1.8 1.0 .506 .443 .874 13.7 .277
3 LeBron James 31 CLE 0.0 631.0 1310 0.482 76 35.6 25.3 7.4 6.8 1.4 0.6 .520 .309 .731 13.6 .242

Provided by Basketball-Reference.com: View Original Table
Generated 5/15/2019.

Uz prethodne podatke, scrapeao sam web basketball-reference stranice za neke napredne statistike koje nisu bile dostupne, poput BPM, PER, TS%, i slično.

Pune podatke možete vidjeti na mom Github repozitoriju.

DEFINIRANJE PROBLEMA

Nakon što su podaci otprilike definirani, može se definirati problem koji će algoritmi strojnog učenja rješavati. Pošto je ovo zadatak rangiranja u svojoj suštini, a nema mnogo out of the box rješenja za taj problem, odlučio sam koristiti regresijski pristup (predviđanje vrijednosti) za rješavanje problema. 

Vrijednost koja će se predviđati jest Share stupac iz podataka koje sam linkao. Taj broj će uvijek biti između 0 i 1 i predstavlja udio glasova koje je igrač osvojio (zapravo udio bodova koje je igrač dobio u glasanju).

Dakle, ovdje praktički želim modelirati glasanje medija, tj želim predvidjeti kako će novinari glasati. Naravno ovdje izuzimamo bilo kakvu subjektivnost koja može biti prisutna kod njih, jer nije baš lako mjerljiva.

No odmah naletavamo na problem jer su ovi podaci vrlo nebalansirani, na histogramu za award share vrijednost, odnosno vrijednost koju želimo predvidjeti, može se vidjeti da je jako puno vrijednosti na razini 0.0* što je veliki problem.

ODABIR ZNAČAJKI ZA MODEL

Prije no što opišem način na koji sam trenirao i validirao model, prvo ću se dotaknuti odabira značajki i njihovog značenja. Mislim da će većina vas znati za većinu statistika koje su navedeni u podacima. No svejedno ću opisati nekoliko naprednih statistika.

PER stoji za Player Efficiency Rating, to je praktički zbrajanje svih pozitivnih i negativnih statistika uz neke sitne modifikacije.

BPM predstavlja Box Plus Minus i to je napredna statistika za evaluiranje kvalitete igrača i njegov doprinos ekipi. Uzima neke team based statistike u obzir, poput REB%, AST%, koje znači udio svih ekipnih skokova/asistencija koje je igrač uzeo dok je bio na terenu. Slično za ostale statistike.

TS_PCT stoji za True Shooting Percentage, i izračun je sljedeći: PTS / (2 * (FGA + 0.44 * FTA)) * 100

USG_PCT je skraćenica za Usage Percentage i to je procjena koliko timskih akcija igrač iskorištava dok je na terenu, izračun se može naći ovdje.

I za kraj, WS WS_per_48 stoje za Win Shares i Win shares per 48 minutes. Ta statistika pokušava podijeliti timski uspjeh na pojedince unutar ekipe.

Odabir značajki

Dosta tih statistika je vrlo slično pa sam odlučio izbaciti one koje ne doprinose sa mnoštvom informacija. Iskoristio sam nekoliko postupaka kako bih odlučio koje nisu potrebne.

Prvo je korištenjem uzajamne informacije, rezulati "bitnosti" značajka su sljedeći:

  • ws: 0.2884
  • per: 0.2811
  • ws_per_48: 0.2592
  • bpm: 0.2013
  • pts_per_g: 0.1482
  • usg_pct: 0.1053
  • win_pct: 0.0973
  • fta: 0.0948
  • ts_pct: 0.0872
  • fga: 0.0871
  • trb_per_g: 0.0695
  • mp_per_g: 0.0668
  • fg3a: 0.0355
  • ft_pct: 0.0311
  • ast_per_g: 0.0279
  • stl_per_g: 0.0139
  • fg_pct: 0.0089
  • blk_per_g: 0.0066
  • fg3_pct: 0.0000

Nakon toga sam iskoritio Random Forest Regressor. Na način da se natrenira jedna instanca modela te se pronađu najbitnije značajke za taj model. Ovo je rezultat:

  • ws: 0.3911
  • win_pct: 0.1326
  • per: 0.0938
  • bpm: 0.0537
  • ws_per_48: 0.0428
  • fga: 0.0368
  • usg_pct: 0.0310
  • ft_pct: 0.0263
  • ast_per_g: 0.0253
  • mp_per_g: 0.0251
  • fg_pct: 0.0231
  • fta: 0.0213
  • pts_per_g: 0.0183
  • fg3_pct: 0.0159
  • ts_pct: 0.0155
  • trb_per_g: 0.0153
  • blk_per_g: 0.0118
  • stl_per_g: 0.0103
  • fg3a: 0.0101

I za kraj, pronašao sam korelacijsku matricu između značajki, to mi je čak najviše pomoglo jer je to dobar način za vizualiziranje featurea koji su međusobno povezani što često nije dobro za modele poput linearne regresije te da pronađem značajke koje su korelirane s ciljnom vrijednošću (što je dobro).

Maknuo sam sve značajke/statistike koje su međusobno jako korelirane ili one koje predstavljaju praktički istu stvar (npr. TS_PCT i FG_PCT). No svejedno sam ostavio neke koje su mi se činile kao logičan odabir što nije možda u potpunosti korektno, no nekad treba imati hunch :)

Ovo su finalne značajke koje koristim:

  • ts_pct
  • bpm
  • mp_per_g
  • pts_per_g
  • trb_per_g
  • ast_per_g
  • stl_per_g
  • blk_per_g
  • ws
  • win_pct

Pokušao sam natrenirati nekoliko modela sa svim značajkama i rezultati su bili generalno lošiji što je dobar pokazatelj da odabir ovih značajki ima smisla i validan je.

TRENIRANJE I VALIDACIJA

Uvijek je poželjan postupak Cross-Validationa kada se radi sa postupcima strojnog učenja te sam ih i ja ovdje iskoristio. Pošto sam imao na raspolaganju 38 sezona te trebalo je odlučiti između nekoliko vrsta modela i mnoštva parametara koje ih predstavljaju odlučio sam pronaći hiperparametre tako da sam uvijek modele trenirao na 37 sezona, a validirao rezultate na 1 preostaloj sezoni. Glavna metrika je bila Mean Squared Error za svaku od tih sezona te sam u konačnici uprosječio tih 38 rezultata i po tome rangirao modele i parametre. Uz to koristio sam i mjeru točnosti za najboljeg igrača, i najboljih 5 igrača.

Ovo su modeli koje sam koristio:

  • Linear Regression
  • Ridge Regression
  • Gradient Boosting Regressor
  • Random Forest Regressor
  • SVR

Također iskoristio sam polinomijalne značajke 2 i 3. stupnja te pokušao sam skalirati podatke između 0 i 1. 

Potpune rezultate možete vidjeti na GitHub repozitoriju u sljedećim fajlovima: reg_results_mse_sorted.txt, reg_results_sorted_top_1.txt, and reg_results_sorted_top_5.txt.

PREDIKCIJE ZA 2018-19 SEZONU

I za kraj evo predikcija za ovu sezonu, prvo ću prikazati rezultate za nekoliko modela koji su bili najbolji po Mean Squared Error metrici.

Gradient Boosting Regressor

Druge varijacije ovog modela, odnosno modeli s drukčijim parametrima su imali slične rezultate te je gotovo uvijek Harden bio na prvom mjestu.

Random Forest Regressor

Ovaj model je također rekao Harden, no kada sam isprobao druge parametre dobio sam malo drukčije rezultate.

Ridge Regression

Ovo je regularizirana linearna regresija.

Linearna Regresija

Najzabavniji rezultati.

Pošto je ovo najjednostavniji algoritam, i poprilično glup algoritam, može se vrlo lako prenaučiti na nekim značajkama i onda dođe do ove situacije. 

Support Vector Regression

Varijacija SVM modela za regresiju.

UPROSJEČENE PREDIKCIJE

Uz predikcije po pojedinačnim modelima, također sam izvrtio predviđanje na top 50 modela po MSE metrici.

Harden ima vrlo malu prednost ispred Giannisa, nakon njih slijedi Jokara, a poslije njega je sve tu vrlo gusto, iako će te vrijednosti u realnosti biti puno manje.

ZAKLJUČAK

Čestitke Jamesu Hardenu na još jednom MVP naslovu! Ili bar tako kažu ovi algoritmi. Vidjet ćemo za mjesec dana što će se dogoditi i hoće li ovi modeli biti imalo precizni. Nekako mi se čini da su novinari skloniji Giannisu no Hardenu, što će uvelike utjecati na konačne rezultate, al eto, Harden je ipak imao vrlo dobru sezonu i nosio svoju ekipu.

Ovdje imate link na Jupyter Notebook u kojem je kod za sve ovo što sam opisao.

Također napisao sam članak na mediumu (praktički ovo, al engleski).

Uživajte i nadam se da je bilo zanimljivo :)

Predviđanje MVP-a NBA lige za 2018-19 sezonu koristeći strojno učenje
Iako smo već duboko u playoff fazi, još uvijek nije poznat MVP za prethodnu sezonu pa sam odlučio pronaći podatke i probati napraviti nekakve predikcije pomoću tehnika strojnog učenja. Pronašao sam podatke na basketball-reference stranici. Podaci glasanja za MVP-a lige sežu sve do 1968-69 sezone, no uzeo sam samo one od 1980-81 sezone pošto su tada počeli novinari odlučivati o pobjedniku. Evo primjera kako izgledaju podaci za 2015-16 sezonu. Također ovdje sam pasteao sažetu verziju te tablice. Most Valuable Player Table Voting Per GameShootingAdvanced RankPlayerAgeTmFirstPts WonPts MaxShareGMPPTSTRBASTSTLBLKFG%3P%FT%WSWS/48 1 Stephen Curry 27 GSW 131.0 1310.0 1310 1.000 79 34.2 30.1 5.4 ...
Predviđanje MVP-a NBA lige za 2018-19 sezonu koristeći strojno učenje
Iako smo već duboko u playoff fazi, još uvijek nije ...
Fantastično , koristiš li R osim Pythona, pruža odlične alate za vizalizaciju - chelsea_2012, 16.5.19. 13:11, 0 0 0
Hvala :) R je super al nažalost jako malo sam ga koristio. Al zapravo sam preko njega ušao u cijeli svijet vizualizacije i grafova preko ovog posta: https://thedatagame.com.au/2015/09/27/how-to-create-nba-shot-charts-in-r/ - danchyy, 16.5.19. 21:58, 0 0 0
02/2019
Surfin USA: tko je prvi favorit Istočne konferencije u NBA?

Puno ljudi voli Jamesa Hardena, no još više ne podnosi njegov stil igre. No bez obzira na to, Hardenove brojke iz ove sezone su možda najimpresivnije u modernoj NBA ligi. Postavlja nevjerojatne brojke, a njegova efikasnost ne pada puno (ili čak, ne pada uopće) iako ima vrlo veliki broj šuteva. Sve to postiže zahvaljujući svojem najboljem oružju, koje je još obražnije od njega.

One Man Army

Nema potrebe tražiti napredne statistike kako bismo shvatili da James Harden nosi veliki teret na svojim leđima. Trenutno ima niz od nevjerojatnih 31 nastupa s 30 ili više koševa, što je najviše u povijesti NBA lige izuzmemo li velikog Wilta Chamberlaina. No njegova vremena su bila vremena neke druge košarke, zato ću se ja skoncentrirati na razdoblje od 1979-80 do danas, od sezone kada je uvedena linija za tri poena. U tom razdoblju, drugi po broju uzastopnih utakmica s 30 ili više koševa je Kobe Bryant s 16, a treći je Tracy McGrady s 14, oboje su taj pothvat postavili u 2002-03 sezoni.

Ta činjenica da Harden ima već 15 nastupa više nego Kobe s 30 ili više koševa me navela da idem istražiti Hardena i njegovu statistiku ove sezone. Prva stvar koju sam išao gledati jest omjer asistiranih/neasistiranih zabijenih šuteva iz igre. Uzeo sam podatke od 1999-00 sezone pa sve do danas, praćenje asistiranih i neasistiranih šuteva je započelo još 96/97, no to sam izostavio jer je trica bila pomaknuta malo bliže košu pa su podaci iskrivljeni.

Na prethodnoj slici možete vidjeti omjer assistiranih i neasistiranih zabijenih šuteva iz igre za top 10 igrača po broju poena iz svake sezone od 1999-00 sezone pa do sada. Označio sam i ukupno najboljih 10 igrača po broju poena u cjelokupnom tom razdoblju. Zanimljivo je ovdje što Westbrook, Iverson i Lebron imaju skoro pa podjednak broj pogođenih šuteva iz igre. I iako je kružić kod Hardena koji označava broj pogođenih slobodnih bacanja malo veći od Westbrooka, Harden je imao samo 50 više pogođenih slobodnih bacanja, što ga još uvijek ostavlja na otprilike 150 poena prednosti ispred Rusella.

Sve te stvari su me dovele do sljedećeg grafa, na kojem možete vidjeti kako je prednost u broju poena Harden zapravo stekao pomoću nevjerojatno velikog broja neasistiranih trica. Ima više od 100 neasistiranih trica ispred sljedećeg tricaša kojem nije ime James Harden.

Dribbles and points per touch

Vidjevši kako Harden ima nevjerojatno velik broj neasistiranih šuteva iz igre, htio sam provjeriti korelaciju između broja driblinga (dribling je ovdje obično vođenje lopte, ne crossoveri i slične stvari) na svakom dodiru i broj poena kojeg zabija na svakom dodiru.

Samo 2 igrača imaju više driblinga po dodiru, i to su Tony Parker i DJ Augustin. Generalno gledajući, igrači koji imaju više od 4 driblinga po dodiru su Point Guardovi, što je logično jer moraju prevesti loptu preko terena, zvati akcije, itd. No Harden ima veliki broj poena po dodiru usprkos tome što ima skoro najviše driblinga od svih u ligi. Time možemo zaključiti da su svi ti driblinzi usmjereni u nešto korisno, odnosno u kreiranje vlastitog šuta. Što nam još više pojačava dojam One Man Army efekta.

No ne znam je li možda još impresinija činjenica da Paul George ima 0.5 poena po dodiru. Što bi reklo da svaki drugi dodir rezultira jednim poenom. Stvarno se čini kao savršen suigrač Westbrooku te kao vrlo ozbiljan kandidat za MVP-a.


## Shot chart

Drugi odjeljak ovog posta biti će psovećen analizi shot charta Jamesa Hardena, kao i njegovom odabiru šuteva. Nešto slično kao u mojoj prethodnoj analizi o Luki Dončiću.

Za početak, evo običnog "shot charta" svih Harednovih šuteva iz tekuće sezone. Uzima strašno veliki broj trica, no još bitnije, vrlo je učinkovit u tim tricama te postiže visok prosjek. U pravom Moreyball duhu ima vrlo malo mid-range šuteva pa je postotak zapravo čak i zanemariv.

Step Back Jump Shot

Sada dolazimo do najzanimljivijeg dijela ovog posta, i Hardenovog daleko najopasnijeg oružja, no ujedno i najkontroverznijeg poteza iz njegovog arsenala, The Step Back. Ako pogledate video vidjet ćete da ima nekoliko pokušaja koji definitivno izgledaju kao koraci, i tu nastaje cijela zbrka. No ja neću zadirati u to jesu li to koraci ili ne, samo ću pokazati koliko absurdno dobar je James Harden u izvođenju Step Back Jumpera.

Ako ste pogledali post o Dončiću koji sam linkao malo ranije, vidjet ćete da sam tamo napravio sirov shot chart. Pa sam isto napravio i ovdje.

Rezultat je bio potpuno neinformativan i neiskoristiv te nije imao nikakvog smisla. To je zato jer Harden ima nevjerojatno velik broj Step Backova, gotovo trećina svih njegovih šuteva iz igre se klasificiraju kao Step Back Jump Shot (417 od 1316). Sirov shot chart ne može nikako prikazati učinkovitost pa sam iscrtao uobičajeni, binned shot chart. (ne znam baš kako bih preveo Binned na hrvatski, rasterizirani?).

Ovaj graf je jednostavno impresivan. Usporedba s prosječnim postotkom lige se ovdje odnosi na isti način kao na onaj prvi Shot Chart. Odnosno, ja ovdje uspoređujem postotak Step Back Jumpera sa SVIM vrstama šuteva. Možemo zaključiti da je James Harden čak opasniji kada izvodi Step Back Jump Shot nego običan šut.

No ukoliko želite još detaljnije vidjeti koliko je on nevjerojatno dobar u tom šutu, spremio sam dodatan graf.

Na ovoj slici sam prikazao broj pogođenih Step Backova za 3 Jamesa Hardena i postotak trice kojim je to postigao i usporedio sa tricama najboljih 150 tricaša ove sezone. Fora je u tome što su njihovi šutevi bilo koje vrste, običan, iz bloka, iz vođenja, itd.. kako je kome drago. Harden je samo koristeći samo step back u top 15 šutera i to sa vrlo visokim prosjekom.

Kareem je imao skyhook, Jordan, Kobe i Dirk svoju vrstu Fadeaway šuta, Hakeem je imao Dream Shake, a Harden ima The Step Back. (ovo glupo zvuči na hrvatskom.)

Efikanost i postotak korištenosti

Kada ljudi govore o Hardenu, pričaju o nekoliko stvari:

  • Step Back Jumperima.
  • Enormno velikom broju slobodnih bacanja.
  • O tome kako on uzima velik broj šuteva i nije efikasan.

Točku broj jedan sam objasnio i pokazao koliko je fascinantan u tom području. Za drugu točku neću sada ništa govoriti, dotaknuo sam se kroz to samo malim dijelom u nekoliko grafova, no iskreno Harden čak ni nema toliko puno slobodnih bacanja s obzirom na njegovu korištenost (engl. Usage Rate, od sad ovo koristim).

Prvo da objasnim što znači taj Usage Rate. Prema basketball reference stranici, Usage Percentage(Rate) je procjena postotka timskih akcija koje igrač iskoristi dok je na terenu. Još specifičnije, to bi značilo da je Usage Rate mjera koliko akcija igrač završi šutom, slobodnim bacanjem ili turnoverom u usporedbi koliko su ostali igrači to radili dok je taj igrač bio na terenu.

Bacimo sad pogled na ovaj graf koji nam prikazuje efikasnost i korištenost igrača. Na x osi je prethodno objašnjeni Usage rate, dok je na y osi True Shooting Percentage (PTS / (2 * (FGA + 0.44 * FTA))). Harden ima daleko veći Usage Rate od svih ostalih igrača (Embiid je više od 7% iza njega), no njegov TS% je još uvijek strašno visok. Vrijedi još pohvaliti Curryja, Giannisa i Duranta koji imaju vrlo visok postotak.

A ova prethodna slika prikazuje top 100 scorera (PPG do All-Star utakmice) od 1979-80 do danas. Nisam uključio starije igrače jer niti nema podataka iz tog vremena o Usage Rateu.

Prema basketball-referenceu, Harden ima drugi najveći Usage rate ikad, odmah iza Westbrooka i njegove monstruozne 2016-17 sezone. No on ima gotovo 7% bolji TS%.

Označio sam top 10 skorera u tom periodu te Barkleya i Curryja koji je imao strašno efikasnu 2016-17 sezonu.

Ova posljednja dva grafa bi trebala biti vrlo jasan znak da je Harden vrlo efikasan i učinkovit igrač iako ima veliku odgovornost na sebi vodeći cijeli napad Houston Rocketsa.

Scoring based on type of the situations

Zadnja tema koje ću se dotaknuti su poeni u ovisnosti u situaciji/akciji. Odlučio sam takav način poentiranja prikazati u obliku Parallel grafa.

Pokušao sam vizualizirati kako top 5 kandidata za MVP nagradu postižu poene. Sivim crtama je označeno sveukupno top 50 skorera ove sezone. Oni su tu da samo dočaraju generalnu distribuciju poena po raznim situacijama. Također nam fino prikazuju koliko Harden odmiče u poenima u probijanju i Pull Up šutevima te koliko zapravo malo ima Catch and Shoot poena. Ima smisla da ima malo poena u tom području pošto ima samo 70 asistiranih šuteva iz igre, no čovjek bi pomislio da će taj broj bit malo veći pošto je ipak bek.

Nakon toga sam analizirao samo igrače Houston Rocketsa.

Rezultati su očekivani. Capela i Faried su zaduženi za dominiranje reketom i tu i tamo nekim šutem s ruba reketa. Svi ostali su fokusirani na Catch and Shoot situacija (čak 6 igrača s oko 4+ poena po utakmici!!). Samo Chris Paul i Eric Gordon imaju nekad priliku kreiranja svog šuta. Zanimljivo je pogledati opet ovaj prethodni chart koji ima top 50 igrača i vidjeti kako Capela vodi ligu u poenima u reketu. Zasigurno pomaže imati Paula i Hardena kao playmakere.

Assist charts

I za kraj, odlučio sam pogledati gdje se točno nalaze pogođeni šutevi koje je asistirao Harden. Inspiraciju sam dobio iz posta Nylon Calculus, no nažalost nisam uspio naći podatke od kuda je Harden započeo dodavanje (odnosno njegovu lokaciju).

(Slika je ispala mala, link na malo bolju kvalitetu slike)

Da ne duljim, evo jednostavnog assist charta. Izgleda poprilično meh, no nisam znao kako bih ga trenutno uljepšao, za prvu verziju će poslužiti svrsi. Impresivno da top 6 strijelaca iz Houstona ima samo 8 šuteva iz poludistance (čak i manje ako ne računamo neke šuteve PJ Tuckera). Izgleda kako Harden najčešće izbacuje loptu tokom probijanja na koš ili samo hrani Capelu/Farieda u reketu. Kao što sam rekao, Houston živi Moreyball.

## Zaključak

Za kraj ovog posta, rekao bih da je bilo vrlo zabavno istraživati Hardena i njegovu statistiku. Gdje god pogledate naići ćete na neki novi rekord i nevjerojatnu statistiku koju je postigao.

Ljudi su prestrogi prema njemu, ove godine nosi ogroman teret na leđima, ne puca pod njim, više nego solidan u obrani te vuče Capelu, Paula, Gordona i D-League igrače do solidne pozicije u playoffu. Po meni on je glavni kandidat za MVP titulu, iako i Giannis, PG i Curry imaju vrlo validne kandidature. Biti će zabavna druga polovica (manje čak) NBA lige te još zabavniji playoff. A još uzbudljivija će biti utrka za MVP titulu.

Svi grafovi su stvoreni pomoću statistika iz stats.nba.com ili basketball-reference. Svi grafovi su stvoreni pomoću Python, koristeći bibilioteke matplotlib i seaborn. Kod je javno dostupan u obliku Jupyter Notebook-a na mom github repozitoriju.

Isti članak sam napisao i na engleskom na mediumu.

Lijep pozdrav i uživajte!

Voljeli ga ili ne, Harden ima povijesno dobru sezonu
Puno ljudi voli Jamesa Hardena, no još više ne podnosi njegov stil igre. No bez obzira na to, Hardenove brojke iz ove sezone su možda najimpresivnije u modernoj NBA ligi. Postavlja nevjerojatne brojke, a njegova efikasnost ne pada puno (ili čak, ne pada uopće) iako ima vrlo veliki broj šuteva. Sve to postiže zahvaljujući svojem najboljem oružju, koje je još obražnije od njega. One Man Army Nema potrebe tražiti napredne statistike kako bismo shvatili da James Harden nosi veliki teret na svojim leđima. Trenutno ima niz od nevjerojatnih 31 nastupa s 30 ili više koševa, što je najviše u povijesti ...
Voljeli ga ili ne, Harden ima povijesno dobru sezonu
Puno ljudi voli Jamesa Hardena, no još više ne podnosi ...
Impresivna analiza. - Fenix22, 23.2.19. 14:25, 0 0 0
Fantastično, svaka čast. - BruceWayne, 23.2.19. 20:31, 0 0 0
Hvala vam! - danchyy, 23.2.19. 23:42, 0 0 0
Jako zanimljiva analiza, svaka čast - JoHayes13, 24.2.19. 18:29, 0 0 0
Bravo! - danijel_os, 25.2.19. 3:52, 0 0 0
01/2019
Tribina hipoteza

Luka Dončić zasigurno je rookie godine u sezoni 2018.-1918. Njegovi nastupi održavaju Dallas Maverickse u realnoj mogućnosti dosizanja ovogodišnjeg doigravanja sa samo 5.5 utakmica od posljednjeg mjesta koje vodi u playoff. On postiže nevjerojatne brojke kao rookie koje su postizali neki od najboljih igrača ikada te trenutno najboljih aktivnih igrača. O tome ću se detaljno dotaknuti kasnije, jer za sada postoje neka specifična područja njegove igre koje želim istražiti. Clutch time is Luka time Kad god sam gledao highlightse Dončićevih nastupa uvijek vidim da je Dončić igrač koji vodii napade Mavsa kasno u igri. To me natjeralo da pogledam njegove brojeve u "clutch timeu" (Clutch time je definiran kao trenutci u utakmici kada je manje od 5 min do kraja utakmice i manje od 5 poena razlike), i bili su prilično impresivni. Na sljedećoj slici: možete vidjeti 60 najboljih strijelaca u "clutch timeu".

Na x osi su prikazani ukupni poeni, a na y osi je TS%. Uz Dončića, neki drugi igrači koji se ističu su Oladipo (on je točka iznad Dončića s mnogo većim postotkom) i top 3 igrača u ukupnom broju poena (Kemba, Harden i Kyrie). No s obzirom na činjenicu da je Dončić rookie od tek 19 godina, ovi brojevi su jednostavno nevjerojatni. Tako sam se zapitao kako su rookieji u posljednjih nekoliko godina nastupali u "clutch timeu". Uzeo sam statistike od 2003-04 (prva sezona LeBrona) i dobio sljedeću sliku:

Iz tog grafa očito da je Luka jedan od najboljih novaka u tom rasponu. Brandon Jennings, Kevin Durant, Tyreke Evans i Derrick Rose su igrači s više poena nego Dončić. Također je vrijedno spomenuti da je njihova statistika do All Star igre, tako da bi Dončić mogao malo podići ove brojeve u sljedećih nekoliko tjedana. Ostatak prve desetorice u ukupnom broju poena su Lillard, Markkanen, Mitchell, Westbrook i Chris Paul, što je stvarno dobro društvo.. Dončićevi Shot chart i vrsta šuta/akcije Shot chartevi su moje omiljene stvari za proučavanje tijekom analize. Za početak imamo običan shot chart svih šuteva tokom ove sezone:

Shot chart nije po ničemu izuzetan, ali općenito možemo vidjeti da je Luka iznad prosjeka u gotovo svim zonama. I da on uzima puno više šuteva za tri i ne uzima puno mid-range šuteva (iako je ovo daleko od pravog "moreyball" shot charta). Da se nadovežem na prethodnu analizu "clutch timea", ovdje je prikazan shot chart tokom "clutch timea" za ovu sezonu:

Vrlo je efikasan na mid rangeu iako je većina šuteva došla s područja za tri poena i ispod koša.. NBA ima nekoliko kategorija akcija kojim kategoriziraju svaku akciju u kojoj igrač sudjeluje. Pokušao sam vizualizirati koje akcije Dončić preferira i koliko je efikasanu njima. Sljedeća slika to prikazuje:

Važno je napomenuti da to nisu svi šutevi koje je Dončić zabio/promašio već samo oni koji su imali neku kategoriju, a ako moram pretpostavljati kakve bi to bile preostale vrste akcija vjerojatno bi to bilo nešto poput "Catch and Shoot" i sličnih vrsta akcija. Dakle, čak i ako kažemo da su sve ostale akcije "Catch and Shoot", to bi nas i dalje ostavilo s mnogo više akcija koje je sam stvorio. To pobija svaku sumnju koja je postojala prije NBA drafta, gdje su stručnjaci postavili pitanje može li Dončić stvoriti svoj šut s obzirom na njegov prosječni atletizam. Luka i (Step Back) jump shotovi Nakon toga sam pokušao vizualizirati vrstu šuteva koje Luke uzima.

Na prethodnoj slici možete vidjeti kako to izgleda. Tip šuta koji se zove samo "Jump Shot" predstavljat će "Catch and Shoot" akciju o kojoj sam ranije govorio. Iz ovog grafikona možemo vidjeti da Luka već razvija svoj "signature move", a to je Step Back šut, što je vrlo težak potez. Želio sam provjeriti učinkovitost svih drugih igrača, ali bilo bi vrlo teško dobiti sve podatke (zbog problema s podacima iz nba apija) pa sam samo pogledao neke igrače koji bi trebali biti dobri scoreri i šuteri.

Ovdje je slika s nekim od ovogodišnjih najboljih strijelaca (barem onima koji ne bilježe većinu iz reketa / ispod koša) i Lukom Dončićem. On zapravo nije toliko daleko od Kyriea, samo 3 poena po utakmici. Stvarno je zanimljivo vidjeti da iako je rookie, vrlo je blizu efikasnosti sa svim tim igračima i čak ima više šuteva od svih, osim Harden-a koji uzima apsurdni broj step back šuteva. Imati tako moćan alat u dobi od 19 godina bit će velika prednost za Dončića. Za kraj ove krateka analize Step Back jumpera, ovdje se nalazi slika koja sadrži sve Step Back jumpere koji je Dončić uzeo ove sezone. 

Assisti Uz izvrsno poentiranje, Luka se ističe dobrim "court visionom". U prosjeku ima 5,4 asistencije po utakmici, što je druga brojka među rookiejima samo iza Trae Young-a. Njegov AST% (postotak svih Field Goalova suigrača kojima je taj igrač asistirao, tako da 33% znači da je igrač x asistirao 33% ostalih Field golova suigračima) također je prilično visok i gotovo na razini Trae Young-a (27,5% vs 36,5%) ) ali s obzirom na činjenicu da je JJ Barea pretrpio ozljedu prije nekoliko utakmcia i da je imao najviši AST% lige s 45%, Dončićeve brojke mogle bi se dodatno povećati tijekom ostatka sezone. U ovih nekoliko utakmica bez Baree Dončić je u prosjeku postizao 8.8 asistencija (no samo 6 utakmica). S tim riječima, bio sam zainteresiran vidjeti tko je njegova omiljena meta za asiste u momčadi, a rezultati se mogu vidjeti na sljedećoj slici (https://i.imgur.com/RujddcY.jpg). Deandre mu je najdraža meta i većina je asistencija završila zakucavanjem. Barnes je druga omiljena meta i njegovi poeni su bili na različitijim lokacijama. I to sam vizualizirao u sljedećoj slici:

Izostavio sam tri igrača s najmanje asistiranih koševa, tako da chart izgleda manje zgužvan. Zaključak Luka Dončić ima nevjerojatnu sezonu. Dotaknuo sam se samo nekoliko aspekata njegove igre i pokušao istražiti neke stvari koje se često ne spominju (kao što su Step Back Jumperi). Nisam čak prikazao ni osnovne statistike kao što su PTS/G, REB/G, AST/G, ali Dončić je u tim statistikama u vrhu među svim igračima i u vrhu među rookijeima prethodnih podosta godina. Jedna stvar koju zapravo nisam spomenuo je da je njegov TS% vrlo visok. I to jako vrijedno spomena jer u "3 point era" (1979/80 do danas) je drugi među svim Rookijema u 3PA na 6,7 po utakmici i to radi na 35,6%. Ono što nisam uspio ispravno vizualizirati je Lukaov BPM (Box Plus Minus). On trenutno sjedi na 3.7 što je dovoljno za 11. mjesto među svim rookijeima tijekom tog razdoblja. Da budem iskren, napredne statistike su nekako sumnjive, nisam ulazio u detalje kako bih ih proučavao, ali općenito bih rekao da je BPM stvarno dobar pokazatelj tko će se razviti u All-Star igrača i vjerojatno više od toga. 

Pogled na fenomenalnu sezonu Luke Dončića
Luka Dončić zasigurno je rookie godine u sezoni 2018.-1918. Njegovi nastupi održavaju Dallas Maverickse u realnoj mogućnosti dosizanja ovogodišnjeg doigravanja sa samo 5.5 utakmica od posljednjeg mjesta koje vodi u playoff. On postiže nevjerojatne brojke kao rookie koje su postizali neki od najboljih igrača ikada te trenutno najboljih aktivnih igrača. O tome ću se detaljno dotaknuti kasnije, jer za sada postoje neka specifična područja njegove igre koje želim istražiti. Clutch time is Luka time Kad god sam gledao highlightse Dončićevih nastupa uvijek vidim da je Dončić igrač koji vodii napade Mavsa kasno u igri. To me natjeralo da pogledam njegove ...
Pogled na fenomenalnu sezonu Luke Dončića
Luka Dončić zasigurno je rookie godine u sezoni 2018.-1918. Njegovi ...
Pozdrav. Ja sam ti ispravio i ubacio slike, idući tjedan ćeš moći sam. Ako ti trebala pomoć, slobodno se javi na chat. Također, odlična analiza i dobrodošao na Tribinu. - BruceWayne, 28.1.19. 20:34, 0 0 0
Hvala ti :) Je li dovoljno u HTML-u samo ubacit img tag? - danchyy, 28.1.19. 20:35, 0 0 0
Kada si reputacija 2, onda ne možeš ubaciti slike samostalno. Kada pređeš na razinu 3(idući ponedjeljak) moći će sam preko "upload image" koda. - BruceWayne, 28.1.19. 20:38, 0 0 0
Prati nas

©2017. Vingd, Inc. Sva prava pridržana.