- Baigiau magistrantūra 2009.
- Darbo tema “Nestabilumo modeliavimas finansų rinkose”, vadovas prof. A. Račkauskas.
- 4 metai analizavau akcijas mažam norvegų investiciniam banke.
- 1 metai konstravau bankroto tikimybės modelius DNB klientam.
- Nuo 2013 metų pabaigos dirbu Vinted.
- 2013 įstojau į doktorantūrą pas prof. A Račkauską.
“Make second hand the first choice worldwide”
- Orientuota išimtinai į merginas.
- El. platforma kur galima keistis, parduoti drabužius.
- > 2 mln. aktyvių narių.
- Veikla 7 šalyse, įskaitant USA.
- Šiuo metu rinkoje yra ~21 mln. rūbų.
- Apie 30 000 sandorių per dieną.
- Iki 19 mlrd. įvykių per mėnesį.
- Iki 700 mln. įvykių per dieną.
- Įvykiai papildomi duomenimis iš
- aplikacijos duomenų bazių (pvz. tranzakcijų duomenys);
- trečių šalių duomenimis (Facebook ads api, Zendesk api, adjust.io ir t.t.);
- importuojamais duomenimis iš csv failų.
- user.open.app
- user.view.screen
- user.favorite.item
- user.follow.brand
- user.follow.user
- list.show.item
- user.filter.items
- user.start.conversation
- sharing.item.share
- seller.make.offer
- buyer.buy
- …
- 38 serverių klasteris, atviro kodo programos pritaikytos paskirstytiems skaičiavimams
- Dažniausiai duomenys agreguojami iki lengviau apdorojamo kiekio (mln. eilučių vietoj mlrd.)
- Šiuo metu naudojami:
- naujo aplikacijos funkcionalumo testavimui (A/B testai);
- verslo ataskaitų generavimui;
- add hoc verslo klausimų atsakymui.
file:img/hive.png
- Tikslas turėti didelę aktyvių narių populiaciją.
- Kaip padidinti gimstamumą, minimizuoti mirtingumo lygi (migraciją).
- Stebėti ar nauji nariai geresni/blogesni už senus.
- Stebėti ar visi nariai nepablogėjo/nepagerėjo.
- 2 naujų narių šaltiniai: marketingas ir viruliškumas.
- Tikslas panaudoti FDA ir laiko eilučių modelius prognozuojant mirtingumą, gimstamumą, migraciją ir juos apjungti į bendrą populiacijos modelį.
- Tegu \(y_t(x)\) yra empirinio gimstamumo ar mirtingumo lygio logaritmas amžiui \(x\), laiko momentu \(t\).
- Tariame kad egzistuoja glodi funkcija \(f_t(x)\) kuria stebime diskrečiuose taškuose \(x\).
- Tada mūsų stebėjimai yra \({x_i, y_t(x_i)}, t = 1, …, n, i = 1,…,p\) kur
\[y_t(x_i) = f_t(x_i) + σ_t(x_i)εt,i, \tag{1}\] \(εt,i\) yra nepriklausomi \(∼ N(0,1)\), \(σ_t(x_i)\) leidžia variacijai priklausyti nuo laiko \(t\) ir amžiaus \(x_i\).
- Randame \(f_t(x), ∀ t\, x_i\) naudodami neparametrinius suglodinimo metodus.
- Išskaidome gautas kreives bazinėmis funkcijomis naudojant sekanti modelį: \[f_t(x) = μ(x) + ∑k=1^K βt,k φ_k(x) + e_t(x), \tag{2}\] kur \(\u(x)\) yra \(f_t(x)\) vidurkis per metus, \({φ_k(x)}\) yra ortogonalios basinės funkcijos randamos principinių komponenčių metodu, \(e_t(x) ∼ N(0, v(x))\).
- [@3] Laiko eilučių modeliu įvertiname \({βt,k}, k=1,…,K\).
- Prognozuojame koeficientus \({βt,k}, k=1,…,K\) norimam periodų kiekiui į ateitį.
- Naudodami prognozes kartu su (2) gauname prognozes \(f_t(x)\) ir \(y_t(x)\).
- Klaidų variacijos įverčiai iš (1) ir (2) naudojami surandant prognozės pasikliautinuosius intervalus.
R.J Hyndman prezentacija
- Reikia atsižvelgti ir į tai kad narys gali sugrįžti po ilgo periodo neaktyvumo.