poniedzia艂ek, 13 stycznia 2025

Proces Markowa (艂a艅cuch Markowa)

Proces Markowa jest szczeg贸lnym przypadkiem procesu stochastycznego. Jego cech膮 charakterystyczn膮 jest to, 偶e prawdopodobie艅stwo kolejnego zdarzenia zale偶y jedynie od wyniku poprzedniego zdarzenia, a nie od ca艂ej historii procesu. Przesz艂e stany nie maj膮 wp艂ywu na kolejne wyniki procesu. 

艁a艅cuchy Markowa wykorzystuje si臋 w:

  • Modelowaniu r贸偶norakich system贸w, zmieniaj膮cych stan w spos贸b losowy
  • Prognozowaniu
  • Niekt贸rych algorytmach  

Przyk艂adem procesu Markowa mo偶e by膰 random walker. W tym algorytmie po ka偶dym kroku losujemy kierunek przemieszczania si臋 naszej krzywej, bior膮c pod uwag臋 jedynie punkt, w kt贸rym obecnie si臋 znajduje jej koniec.

Andriej Markow by艂 rosyjskim matematykiem 偶yj膮cym w latach 1856 - 1922, badaj膮cym teori臋 prawdopodobie艅stwa.

Proces stochastyczny

Proces stochastyczny to taki proces, w kt贸rym opisujemy zbi贸r zmiennych losowych na bazie jakiego艣 wymiaru (zbioru indeks贸w), jakim zwykle jest czas. Przyk艂adem procesu stochastycznego mo偶e by膰 na przyk艂ad zbi贸r wypisanych kolejnych wynik贸w rzutu kostk膮 czy kart wyci膮gni臋tych z talii. Obydwa te zdarzenia s膮 losowe.

Rozk艂ad jednostajny ci膮g艂y (Uniform Distribution)

Jest u偶ywany do generowania randomowych liczb, z kt贸rych ka偶da powinna mie膰 takie same prawdopodobie艅stwo wyst膮pienia. Standardowym przyk艂adem jest rzut kostk膮 przyjmuj膮cy warto艣ci od 1 do 6, czy rzut monet膮 daj膮cy wynik orze艂 albo reszka. 

W tym rozk艂adzie, nie mo偶na mie膰 warto艣ci po艣rednich. Rzut ko艣ci膮 nie da nam wyniku 2.5.

sobota, 11 stycznia 2025

Process Poissona

 Process Poissona jest powi膮zany z rozk艂adem Poissona. Badaj膮c go zak艂adamy, 偶e 艣redni czas pomi臋dzy zdarzeniami jest znany, ale dok艂adny czas pomi臋dzy nimi r贸偶ni si臋, nie jest taki sam. Zdarzenia nie zachodz膮 na raz, ale s膮 od siebie niezale偶ne. Sam proces przedstawia seri臋 takich zdarze艅, a dok艂adniej, model wyst臋powania tych zdarze艅 w czasie.

Wykorzystywany jest w wielu dziedzinach nauki i biznesu, w kt贸rych bada si臋 zdarzenia niezale偶ne, wyst臋puj膮ce z podobn膮 cz臋stotliwo艣ci膮:

  • Przewidywanie liczby u偶ytkownik贸w na stronie WWW
  • Przewidywanie ilo艣ci zabookowanych pokoj贸w w hotelu
  • Modelowanie sprzeda偶y produktu
     

Nie b臋dzie pasowa艂 natomiast do zdarze艅 zale偶nych, jak na przyk艂ad op贸藕nienia poci膮g贸w.

Rozk艂ad wyk艂adniczy (exponential distribution)

Ostatnio pisa艂em o Rozk艂adzie Poissona, czyli takim rozk艂adzie, w kt贸rym zdarzenia zachodz膮 ze sta艂膮 cz臋stotliwo艣ci膮 i s膮 niezale偶ne od siebie.

W rozk艂adzie wyk艂adniczym modelujemy czas oczekiwania na kolejne zdarzenie, przyk艂adowo, ile minut minie, mi臋dzy kolejnymi wizytami ptaka w naszym ogrodzie. 

Na podstawie ksi膮zki J. Starmera, na osi x - czas
Na ch艂opski rozum - je艣li jakie艣 zjawisko wyst臋puje co jaki艣 czas regularnie, to im kr贸tszy czas oczekiwania, tym wi臋ksze prawdopodobie艅stwo, 偶e dane zdarzenie wyst膮pi. Przyk艂adowo, je艣li zbadamy awarie oprogramowania, to najcz臋艣ciej dziej膮 si臋 one zaraz po wgraniu zmian, a nast臋pnie jest ich coraz mniej.


czwartek, 9 stycznia 2025

Rozk艂ad Poissona, prawo ma艂ych liczb

Rozk艂ad Poissona nie ma nic wsp贸lnego z trucizn膮, zosta艂 opracowany przez Simeona Denisa Poissona, francuskiego matematyka 偶yj膮cego od 1781 do 1840 roku we Francji.

Opisuje on (rozk艂ad), 偶e dane zdarzenie wyst膮pi okre艣lon膮 ilo艣膰 razy, bior膮c pod uwag臋 艣redni膮 ilo艣膰 danych zdarze艅 w czasie lub przestrzeni. Przyk艂adowo - mo偶emy obliczy膰, ile razy ptaki usi膮d膮 na naszym p艂ocie w ci膮gu godziny, ilu klient贸w odwiedzi sklep od 12 do 15 czy ile request贸w obs艂u偶y backend naszej strony.

Zdarzenia brane pod uwag臋 w rozk艂adzie Poissona powinny by膰 niezale偶ne od siebie, czyli nie ma znaczenia, jaki czas up艂yn膮 od ostatniego zdarzenia. To nie 艂apanie ryb, gdzie pluskanie po wyci膮gni臋ciu du偶ej sztuki, odstraszy pozosta艂e ryby 饟啙 饟啛 饟啚 na kilka minut.

Rozk艂ad dwumianowy, binomial distribution (Rozk艂ad Bernouliego)

Rozk艂ad dwumianowy dotyczy prawdopodobie艅stwa dyskretnego, czyli takiego, w kt贸rym zmienna przyjmuje sko艅czone lub okre艣lone warto艣ci. Przyk艂adem mo偶e by膰 rzut monet膮 lub kostk膮 do gry. W rozk艂adzie dwumianowym mamy takie parametry, jak:

  • Liczba pr贸b n
  • Prawdopodobie艅stwo sukcesu w ka偶dej z pr贸b p
  • Liczba sukces贸w - k

wtorek, 7 stycznia 2025

Ksi膮偶ki na temat ML kt贸re polecam

The StatQuest Illustrated Guide to ML - Josh Starmer

Ksi膮偶ka Josha Starmera ze 艣wietnego kana艂u StatQuest. Mocno w stylu ksi膮偶ek HeadFirst. Dobrze t艂umaczy podstawowe zagadnienia, tak偶e te zwi膮zane ze statystyk膮. 0 kodu.


Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow - Aurelien Geron

Nieco bardziej powa偶na ksi膮偶ka na temat ML

Deep Learning with Python - Francois Chollet

Ksi膮偶ka autora biblioteki Keras

The Elements of Statistical Learning
Data Mining, Inference, and Prediction

Ksi膮偶ka omawiaj膮ca temat od podstaw, dost臋pna za darmo - https://hastie.su.domains/ElemStatLearn/

艣roda, 1 stycznia 2025

W jaki spos贸b filmy z YT mieszaj膮 Ci w g艂owie

Jaki艣 czas temu zauwa偶y艂em powa偶ny problem, zwi膮zany z ogl膮daniem film贸w na YT. Ot贸偶 odnosz臋 wra偶enie, 偶e wi臋kszo艣膰 tw贸rc贸w tworzy filmy nie z w艂asnego przekonania, ale po to, by nabija膰 sobie wej艣cia (0 zaskoczenia). Wprowadza to dezinformacj臋 i prowadzi w艣r贸d widz贸w do niew艂a艣ciwych wniosk贸w i szkodliwych zachowa艅.

Przyk艂adowe tematy

  • Odstawianie kawy
  • Minimalizm
  • Ci膮g艂a migracja z ekosystemu Apple na inne i w drug膮 stron臋
  • Mindfulness
  • Wstawanie o 5 rano 
  • Deep work / Eat that Frog / GTD
  • Kolejny m膮dry trend z USA

Cykl 偶ycia takich temat贸w wygl膮da nast臋puj膮co:

  • Kto艣 nieironicznie m膮dry, zauwa偶a taki trend i pisze o nim ksi膮偶k臋
  • Autor idzie do jakiego艣 popularnego podcastu typu Joe Rogan
  • Pojawiaj膮 si臋 streszczenia ksi膮偶ki, napisane przez osoby, kt贸re by膰 mo偶e przeczyta艂y ksi膮偶k臋
  • Pojawia si臋 tysi膮c angloj臋zycznych nagra艅 na temat opisany w ksi膮偶ce, oczywi艣cie sp艂yconych
  • Pojawia si臋 kilka nagra艅 po polsku, znacznie sp艂acaj膮cych temat
  • Pojawiaj膮 si臋 podcasty po polsku, kt贸re w temat wg艂臋bi膮 si臋 nieco bardziej
  • Temat zaczyna funkcjonowa膰 w 艣wiecie w uproszczonej formie. Przyk艂adowo - m贸wi si臋 o osobach, kt贸re naczyta艂y si臋 o 偶abach (chodzi o ksi膮偶k臋 Eat that frog Briana Tracy), albo o niejedzeniu cukru, dla diety Keto.

Osoby nagrywaj膮ce filmy na YT kieruj膮 si臋 zyskiem oraz trendami. Tworz膮 materia艂y, kt贸re ch臋tnie obejrzysz, bez wg艂臋biania si臋 w temat. Te, kt贸re s膮 bardziej otwarte, czasem same wypr贸buj膮 dan膮 metod臋, a nast臋pnie nagraj膮 o niej film. Przypomnia艂 mi si臋 filmik Nicole W臋c艂awiak:

- Jakby艣 mia艂a dziecko, to by艣 da艂a mu na imi臋 Kontent, bo u Ciebie wszystko to content. :)

Wnioski, do kt贸rych dochodz膮 autorzy, s膮 bardzo cz臋sto powieleniem informacji z internetu, bez wg艂臋bienia si臋 w szczeg贸艂y. 

Szczeg贸lnie denerwuje mnie zalew film贸w typu:

  • Nie u偶ywaj technologii X
  • Nie kupuj Y dop贸ki nie obejrzysz tego filmu
  • X najbardziej szkodliwych 膰wicze艅 / czynno艣ci
  • Jedyny tutorial na temat Z jakiego potrzebujesz

W ka偶dym z tych przypadk贸w jaskrawo wida膰, 偶e autor nie ma celu doedukowa膰 Ci臋 w jakim艣 temacie, tylko namiesza膰 Ci w g艂owie. 

Najwi臋ksz膮 plag膮 moim zdaniem s膮 filmy, pokazuj膮ce rzeczywisto艣膰 w uproszczonej formie. Mo偶na nazwa膰 je hmm, tutorialami z tik-toka (celowo ma艂膮 liter膮). Wed艂ug nich, aby zagra膰 na pianinie, musisz nauczy膰 si臋 kilku cyferek (wtf), sol贸wk臋 na gitarze zagrasz na pustych strunach, a do milion贸w dojdziesz, znaj膮c jaki艣 inny, prosty trick. Gdzie s膮 podstawy - pytam.

Jak m贸wi艂 Alex Hormozi, d艂uga droga jest jedynym skr贸tem.