czwartek, 30 stycznia 2025

Lista LLM-贸w bo偶ych - kalendarium

Obraz wygenerowany przez Qwen

 

 

 

 

 

 

 

 

 

 

Po raz pierwszy us艂ysza艂em o LLM gdy pojawi艂 si臋 Chat GPT. M贸j brat zacz膮艂 go entuzjastycznie u偶ywa膰 na studiach i jako艣 niech臋tnie zacz膮艂em go u偶ywa膰. Pami臋tam, 偶e Chat GPT mia艂 du偶e problemy z logowaniem u偶ytkownika (wylogowywa艂 go losowo po jakim艣 czasie) i z wydajno艣ci膮. Cz臋sto zdarza艂y si臋 problemy z odpowiedziami - chat my艣la艂 my艣la艂 i wyrzuca艂 b艂膮d.

poniedzia艂ek, 13 stycznia 2025

Proces Markowa (艂a艅cuch Markowa)

Proces Markowa jest szczeg贸lnym przypadkiem procesu stochastycznego. Jego cech膮 charakterystyczn膮 jest to, 偶e prawdopodobie艅stwo kolejnego zdarzenia zale偶y jedynie od wyniku poprzedniego zdarzenia, a nie od ca艂ej historii procesu. Przesz艂e stany nie maj膮 wp艂ywu na kolejne wyniki procesu. 

艁a艅cuchy Markowa wykorzystuje si臋 w:

  • Modelowaniu r贸偶norakich system贸w, zmieniaj膮cych stan w spos贸b losowy
  • Prognozowaniu
  • Niekt贸rych algorytmach  

Przyk艂adem procesu Markowa mo偶e by膰 random walker. W tym algorytmie po ka偶dym kroku losujemy kierunek przemieszczania si臋 naszej krzywej, bior膮c pod uwag臋 jedynie punkt, w kt贸rym obecnie si臋 znajduje jej koniec.

Andriej Markow by艂 rosyjskim matematykiem 偶yj膮cym w latach 1856 - 1922, badaj膮cym teori臋 prawdopodobie艅stwa.

Proces stochastyczny

Proces stochastyczny to taki proces, w kt贸rym opisujemy zbi贸r zmiennych losowych na bazie jakiego艣 wymiaru (zbioru indeks贸w), jakim zwykle jest czas. Przyk艂adem procesu stochastycznego mo偶e by膰 na przyk艂ad zbi贸r wypisanych kolejnych wynik贸w rzutu kostk膮 czy kart wyci膮gni臋tych z talii. Obydwa te zdarzenia s膮 losowe.

Rozk艂ad jednostajny ci膮g艂y (Uniform Distribution)

Jest u偶ywany do generowania randomowych liczb, z kt贸rych ka偶da powinna mie膰 takie same prawdopodobie艅stwo wyst膮pienia. Standardowym przyk艂adem jest rzut kostk膮 przyjmuj膮cy warto艣ci od 1 do 6, czy rzut monet膮 daj膮cy wynik orze艂 albo reszka. 

W tym rozk艂adzie, nie mo偶na mie膰 warto艣ci po艣rednich. Rzut ko艣ci膮 nie da nam wyniku 2.5.

sobota, 11 stycznia 2025

Process Poissona

 Process Poissona jest powi膮zany z rozk艂adem Poissona. Badaj膮c go zak艂adamy, 偶e 艣redni czas pomi臋dzy zdarzeniami jest znany, ale dok艂adny czas pomi臋dzy nimi r贸偶ni si臋, nie jest taki sam. Zdarzenia nie zachodz膮 na raz, ale s膮 od siebie niezale偶ne. Sam proces przedstawia seri臋 takich zdarze艅, a dok艂adniej, model wyst臋powania tych zdarze艅 w czasie.

Wykorzystywany jest w wielu dziedzinach nauki i biznesu, w kt贸rych bada si臋 zdarzenia niezale偶ne, wyst臋puj膮ce z podobn膮 cz臋stotliwo艣ci膮:

  • Przewidywanie liczby u偶ytkownik贸w na stronie WWW
  • Przewidywanie ilo艣ci zabookowanych pokoj贸w w hotelu
  • Modelowanie sprzeda偶y produktu
     

Nie b臋dzie pasowa艂 natomiast do zdarze艅 zale偶nych, jak na przyk艂ad op贸藕nienia poci膮g贸w.

Rozk艂ad wyk艂adniczy (exponential distribution)

Ostatnio pisa艂em o Rozk艂adzie Poissona, czyli takim rozk艂adzie, w kt贸rym zdarzenia zachodz膮 ze sta艂膮 cz臋stotliwo艣ci膮 i s膮 niezale偶ne od siebie.

W rozk艂adzie wyk艂adniczym modelujemy czas oczekiwania na kolejne zdarzenie, przyk艂adowo, ile minut minie, mi臋dzy kolejnymi wizytami ptaka w naszym ogrodzie. 

Na podstawie ksi膮zki J. Starmera, na osi x - czas
Na ch艂opski rozum - je艣li jakie艣 zjawisko wyst臋puje co jaki艣 czas regularnie, to im kr贸tszy czas oczekiwania, tym wi臋ksze prawdopodobie艅stwo, 偶e dane zdarzenie wyst膮pi. Przyk艂adowo, je艣li zbadamy awarie oprogramowania, to najcz臋艣ciej dziej膮 si臋 one zaraz po wgraniu zmian, a nast臋pnie jest ich coraz mniej.


czwartek, 9 stycznia 2025

Rozk艂ad Poissona, prawo ma艂ych liczb

Rozk艂ad Poissona nie ma nic wsp贸lnego z trucizn膮, zosta艂 opracowany przez Simeona Denisa Poissona, francuskiego matematyka 偶yj膮cego od 1781 do 1840 roku we Francji.

Opisuje on (rozk艂ad), 偶e dane zdarzenie wyst膮pi okre艣lon膮 ilo艣膰 razy, bior膮c pod uwag臋 艣redni膮 ilo艣膰 danych zdarze艅 w czasie lub przestrzeni. Przyk艂adowo - mo偶emy obliczy膰, ile razy ptaki usi膮d膮 na naszym p艂ocie w ci膮gu godziny, ilu klient贸w odwiedzi sklep od 12 do 15 czy ile request贸w obs艂u偶y backend naszej strony.

Zdarzenia brane pod uwag臋 w rozk艂adzie Poissona powinny by膰 niezale偶ne od siebie, czyli nie ma znaczenia, jaki czas up艂yn膮 od ostatniego zdarzenia. To nie 艂apanie ryb, gdzie pluskanie po wyci膮gni臋ciu du偶ej sztuki, odstraszy pozosta艂e ryby 饟啙 饟啛 饟啚 na kilka minut.

Rozk艂ad dwumianowy, binomial distribution (Rozk艂ad Bernouliego)

Rozk艂ad dwumianowy dotyczy prawdopodobie艅stwa dyskretnego, czyli takiego, w kt贸rym zmienna przyjmuje sko艅czone lub okre艣lone warto艣ci. Przyk艂adem mo偶e by膰 rzut monet膮 lub kostk膮 do gry. W rozk艂adzie dwumianowym mamy takie parametry, jak:

  • Liczba pr贸b n
  • Prawdopodobie艅stwo sukcesu w ka偶dej z pr贸b p
  • Liczba sukces贸w - k

wtorek, 7 stycznia 2025

Ksi膮偶ki na temat ML kt贸re polecam

The StatQuest Illustrated Guide to ML - Josh Starmer

Ksi膮偶ka Josha Starmera ze 艣wietnego kana艂u StatQuest. Mocno w stylu ksi膮偶ek HeadFirst. Dobrze t艂umaczy podstawowe zagadnienia, tak偶e te zwi膮zane ze statystyk膮. 0 kodu.


Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow - Aurelien Geron

Nieco bardziej powa偶na ksi膮偶ka na temat ML

Deep Learning with Python - Francois Chollet

Ksi膮偶ka autora biblioteki Keras

The Elements of Statistical Learning
Data Mining, Inference, and Prediction

Ksi膮偶ka omawiaj膮ca temat od podstaw, dost臋pna za darmo - https://hastie.su.domains/ElemStatLearn/

艣roda, 1 stycznia 2025

W jaki spos贸b filmy z YT mieszaj膮 Ci w g艂owie

Jaki艣 czas temu zauwa偶y艂em powa偶ny problem, zwi膮zany z ogl膮daniem film贸w na YT. Ot贸偶 odnosz臋 wra偶enie, 偶e wi臋kszo艣膰 tw贸rc贸w tworzy filmy nie z w艂asnego przekonania, ale po to, by nabija膰 sobie wej艣cia (0 zaskoczenia). Wprowadza to dezinformacj臋 i prowadzi w艣r贸d widz贸w do niew艂a艣ciwych wniosk贸w i szkodliwych zachowa艅.

Przyk艂adowe tematy

  • Odstawianie kawy
  • Minimalizm
  • Ci膮g艂a migracja z ekosystemu Apple na inne i w drug膮 stron臋
  • Mindfulness
  • Wstawanie o 5 rano 
  • Deep work / Eat that Frog / GTD
  • Kolejny m膮dry trend z USA