🐍Kamil Naja: czerwca 2025

wtorek, 17 czerwca 2025

Problem wielorękiego jednorękiego bandyty

Ciekawe zagadnienie, które pozwala lepiej zrozumieć reinforcement learning. Wyobraźmy sobie, że jesteśmy w kasynie i mamy przed sobą kilka automatów do gry. Pociągamy za kolejne dźwignie automatu i z czasem odkrywamy, że niektóre z nich dają lepszą wypłatę niż inne. Celem jest uzyskanie jak najwyższej nagrody.

Problem polega na tym, czy mamy skupić się na eksploracji, czy na eksploatacji. Eksploracja to odkrywanie nowych dźwigni, natomiast eksploatacja, pozostanie przy tych, które dają dobre wyniki teraz.

Eksploracja może prowadzić do tymczasowego zmniejszenia wygranych, a eksploatacja, do zmniejszenia szans na nowe wygrane.

Problem można zastosować w wielu dziedzinach życia. Przykładowo, możemy uczyć się nowego języka programowania, ale czy nie lepiej jest pozostać przy tym, który już dobrze znamy? Lekarz może zlecić dobrze znaną terapię, albo wysłać pacjenta na mniej znaną i bardziej ryzykowną.

niedziela, 1 czerwca 2025

Arrazzo Specification

Ostatnio wpadłem na https://spec.openapis.org/arazzo/latest.html. Jest to powstający projekt, mający na celu stworzenie specyfikacji do jeszcze lepszego opisywania endpointów. Oprócz swaggera, oferuje ona bardziej szczegółowy opis, na przykład opisujący kolejność pobierania danych. Ciekawa inicjatywa, czekam kiedy pojawi się w szerszym użyciu :)

Strony

wtorek, 17 czerwca 2025

Problem wielorękiego jednorękiego bandyty

niedziela, 1 czerwca 2025

Arrazzo Specification

Daj Suba

Jeszcze jeden click...