Parametr top-p jest technik膮 wykorzystywan膮 przez modele j臋zykowe, do kontrolowania tego, jak bardzo kreatywny i przewidywalny jest tekst. Inaczej nazywany jest pr贸bkowaniem j膮drowym (Nucleus Sampling).
Jak to dzia艂a?
Gdy wpisujemy prompt, model stara si臋 nam odpowiedzie膰, wybieraj膮c kolejne s艂owa. Przyk艂adowy prompt:
Doje偶d偶am do pracy...
Model musi wybra膰, jakie kolejne s艂owo nam podpowie i jak膮 ma ono prawdopodobie艅stwo:
Prawdopodobie艅stwa sumuj膮 si臋 do 100%. Ustawiamy wtedy top-p na 0.90. Model po kolei dodaje kolejne wyniki by suma nie przekroczy艂a 0.90. Z moich oblicze艅 wychodzi, 偶e mo偶e wzi膮膰 tylko 3 pierwsze wyniki. Warto艣ci mniej prawdopodobne zostaj膮 odrzucone, a model wylosuje odpowied藕 z zestawu:
Fajnie elegancko. W praktyce dzia艂a to jak obci臋cie najmniej prawdopodobnych wynik贸w, kt贸rego pr贸g mo偶emy regulowa膰 za pomoc膮 parametru.
Nieco inaczej dzia艂a parametr temperatura (nie myli膰 z popularn膮 piosenk膮), opisz臋 to w jednym z kolejnych wpis贸w.
Brak komentarzy:
Prze艣lij komentarz