[Club2] Einladung: Verified Solution Methods for Markov Decision Processes - Mi 9. Jun. 2021 14:00 - 14:30 (MESZ) (club2 at mailbroy.informatik.tu-muenchen.de)
piller at in.tum.de
piller at in.tum.de
Mon Jun 7 09:11:24 CEST 2021
Sie wurden zum folgenden Termin eingeladen.
Titel: Verified Solution Methods for Markov Decision Processes
Speaker: Maximilian Schäffeler
Type: Master's Thesis Presentation
Abstract: Markov decision processes (MDPs) allow modeling decision-making
in systems that
exhibit both random and deterministic behavior. In our work, we extend an
existing for-
malization of MDPs in the interactive theorem prover Isabelle/HOL. First,
we introduce
policies that formalize the strategy of the decision-maker. To assign a
value to policies,
we add reward functions to the MDP formalization. The problem arises of how
to find
an optimal policy, one that maximizes the rewards accumulated over time. We
solve
the problem by formalizing its Bellman equation and give conditions under
which an
optimal policy exists.
Based on these developments, we verify the value iteration and policy
iteration
algorithms which compute (close to) optimal policies. This formalization
may serve as a
basis for future work on reinforcement learning algorithms, planning under
uncertainty,
and partially observable MDPs.
Wann: Mi 9. Jun. 2021 14:00 – 14:30 Mitteleuropäische Zeit - Berlin
Wo: https://tinyurl.com/ls21coffee
Kalender: club2 at mailbroy.informatik.tu-muenchen.de
Wer
* piller at in.tum.de- Veranstalter
* maximilian.schaeffeler at tum.de
* club2 at mailbroy.informatik.tu-muenchen.de
Termininformationen:
https://calendar.google.com/calendar/event?action=VIEW&eid=MzcwcGVlZjA4dmZtYWFpMDRqbGxyOWhiZjEgY2x1YjJAbWFpbGJyb3kuaW5mb3JtYXRpay50dS1tdWVuY2hlbi5kZQ&tok=NTIjc2U2ZWJlM3RvZmY0Y2g1bm11bmlibTVtOThAZ3JvdXAuY2FsZW5kYXIuZ29vZ2xlLmNvbWEyNzZhYjhkYTg5NGNiMTM3MWE0NDJiYjE5YWM4NTIxMTgzNzBkOTE&ctz=Europe%2FBerlin&hl=de&es=0
Einladung von Google Kalender: https://calendar.google.com/calendar/
Sie erhalten diese E-Mail unter club2 at mailbroy.informatik.tu-muenchen.de,
da Sie ein Gast bei diesem Termin sind.
Lehnen Sie diesen Termin ab, um keine weiteren Informationen zu diesem
Termin zu erhalten. Sie können auch unter
https://calendar.google.com/calendar/ ein Google-Konto erstellen und Ihre
Benachrichtigungseinstellungen für Ihren gesamten Kalender steuern.
Wenn Sie diese Einladung weiterleiten, kann jeder Empfänger eine Antwort an
den Organisator senden und zur Gästeliste hinzugefügt werden. Außerdem
könnte er weitere Nutzer einladen und Ihre Antwort ändern. Weitere
Informationen: https://support.google.com/calendar/answer/37135#forwarding
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://mailman46.in.tum.de/pipermail/club2/attachments/20210607/3aa3601e/attachment.htm>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: text/calendar
Size: 2608 bytes
Desc: not available
URL: <https://mailman46.in.tum.de/pipermail/club2/attachments/20210607/3aa3601e/attachment.ics>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: invite.ics
Type: application/ics
Size: 2659 bytes
Desc: not available
URL: <https://mailman46.in.tum.de/pipermail/club2/attachments/20210607/3aa3601e/attachment.bin>
More information about the Club2
mailing list