{"version": "https://jsonfeed.org/version/1", "title": "/dev/posts/ - Tag index - reinforcement-learning", "home_page_url": "https://www.gabriel.urdhr.fr", "feed_url": "/tags/reinforcement-learning/feed.json", "items": [{"id": "http://www.gabriel.urdhr.fr/2025/01/07/transformer-decoder-language-models/", "title": "Transformer-decoder language models", "url": "https://www.gabriel.urdhr.fr/2025/01/07/transformer-decoder-language-models/", "date_published": "2025-01-07T00:00:00+01:00", "date_modified": "2025-01-26T22:34:55+01:00", "tags": ["computer", "machine-learning", "deep-learning", "language-model", "neural-networks", "reinforcement-learning"], "content_html": "<p>Some notes on how <a href=\"https://arxiv.org/abs/1801.10198\">transformer-decoder</a> language models work,\ntaking GPT-2 as an example,\nand with lots references in order to dig deeper.</p>\n"}]}