Topics tagged yannic-kilcher

Topic	Replies	Views	Activity
Traditional X-Mas Stream yannic-kilcher	0	0	28 December 2025
TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis) yannic-kilcher , gpt-4 , nvidia , transformers , gpu , diffusion	1	1	27 December 2025
Titans: Learning to Memorize at Test Time (Paper Analysis) yannic-kilcher , transformers , google , papers	1	4	14 December 2025
[Paper Analysis] The Free Transformer (and some Variational Autoencoder stuff) yannic-kilcher , transformers , deepmind , papers	1	5	1 November 2025
[Video Response] What Cloudflare's code mode misses about MCP and tool calling video , yannic-kilcher , cloudfare	1	2	19 October 2025
[Paper Analysis] On the Theoretical Limitations of Embedding-Based Retrieval (Warning: Rant) embeddings , yannic-kilcher , rag , papers	1	2	11 October 2025
AGI is not coming! open-ai , yannic-kilcher , agi , coding , gpt-5	1	3	9 August 2025
Context Rot: How Increasing Input Tokens Impacts LLM Performance (Paper Analysis) claude-3 , yannic-kilcher , gpt-4 , transformers , benchmarking	1	2	23 July 2025
Energy-Based Transformers are Scalable Learners and Thinkers (Paper Review) yannic-kilcher , back-propagation , transformers , papers	2	4	20 July 2025
On the Biology of a Large Language Model (Part 2) anthropic , yannic-kilcher , safety , transformers , open-source	1	5	3 May 2025
On the Biology of a Large Language Model (Part 1) anthropic , yannic-kilcher , transformers , open-source , emergent-garden	1	10	5 April 2025
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models (Paper Explained) yannic-kilcher , gpt-4 , education , mathematics , ai-samson	1	2	26 January 2025
Byte Latent Transformer: Patches Scale Better Than Tokens (Paper Explained) embeddings , yannic-kilcher , transformers , llama-3	1	27	24 December 2024
Safety Alignment Should be Made More Than Just a Few Tokens Deep (Paper Explained) yannic-kilcher , safety , jail-breaking	1	13	10 December 2024
TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters (Paper Explained) yannic-kilcher	1	2	23 November 2024
GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models yannic-kilcher , apple	1	1	19 October 2024
Were RNNs All We Needed? (Paper Explained) yannic-kilcher , back-propagation , transformers , yoshua-bengio , mamba	1	6	12 October 2024
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters (Paper) yannic-kilcher , deepmind	1	2	5 October 2024
Privacy Backdoors: Stealing Data with Corrupted Pretrained Models (Paper Explained) ethics , hugging-face , yannic-kilcher	1	3	4 August 2024
Scalable MatMul-free Language Modeling (Paper Explained) yannic-kilcher , transformers , hardware	1	6	8 July 2024
Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools (Paper Explained) ethics , yannic-kilcher , rag , gpt-3-5	1	19	26 June 2024
xLSTM: Extended Long Short-Term Memory yannic-kilcher , transformers	1	18	1 June 2024
[ML News] OpenAI is in hot waters (GPT-4o, Ilya Leaving, Scarlett Johansson legal action) ethics , yannic-kilcher , ilya-sutskever , voice , gpt-4 , openai	1	51	21 May 2024
ORPO: Monolithic Preference Optimization without Reference Model (Paper Explained) yannic-kilcher	1	29	1 May 2024
[ML News] Chips, Robots, and Models open-ai , yannic-kilcher , hardware , meta , google , robotics	1	61	30 April 2024
TransformerFAM: Feedback attention is working memory yannic-kilcher , transformers	1	25	28 April 2024
[ML News] Devin exposed \| NeurIPS track for high school students ethics , yannic-kilcher , gpt-3-5 , coding	1	30	27 April 2024
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention yannic-kilcher , transformers , google	1	44	24 April 2024
[ML News] Llama 3 changes the game yannic-kilcher , open-source , llama-3 , meta , google	1	65	24 April 2024
Hugging Face got hacked ethics , hugging-face , yannic-kilcher , gpt-4 , open-source	1	20	17 April 2024

Traditional X-Mas Stream

yannic-kilcher

0

28 December 2025

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)

yannic-kilcher , gpt-4 , nvidia , transformers , gpu , diffusion

1

27 December 2025

Titans: Learning to Memorize at Test Time (Paper Analysis)

yannic-kilcher , transformers , google , papers

1

4

14 December 2025

[Paper Analysis] The Free Transformer (and some Variational Autoencoder stuff)

yannic-kilcher , transformers , deepmind , papers

1

5

1 November 2025

[Video Response] What Cloudflare's code mode misses about MCP and tool calling

video , yannic-kilcher , cloudfare

1

2

19 October 2025

[Paper Analysis] On the Theoretical Limitations of Embedding-Based Retrieval (Warning: Rant)

embeddings , yannic-kilcher , rag , papers

1

2

11 October 2025

AGI is not coming!

open-ai , yannic-kilcher , agi , coding , gpt-5

1

3

9 August 2025

Context Rot: How Increasing Input Tokens Impacts LLM Performance (Paper Analysis)

claude-3 , yannic-kilcher , gpt-4 , transformers , benchmarking

1

2

23 July 2025

Energy-Based Transformers are Scalable Learners and Thinkers (Paper Review)

yannic-kilcher , back-propagation , transformers , papers

2

4

20 July 2025

On the Biology of a Large Language Model (Part 2)

anthropic , yannic-kilcher , safety , transformers , open-source

1

5

3 May 2025

On the Biology of a Large Language Model (Part 1)

anthropic , yannic-kilcher , transformers , open-source , emergent-garden

1

10

5 April 2025

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models (Paper Explained)

yannic-kilcher , gpt-4 , education , mathematics , ai-samson

1

2

26 January 2025

Byte Latent Transformer: Patches Scale Better Than Tokens (Paper Explained)

embeddings , yannic-kilcher , transformers , llama-3

1

27

24 December 2024

Safety Alignment Should be Made More Than Just a Few Tokens Deep (Paper Explained)

yannic-kilcher , safety , jail-breaking

1

13

10 December 2024

TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters (Paper Explained)

yannic-kilcher

1

2

23 November 2024

GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models

yannic-kilcher , apple

1

19 October 2024

Were RNNs All We Needed? (Paper Explained)

yannic-kilcher , back-propagation , transformers , yoshua-bengio , mamba

1

6

12 October 2024

Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters (Paper)

yannic-kilcher , deepmind

1

2

5 October 2024

Privacy Backdoors: Stealing Data with Corrupted Pretrained Models (Paper Explained)

ethics , hugging-face , yannic-kilcher

1

3

4 August 2024

Scalable MatMul-free Language Modeling (Paper Explained)

yannic-kilcher , transformers , hardware

1

6

8 July 2024

Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools (Paper Explained)

ethics , yannic-kilcher , rag , gpt-3-5

1

19

26 June 2024

xLSTM: Extended Long Short-Term Memory

yannic-kilcher , transformers

1

18

1 June 2024

[ML News] OpenAI is in hot waters (GPT-4o, Ilya Leaving, Scarlett Johansson legal action)

ethics , yannic-kilcher , ilya-sutskever , voice , gpt-4 , openai

1

51

21 May 2024

ORPO: Monolithic Preference Optimization without Reference Model (Paper Explained)

yannic-kilcher

1

29

1 May 2024

[ML News] Chips, Robots, and Models

open-ai , yannic-kilcher , hardware , meta , google , robotics

1

61

30 April 2024

TransformerFAM: Feedback attention is working memory

yannic-kilcher , transformers

1

25

28 April 2024

[ML News] Devin exposed | NeurIPS track for high school students

ethics , yannic-kilcher , gpt-3-5 , coding

1

30

27 April 2024

Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention

yannic-kilcher , transformers , google

1

44

24 April 2024

[ML News] Llama 3 changes the game

yannic-kilcher , open-source , llama-3 , meta , google

1

65

24 April 2024

Hugging Face got hacked

ethics , hugging-face , yannic-kilcher , gpt-4 , open-source

1

20

17 April 2024