Episode 223

AI 111: GPT Nasıl Çalışıyor

GPT ve benzer dil modellerinin temelindeki kavramlar

July 24, 202431m 43s

Audio is streamed directly from the publisher (traffic.megaphone.fm) as published in their RSS feed. Play Podcasts does not host this file. Rights-holders can request removal through the copyright & takedown page.

Original episode page

Show Notes

Nihayet geldik ChatGPT'nin temelindeki modele. Hafıza sahibi ağlardan (LSTM) bugün her yerde kullanılan transformer mimarisine geçişi anlayacağız. Kilit kavramlar: Word embedding ve attention mekanizması.

Konular:

(00:04) Kartopu Dünya Hipotezi
(00:55) Tekrar: Geri besleme
(02:15) Kısa dönem hafıza
(04:30) LSTM
(05:57) Token
(07:40) Matrix
(08:50) Word Embeddings
(14:20) Fularsız Entellik çok bozdu
(16:50) Encoder Decoder
(18:30) Attention Mekanizması
(19:50) Transformer Mimarisi
(23:45) Parallellik
(26:20) ChatGPT vs GPT
(28:12) Patreon Teşekkürleri

Kaynaklar:

Tüm bölümler ve daha fazlası için ⁠⁠podbeemedia.com⁠⁠'u ziyaret et!

----- Podbee Sunar ------- Bu podcast reklam içermektedir.

← All episodes of Fularsız Entellik