Large Language modells
B.Sc course, University of Debrecen, Department of Data Science and Visualization, 2024
What is the Transformers?
Ábra 1: Transformers. Forrás: Comingsoon.
Leghíresebb transformer architektúrák
- june: A GPT, az első előre betanított Transformer modell, amelyet különféle NLP-feladatok finomhangolására használnak, és a legmodernebb eredményeket érte el
- october: A BERT, egy másik nagy, előre betanított modell, amelyet a mondatok jobb összefoglalására terveztek (erről a következő fejezetben olvashat bővebben!)
- feburary: GPT-2, a GPT továbbfejlesztett (és nagyobb) változata, amelyet etikai aggályok miatt nem adtak ki azonnal nyilvánosan
- october: DistilBERT, a BERT desztillált változata, amely 60%-kal gyorsabb, 40%-kal könnyebb a memóriában, és továbbra is megőrzi a BERT teljesítményének 97%-át
- october: BART és T5, két nagy, előre betanított modell, amelyek ugyanazt az architektúrát használják, mint az eredeti Transformer modell (az első, amelyik ezt megtette)
- may, GPT-3, a GPT-2 még nagyobb verziója, amely finomhangolás nélkül (úgynevezett zero-shot learning) számos feladaton jól teljesít.
- march, GPT-3.5, a GPt-2 még nagyobb verziója és nagyobb, mint a GPT-3, valamint ez a hálózati bázis az első chatGPT-hez
- march, GPT-4
- december, Gemini
- márcis, GPT-4o, Complex services system round the GPT-4. They learned everything that they could.
Nagy nyelvi modellek és méreteik
Ábra 2: Nagy nyelvi modellek. Forrás: thelowdown.
First Transformer
Ábra 3: Transformer architektúra. Forrás: Google AI Blog.