Mokum P1092blog, Mokum-Archive28 декабря 2019 г. — ...дед, а почему оно называется GPT-2? — Потому что первый Generative Pretrained Transformer — это дилдо. А нулевой — программисты же с нуля нумеруют — соска. Mokum P1093Mokum P1091