Season 5 · Episode 1

#055 ML Илья Гусев. Как запускать большие языковые модели локально

January 18, 202441m 56s

Audio is streamed directly from the publisher (api.mave.digital) as published in their RSS feed. Play Podcasts does not host this file. Rights-holders can request removal through the copyright & takedown page.

Original episode page

Show Notes

Гостем выпуска стал Илья Гусев - известный NLP-специалист, сделавший большой вклад в область своими опенсорс-проектами, среди которых анализатор морфологии, генератор стихов, сборка различных датасетов и некоторые другие. Один из таких проектов как раз и стал поводом к сегодняшнему общению. Это большая языковая модель, заточенная на работу с русским языком - Сайга. Но говорим в выпуске мы далеко не только о ней. Илья сделал классный исторический экскурс в современные языковые модели, рассказал некоторые подробности об их устройстве, о тех подходах, которые применяют, чтобы такие модели можно было запускать на домашнем компьютере, как с помощью языковых моделей можно решать разные задачи и стоит ли вообще использовать локальные модели. Интересного и полезного прослушивания! Ссылки выпуска: Статья Ильи на Хабре "Как (быстро) сделать русский локальный ChatGPT" (<a href="https://habr.com/ru/articles/759386/">https://habr.com/ru/articles/759386/</a>)Сервис для запуска больших языковых моделей локально - lmstudio (<a href="https://lmstudio.ai/">https://lmstudio.ai/</a>)Репозиторий сервиса oobabooga, с помощью которого можно запустить веб-интерфейс для работы с LLM локально (<a href="https://github.com/oobabooga/text-generation-webui">https://github.com/oobabooga/text-generation-webui</a>)Репозиторий сервиса Text Generation Inference (TGI), который позволяет развертывать и поддерживать LLM (<a href="https://github.com/huggingface/text-generation-inference">https://github.com/huggingface/text-generation-inference</a>)Статья на arxiv "Self-Consuming Generative Models Go MAD" с анализом того, к чему приводят разные подходы обучения LLM на синтетических датасетах, сгенерированных другими LLM (<a href="https://arxiv.org/abs/2307.01850">https://arxiv.org/abs/2307.01850</a>)Пост Ильи со списком материалов для погружения в NLP (<a href="https://t.me/natural_language_processing/81627">https://t.me/natural_language_processing/81627</a>) Буду благодарен за обратную связь! Вступайте в книжный ML-клуб, где мы читаем книги по машинному обучению и смежным темам! MLBookClub (https://t.me/+HIXnIwXIIFAyYzYy) Подписывайтесь на телеграм-канал "Стать специалистом по машинному обучению" (https://t.me/toBeAnMLspecialist) Мой телеграм для связи (https://t.me/kmsint) Также со мной можно связаться по электронной почте: [email protected] Я сделал бесплатный курс по созданию телеграм-ботов на Python и aiogram на Степике (https://stepik.org/120924). Присоединяйтесь, если хотите научиться разрабатывать телеграм-ботов! И буквально неделю назад я открыл доступ к пре-релизу нового курса по продвинутой разработке телеграм-ботов с элементами микросервисной архитектуры (<a href="https://stepik.org/a/153850?utm_source=mlpodcast&utm_campaign=ep_55">https://stepik.org/a/153850?utm_source=mlpodcast&utm_campaign=ep_55</a>) Выразить благодарность можно добрым словом и/или донатом (https://www.tinkoff.ru/rm/kryzhanovskiy.mikhail11/NkwE718878/)

← All episodes of Machine Learning Podcast