С наступающим, друзья! Чтоб в праздники веселее жилось, вот несколько случайных шикарных ссылок: 1. Легендарный курс Александра Геннадьевича Дьяконова "Прикладные задачи анализа данных", внесший вклад в становление целого поколения небезысвестных кэгглеров и не только. https://github.com/Dyakonov/PZAD. Вот анонс в блоге А.Г. "Анализ малых данных" https://dyakonov.org/2020/12/30/pzad/. Я начал смотреть - одно удовольствие! Отсылки к Колмогорову, "гномики" тут и там (например, как бы вы обобщили понятие медианы на 2D - для множества точек на плоскости), способные неплохо озадачить, с первых же слайдов истории фйэлов в реальных проектах! Сочетание теории и практики - что надо! Аж хочется досмотреть весь курс, хоть и вроде все знакомые вещи. 2. Илья Щуров, которого я знаю по лекциям в ВШЭ, выпустил конспекты по матанализу и диффурам с кучей иллюстраций от руки и местами с анимациями. Фихтенгольца, конечно, не заменит, но в стиле "Статистики для котиков" - душевно зайдет. http://mathbook.info/ 3. Lena Voita, все еще читающая курс NLP в ШАДе, разработала мини-курс https://lena-voita.github.io/nlp_course.html по Natural Language Processing, который по уровню подачи материала, я б сказал, едва ли уступает несравненному ресурсу https://distill.pub/. На полноценный курс по NLP не потянет (в отличие от стэнфордского cs224n, к слову), но глянуть стоит, хотя бы ради того, чтоб заценить подачу материала, с котиками. 4. Поскольку себя любимого сложно обойти стороной в своей с позволения сказать группе, то дам ссылку на свой плейлист "NLP etudes" https://tinyurl.com/ybs9dyrb Тут я буду время от времени рассказывать что-нибудь крутое про advanced NLP, BERT и все такое. Если позволят, то буду делиться и опытом реальных проектов. Пока там есть "Firing a cannon at sparrows: BERT vs. logreg" https://youtu.be/JIU6WZuWl6k - лучшее видео года в сообществе ODS.ai. Также поделился своим пайплайном для дообучения (fine-tuning) BERT в задаче классификации (PyTorch + HuggingFace transformers + Catalyst), в 4х частях. Ещё добавлю, что год выдался непростой (дает 404 при делении на 5, вот это всё) и особых активностей по курсу mlcourse.ai не было, но в новом году будет пара релизов. В качестве мотивации или, наоборот, занижения самооценки предлагаю представить, что вы очутились в XVIII веке один на один с Эйлером или Лагранжем. Без интернета. Что скажете? Чему научите гения, носители знаний человечества третьего тысячелетия? Дерзайте! Хорошего вам развития в 2021 году! Собственно, в праздники и можно начать, например, с этих материалов.

Теги других блогов: анализ данных NLP матанализ