Fundamental theorems

Fundamental theorems of Machine learning

Фундаментальные теоремы машинного обучения 1. Причины: Теорема - краткое сообщение о наиболее важных результатах области. 2. Теорема делает область математической в силу общности и строгости. 3. теоремы лежат в основе математики, они также играют центральную роль в её эстетике 4. Основная теорема линейной алгебры - не нужна (но нужна в контексте СВД) https://www.engineering.iastate.edu/~julied/classes/CE570/Notes/strangpaper.pdf 5. Основная теорема статистики - нужна. 6. Должна быть показана связь между различными областями машинного обучения 7. Вероятность, обоснованность, порождение и выбор, корректность по Адамару, снижение размерности, сходимость алгоритмов

How direct narration transform to fast narration?

How to find, state and prove theorems in your work?

Мотивация и план курса

Цель курса — повысить качество студенческих научных работ на кафедре, сделать статьи и дипломные работы более обоснованными, изучить технику и практику формулировок доказательства теорем в области машинного обучения. Результат курса - теоретически обоснованные сообщения дипломных работ бакалавра.

Короткая ссылка bit.ly/MLTh_21

Каждое занятие курса

Доклад лектора — одна из фундаментальных теорем (40' = 30' + 10' обсуждение)
Два студенческих доклада (20'=15'+5' обсуждение)

Каждый студент делает два доклада

С теоремой взятой из литературы, по которой выполняется дипломная работа
С собственной теоремой, обосновывающей решение, предлагаемое в дипломное работе

Приветствуются!

Варианты собственных формулировок и доказательств
Значимые высказывания ведущих исследователей, оформленные в виде теорем (пример изложения Кристофера Бишопа)

План изложения материала

Введение: основное сообщение теоремы в понятном (не обязательно строгом) изложении
Вводная часть: определение терминов и сведения, необходимые для изложения (обозначения можно использовать авторские или [ссылка на обозначения Б.А.С.])
Формулировка и доказательство теоремы в строгом изложении (но можно отходить от авторского варианта, если это нужно для ясности)
Значимость теоремы: ссылки или обзор методов и приложений, иллюстрирующих теорему

Оформление

В виде страницы текста, пример, шаблон
Слайды приветствуются, но необязательны
Очень приветствуются поясняющие рисунки, диаграммы, графики (можно от руки)

Материалы курса

Проект на GitHub для загрузки докладов Intelligent-Systems-Phystech/FundamentalTheoremsML
- В папку группы 674 загрузить pdf, tex, fig с именем файла
- Surname2021Literature, Surname2021Research,
Канал Youtube Machine Learning
Ссылка на сессию Zoom m1p.org/go_zoom

Оценивание

Доклад и материалы к нему 0-4 балла (по результатам сравнения работ)
Не по расписанию делим на два
Экзамен 2 балла

Расписание докладов

Докладчик	Литература	Диплом
Бишук Антон	17.2 link	31.3 link
Вайсер Кирилл	17.2 link	31.3 link
Гребенькова Ольга	24.2 link	7.4 link
Гунаев Руслан	24.2 link	7.4 link
Жолобов Владимир	3.3 link	14.4 link
Исламов Рустем	3.3 link	14.4 link
Панкратов Виктор	10.3 link	21.4 link
Савельев Николай	10.3 link	21.4 link
Филатов Андрей	10.3 link	21.4 link
Филиппова Анастасия	17.3 link	28.4 link
Харь Александра	17.3 link	28.4 link
Христолюбов Максим	24.3 link	5.5 link
Шокоров Вячеслав	24.3 link	5.5 link

Lecture topics

Singular values decomposition and spectral theorem W
Gauss–Markov-(Aitken) theorem W
Principal component analysis W
Karhunen–Loève theorem W
Kolmogorov–Arnold representation theorem W
Universal approximation theorem by Cybenko W
Deep neural network theorem
No free lunch theorem by Wolpert W
RKHS by Aronszajn and Mercer's theorem W
Representer theorem by Schölkopf, Herbrich, and Smola W
Convolution theorem (FT, convolution, correlation with CNN examples) W
Fourier inversion theorem W
Wiener–Khinchin theorem about autocorrelation and spectral decomposition W
Parseval's theorem (and uniform, non-uniform convergence) W
Probably approximately correct learning with the theorem about compression means learnability
Bernstein–von Mises theorem W
Holland's schema theorem W
Variational approximation
Convergence of random variables and Kloek's theorem W
Exponential family of distributions and Nelder's theorem
Multi-armed bandit theorem
Copulas and Sklar's theorem W

Theorem types

Существование и единственность (NN)
Универсальность
Сходимость[1]
- Поточечно
- Равномерно
- По мере
- Почти всюду
- По распределению
- По вероятности
- По Чезаро, Борделю, Пуассона, Эйлеру
- Абсолютная
- Условная
- В среднем L1, среднеквадратичном L2
- Сильная, слабая
Оценки
- Точечная
- Не точечная
- Состоятельная
- Несмещенная
- Эффективная
- Omitted-variable bias
almost sure, almost everywhere

Talks

Three works by Greg Yang arXiv:1910.12478, arXiv:2006.14548, arXiv:2009.10685 Youtube Rus
Theorems on flows by Johann Brehmera and Kyle Cranmera arXiv:2003.13913v2

Расписание лекций

Дата	Тема	Лектор	Ссылки
10 февраля	Вводное занятие (и Основная теорема статистики)	Стрижов, Потанин	link
17 февраля	Теорема сходимости перцептрона Ф.Розенблатта, Блока, Джозефа, Кестена	Марк Потанин	link
24 февраля	Теоремы Колмогорова и Арнольда, теорема об универсальном аппроксиматоре Цыбенко, теорема о глубоких нейросетях	Марк Потанин	link
10 марта	Берштейн - фон Мизес	Андрей Грабовой	link
17 марта	Берштейн - фон Мизес (продолжение)	Андрей Грабовой	link
24 марта	РАС обучаемость, теорема о том, что сжатие предполагает обучаемость	Андрей Грабовой	link
31 марта	Сходимость про вероятности при выборе моделей	Марк Потанин	link
7 апреля	Теорема о минимальной длине описания	Олег Бахтеев	link
14 апреля	Теорема о свертке (Фурье, свертка, автокорреляция) с примерами сверточных сетей	Филипп Никитин	link
21 апреля	Representer theorem, Schölkopf, Herbrich, and Smola	Андрей Грабовой	link
28 апреля	Обратная теорема Фурье, теорема Парсеваля (равномерная и неравномерная сходимость)	Филипп Никитин	link
5 мая	Вариационная аппроксимация, теорема о байесовском выборе моделей	Олег Бахтеев	link
12 мая	Разбор и обсуждение письменных работ: теоремы их доказательства (входящие в диплом)	Потанин, Стрижов
26 мая	Экзамен: схемы доказательства различных теорем (тест на время, как в гос по физике, и обсуждение)	Потанин, Адуенко, Бахтеев
	Теорема о бесплатных обедах в машинном обучении, Волперт	Радослав Нейчев
	Теорема схем, Холланд	Радослав Нейчев

References

Mathematical statistics by A.A. Borovkov, 1998
Learning Theory from First Principles by Francis Bach, 2021
Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин, 1970 (глава про сходимость)

Proof techniques

Proofs and Mathematical Reasoning by Agata Stefanowicz, 2014
The nuts and bolts of proofs by Antonella Cupillari, 2013
Theorems, Corollaries, Lemmas, and Methods of Proof by Richard J. Rossi, 1956
Problem Books in Mathematics by P.R. Halmos (editor), 1990
Les contre-exemples en mathématique par Bertrand Hauchecorne, 2007
Kolmogorov and Mathematical Logic by Vladimir A. Uspensky // The Journal of Symbolic Logic, Vol. 57, No. 2 (Jun., 1992), 385-412.
Что такое аксиоматический метод? В.А. Успенский, 2001
Аксиоматический метод. Е.Е. Золин, 2015

Methodology

Introduction to Metamathematics by Stephen Cole Kleene, 1950
Science and Method by Henry Poincare, 1908
A Summary of Scientific Method by Peter Kosso, 2011
Being a Researcher: An Informatics Perspective by Carlo Ghezzi, 2020
The definitive glossary of higher mathematical jargon by Math Vault, 2015
The definitive guide to learning higher mathematics: 10 principles to mathematical transcendence by Math Vault, 2020
List of mathematical jargon on Wikipedia
Пикабу. Типичные методы доказательства, 2018 (если вы чувствуете, что несет не туда)

Navigation menu