Difference between revisions of "Fundamental theorems"
Line 261: | Line 261: | ||
# Mathematical statistics by A.A. Borovkov, 1998 | # Mathematical statistics by A.A. Borovkov, 1998 | ||
− | # [https://www.di.ens.fr/~fbach/ | + | # [https://www.di.ens.fr/~fbach/ltfp_book.pdf Learning Theory from First Principles] by Francis Bach, 2021 <!--https://www.di.ens.fr/~fbach/learning_theory_class/index.html--> |
# Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин, 1970 (глава про сходимость) | # Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин, 1970 (глава про сходимость) | ||
Revision as of 16:42, 4 April 2021
Fundamental theorems of Machine learning
Фундаментальные теоремы машинного обучения 1. Причины: Теорема - краткое сообщение о наиболее важных результатах области. 2. Теорема делает область математической в силу общности и строгости. 3. теоремы лежат в основе математики, они также играют центральную роль в её эстетике 4. Основная теорема линейной алгебры - не нужна (но нужна в контексте СВД) https://www.engineering.iastate.edu/~julied/classes/CE570/Notes/strangpaper.pdf 5. Основная теорема статистики - нужна. 6. Должна быть показана связь между различными областями машинного обучения 7. Вероятность, обоснованность, порождение и выбор, корректность по Адамару, снижение размерности, сходимость алгоритмов
How direct narration transform to fast narration?
How to find, state and prove theorems in your work?
Contents
Мотивация и план курса
Цель курса — повысить качество студенческих научных работ на кафедре, сделать статьи и дипломные работы более обоснованными, изучить технику и практику формулировок доказательства теорем в области машинного обучения. Результат курса - теоретически обоснованные сообщения дипломных работ бакалавра.
Короткая ссылка bit.ly/MLTh_21
Каждое занятие курса
- Доклад лектора — одна из фундаментальных теорем (40' = 30' + 10' обсуждение)
- Два студенческих доклада (20'=15'+5' обсуждение)
Каждый студент делает два доклада
- С теоремой взятой из литературы, по которой выполняется дипломная работа
- С собственной теоремой, обосновывающей решение, предлагаемое в дипломное работе
Приветствуются!
- Варианты собственных формулировок и доказательств
- Значимые высказывания ведущих исследователей, оформленные в виде теорем (пример изложения Кристофера Бишопа)
План изложения материала
- Введение: основное сообщение теоремы в понятном (не обязательно строгом) изложении
- Вводная часть: определение терминов и сведения, необходимые для изложения (обозначения можно использовать авторские или [ссылка на обозначения Б.А.С.])
- Формулировка и доказательство теоремы в строгом изложении (но можно отходить от авторского варианта, если это нужно для ясности)
- Значимость теоремы: ссылки или обзор методов и приложений, иллюстрирующих теорему
Оформление
- В виде страницы текста, пример, шаблон
- Слайды приветствуются, но необязательны
- Очень приветствуются поясняющие рисунки, диаграммы, графики (можно от руки)
Материалы курса
- Проект на GitHub для загрузки докладов Intelligent-Systems-Phystech/FundamentalTheoremsML
- В папку группы 674 загрузить pdf, tex, fig с именем файла
- Surname2021Literature, Surname2021Research,
- Канал Youtube Machine Learning
- Ссылка на сессию Zoom m1p.org/go_zoom
Оценивание
- Доклад и материалы к нему 0-4 балла (по результатам сравнения работ)
- Не по расписанию делим на два
- Экзамен 2 балла
Расписание докладов
Докладчик | Литература | Диплом |
---|---|---|
Бишук Антон | 17.2 link | 31.3 link |
Вайсер Кирилл | 17.2 link | 31.3 link |
Гребенькова Ольга | 24.2 link | 7.4 link |
Гунаев Руслан | 24.2 link | 7.4 link |
Жолобов Владимир | 3.3 link | 14.4 link |
Исламов Рустем | 3.3 link | 14.4 link |
Панкратов Виктор | 10.3 link | 21.4 link |
Савельев Николай | 10.3 link | 21.4 link |
Филатов Андрей | 10.3 link | 21.4 link |
Филиппова Анастасия | 17.3 link | 28.4 link |
Харь Александра | 17.3 link | 28.4 link |
Христолюбов Максим | 24.3 link | 5.5 link |
Шокоров Вячеслав | 24.3 link | 5.5 link |
Lecture topics
- Singular values decomposition and spectral theorem W
- Gauss–Markov-(Aitken) theorem W
- Principal component analysis W
- Karhunen–Loève theorem W
- Kolmogorov–Arnold representation theorem W
- Universal approximation theorem by Cybenko W
- Deep neural network theorem
- No free lunch theorem by Wolpert W
- RKHS by Aronszajn and Mercer's theorem W
- Representer theorem by Schölkopf, Herbrich, and Smola W
- Convolution theorem (FT, convolution, correlation with CNN examples) W
- Fourier inversion theorem W
- Wiener–Khinchin theorem about autocorrelation and spectral decomposition W
- Parseval's theorem (and uniform, non-uniform convergence) W
- Probably approximately correct learning with the theorem about compression means learnability
- Bernstein–von Mises theorem W
- Holland's schema theorem W
- Variational approximation
- Convergence of random variables and Kloek's theorem W
- Exponential family of distributions and Nelder's theorem
- Multi-armed bandit theorem
- Copulas and Sklar's theorem W
Theorem types
- Существование и единственность (NN)
- Универсальность
- Сходимость[1]
- Поточечно
- Равномерно
- По мере
- Почти всюду
- По распределению
- По вероятности
- По Чезаро, Борделю, Пуассона, Эйлеру
- Абсолютная
- Условная
- В среднем L1, среднеквадратичном L2
- Сильная, слабая
- Оценки
- Точечная
- Не точечная
- Состоятельная
- Несмещенная
- Эффективная
- Omitted-variable bias
- almost sure, almost everywhere
Talks
- Three works by Greg Yang arXiv:1910.12478, arXiv:2006.14548, arXiv:2009.10685 Youtube Rus
- Theorems on flows by Johann Brehmera and Kyle Cranmera arXiv:2003.13913v2
Расписание лекций
Дата | Тема | Лектор | Ссылки |
---|---|---|---|
10 февраля | Вводное занятие (и Основная теорема статистики) | Стрижов, Потанин | link |
17 февраля | Теорема сходимости перцептрона Ф.Розенблатта, Блока, Джозефа, Кестена | Марк Потанин | link |
24 февраля | Теоремы Колмогорова и Арнольда, теорема об универсальном аппроксиматоре Цыбенко, теорема о глубоких нейросетях | Марк Потанин | link |
10 марта | Берштейн - фон Мизес | Андрей Грабовой | link |
17 марта | Берштейн - фон Мизес (продолжение) | Андрей Грабовой | link |
24 марта | РАС обучаемость, теорема о том, что сжатие предполагает обучаемость | Андрей Грабовой | link |
31 марта | Сходимость про вероятности при выборе моделей | Марк Потанин | link |
7 апреля | Теорема о минимальной длине описания | Олег Бахтеев | link |
14 апреля | Теорема о свертке (Фурье, свертка, автокорреляция) с примерами сверточных сетей | Филипп Никитин | link |
21 апреля | Representer theorem, Schölkopf, Herbrich, and Smola | Андрей Грабовой | link |
28 апреля | Обратная теорема Фурье, теорема Парсеваля (равномерная и неравномерная сходимость) | Филипп Никитин | link |
5 мая | Вариационная аппроксимация, теорема о байесовском выборе моделей | Олег Бахтеев | link |
12 мая | Разбор и обсуждение письменных работ: теоремы их доказательства (входящие в диплом) | Потанин, Стрижов | |
26 мая | Экзамен: схемы доказательства различных теорем (тест на время, как в гос по физике, и обсуждение) | Потанин, Адуенко, Бахтеев | |
Теорема о бесплатных обедах в машинном обучении, Волперт | Радослав Нейчев | ||
Теорема схем, Холланд | Радослав Нейчев |
References
- Mathematical statistics by A.A. Borovkov, 1998
- Learning Theory from First Principles by Francis Bach, 2021
- Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин, 1970 (глава про сходимость)
Proof techniques
- Proofs and Mathematical Reasoning by Agata Stefanowicz, 2014
- The nuts and bolts of proofs by Antonella Cupillari, 2013
- Theorems, Corollaries, Lemmas, and Methods of Proof by Richard J. Rossi, 1956
- Problem Books in Mathematics by P.R. Halmos (editor), 1990
- Les contre-exemples en mathématique par Bertrand Hauchecorne, 2007
- Kolmogorov and Mathematical Logic by Vladimir A. Uspensky // The Journal of Symbolic Logic, Vol. 57, No. 2 (Jun., 1992), 385-412.
- Что такое аксиоматический метод? В.А. Успенский, 2001
- Аксиоматический метод. Е.Е. Золин, 2015
Methodology
- Introduction to Metamathematics by Stephen Cole Kleene, 1950
- Science and Method by Henry Poincare, 1908
- A Summary of Scientific Method by Peter Kosso, 2011
- Being a Researcher: An Informatics Perspective by Carlo Ghezzi, 2020
- The definitive glossary of higher mathematical jargon by Math Vault, 2015
- The definitive guide to learning higher mathematics: 10 principles to mathematical transcendence by Math Vault, 2020
- List of mathematical jargon on Wikipedia
- Пикабу. Типичные методы доказательства, 2018 (если вы чувствуете, что несет не туда)