Fundamental theorems
Fundamental theorems of Machine learning
Фундаментальные теоремы машинного обучения 1. Причины: Теорема - краткое сообщение о наиболее важных результатах области. 2. Теорема делает область математической в силу общности и строгости. 3. теоремы лежат в основе математики, они также играют центральную роль в её эстетике 4. Основная теорема линейной алгебры - не нужна (но нужна в контексте СВД) https://www.engineering.iastate.edu/~julied/classes/CE570/Notes/strangpaper.pdf 5. Основная теорема статистики - нужна. 6. Должна быть показана связь между различными областями машинного обучения 7. Вероятность, обоснованность, порождение и выбор, корректность по Адамару, снижение размерности, сходимость алгоритмов
How direct narration transform to fast narration?
How to find, state and prove theorems in your work?
Contents
Motivation and syllabus
The goal of the course is to boost the quality of students bachelor and master thesis works; to make results of student scientific research well-founded. The course studies techniques and practice of theorem formulations and proofs in the field of machine learning.
- Educational mimic progression
- Definition \(\to\) (Axiom set) \(\to\) Theorem \(\to\) Proof \(\to\) Corollaries \(\to\) Examples \(\to\) Impact to applications
- Scientific discovery progression
- Application problems \(\to\) Problem generalisations \(\to\) Useful algebraic platform \(\to\) Definitions \(\to\) Axiom set
Each lesson contains
- A lecturer's talk on one of fundamental theorems (\(40' = 30' + 10'\) discussion)
- Two students' talks (each \(20' = 15' + 5'\) discussion)
Each student delivers two talks
- On a theorem, which is formulated in a paper from the list of student thesis work's references
- On a theorem, which is formulated and proved by the student
It is welcome to
- Make variants of our own formulations and proofs
- Re-formulate significant messages of researchers and formulate these messages as theorems
Plan of a talk
- Introduction: the main message briefly
- If necessary (it could be introduced during the talk)
- Axiom sets
- Definitions
- Algebraic structures
- Notations
- Theorem formulation and exact proof
- The author's variant of the proof could be ameliorated
- Corollaries
- Theorem significance and applications
Typography
- As one (or two) text page example, template to download
- Please
- set the font size \(\geq 14\)pt
- include plots, diagrams, freehand drawings
The organization
- GitHub project to upload your text Intelligent-Systems-Phystech/FundamentalTheoremsML
- to the group folder upload the pdf, tex, fig files named as
- Surname2021Literature, Surname2021Research,
- See the Youtube channel Machine Learning
- Spring semester, Wednesdays 14:30 at Zoom m1p.org/go_zoom
Scoring
- Talks and text 0-4 points, according to comparison
- Out-of-schedule drops a half
- The exam 2 points
Расписание докладов
Докладчик | Литература | Диплом |
---|---|---|
Бишук Антон | 17.2 link | 31.3 link |
Вайсер Кирилл | 17.2 link | 31.3 link |
Гребенькова Ольга | 24.2 link | 7.4 link |
Гунаев Руслан | 24.2 link | 7.4 link |
Жолобов Владимир | 3.3 link | 14.4 link |
Исламов Рустем | 3.3 link | 14.4 link |
Панкратов Виктор | 10.3 link | 21.4 link |
Савельев Николай | 10.3 link | 21.4 link |
Филатов Андрей | 10.3 link | 21.4 link |
Филиппова Анастасия | 17.3 link | 28.4 link |
Харь Александра | 17.3 link | 28.4 link |
Христолюбов Максим | 24.3 link | 5.5 link |
Шокоров Вячеслав | 24.3 link | 5.5 link |
Lecture topics
- Singular values decomposition and spectral theorem W
- Gauss–Markov-(Aitken) theorem W
- Principal component analysis W
- Karhunen–Loève theorem W
- Kolmogorov–Arnold representation theorem W
- Universal approximation theorem by Cybenko W
- Deep neural network theorem
- No free lunch theorem by Wolpert W
- RKHS by Aronszajn and Mercer's theorem W
- Representer theorem by Schölkopf, Herbrich, and Smola W
- Convolution theorem (FT, convolution, correlation with CNN examples) W
- Fourier inversion theorem W
- Wiener–Khinchin theorem about autocorrelation and spectral decomposition W
- Parseval's theorem (and uniform, non-uniform convergence) W
- Probably approximately correct learning with the theorem about compression means learnability
- Bernstein–von Mises theorem W
- Holland's schema theorem W
- Variational approximation
- Convergence of random variables and Kloek's theorem W
- Exponential family of distributions and Nelder's theorem
- Multi-armed bandit theorem
- Copulas and Sklar's theorem W
Theorem types
- Существование и единственность (NN)
- Универсальность
- Сходимость[1]
- Поточечно
- Равномерно
- По мере
- Почти всюду
- По распределению
- По вероятности
- По Чезаро, Борделю, Пуассона, Эйлеру
- Абсолютная
- Условная
- В среднем L1, среднеквадратичном L2
- Сильная, слабая
- Оценки
- Точечная
- Не точечная
- Состоятельная
- Несмещенная
- Эффективная
- Omitted-variable bias
- almost sure, almost everywhere
Talks
- Three works by Greg Yang arXiv:1910.12478, arXiv:2006.14548, arXiv:2009.10685 Youtube Rus
- Theorems on flows by Johann Brehmera and Kyle Cranmera arXiv:2003.13913v2
Расписание лекций
Дата | Тема | Лектор | Ссылки |
---|---|---|---|
10 февраля | Вводное занятие (и Основная теорема статистики) | Стрижов, Потанин | link |
17 февраля | Теорема сходимости перцептрона Ф.Розенблатта, Блока, Джозефа, Кестена | Марк Потанин | link |
24 февраля | Теоремы Колмогорова и Арнольда, теорема об универсальном аппроксиматоре Цыбенко, теорема о глубоких нейросетях | Марк Потанин | link |
10 марта | Берштейн - фон Мизес | Андрей Грабовой | link |
17 марта | Берштейн - фон Мизес (продолжение) | Андрей Грабовой | link |
24 марта | РАС обучаемость, теорема о том, что сжатие предполагает обучаемость | Андрей Грабовой | link |
31 марта | Сходимость про вероятности при выборе моделей | Марк Потанин | link |
7 апреля | Теорема о минимальной длине описания | Олег Бахтеев | link |
14 апреля | Теорема о свертке (Фурье, свертка, автокорреляция) с примерами сверточных сетей | Филипп Никитин | link |
21 апреля | Representer theorem, Schölkopf, Herbrich, and Smola | Андрей Грабовой | link |
28 апреля | Обратная теорема Фурье, теорема Парсеваля (равномерная и неравномерная сходимость) | Филипп Никитин | link |
5 мая | Вариационная аппроксимация, теорема о байесовском выборе моделей | Олег Бахтеев | link |
12 мая | Разбор и обсуждение письменных работ: теоремы их доказательства (входящие в диплом) | Потанин, Стрижов | |
26 мая | Экзамен: схемы доказательства различных теорем (тест на время, как в гос по физике, и обсуждение) | Потанин, Адуенко, Бахтеев | |
Теорема о бесплатных обедах в машинном обучении, Волперт | Радослав Нейчев | ||
Теорема схем, Холланд | Радослав Нейчев |
References
- Mathematical statistics by A.A. Borovkov, 1998
- Learning Theory from First Principles by Francis Bach, 2021
- Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин, 1970 (глава про сходимость)
Proof techniques
- Proofs and Mathematical Reasoning by Agata Stefanowicz, 2014
- The nuts and bolts of proofs by Antonella Cupillari, 2013
- Theorems, Corollaries, Lemmas, and Methods of Proof by Richard J. Rossi, 1956
- Problem Books in Mathematics by P.R. Halmos (editor), 1990
- Les contre-exemples en mathématique par Bertrand Hauchecorne, 2007
- Kolmogorov and Mathematical Logic by Vladimir A. Uspensky // The Journal of Symbolic Logic, Vol. 57, No. 2 (Jun., 1992), 385-412.
- Что такое аксиоматический метод? В.А. Успенский, 2001
- Аксиоматический метод. Е.Е. Золин, 2015
Methodology
- Introduction to Metamathematics by Stephen Cole Kleene, 1950
- Science and Method by Henry Poincare, 1908
- A Summary of Scientific Method by Peter Kosso, 2011
- Being a Researcher: An Informatics Perspective by Carlo Ghezzi, 2020
- The definitive glossary of higher mathematical jargon by Math Vault, 2015
- The definitive guide to learning higher mathematics: 10 principles to mathematical transcendence by Math Vault, 2020
- List of mathematical jargon on Wikipedia
- Пикабу. Типичные методы доказательства, 2018 (если вы чувствуете, что несет не туда)