Річард Саттон
Річард Саттон | |
---|---|
Народився |
20 століття Огайо, США |
Місце проживання | Канада |
Країна | Канада |
Діяльність | інформатик, інженер, дослідник штучного інтелекту, викладач університету |
Alma mater |
Массачусетський університет в Емгерсті Стенфордський університет |
Галузь | навчання з підкріпленням, інформатика[d][1], ШІ[1], машинне навчання[1] і інформатика[1] |
Заклад | Альбертський університет |
Науковий керівник | Ендрю Барто |
Аспіранти, докторанти |
Doina Precupd[2] Девід Сілвер (інформатик)d |
Членство |
Асоціація з розвитку штучного інтелекту Лондонське королівське товариство[3] |
Відомий завдяки: | Метод часових різниць, Dyna, Options, GQ(λ) |
Нагороди | |
Особ. сторінка | incompleteideas.net |
Річард Саттон у Вікісховищі |
Річард С. Саттон — канадський науковець з інформатики. Він є видатним науковим дослідником у DeepMind і професором інформатики в Університеті Альберти. Саттон вважається одним із засновників сучасного обчислювального навчання з підкріпленням,[4] завдяки значному внеску у цю сферу, включаючи метод часових різниць і методи градієнта стратегії.
Життя і освіта
Річард Саттон народився в Огайо та виріс в Оук-Бруку, штат Іллінойс, передмісті Чикаго.
Саттон отримав ступінь бакалавра з психології в Стенфордському університеті в 1978 році, перш ніж отримати ступінь магістра (1980) та доктора філософії (1984) з інформатики в Массачусетському університеті в Амгерсті[en] під керівництвом Ендрю Барто. Його докторська дисертація «Тимчасове призначення кредиту в навчанні з підкріпленням» (англ. Temporal Credit Assignment in Reinforcement Learning) представила архітектуру критики діяча та тимчасове призначення кредиту.[5]
Кар'єра
У 1984 році Саттон був постдокторантом Массачусетського університету.
З 1985 по 1994 рік він був головним технічним співробітником Лабораторії Комп'ютерних та Інтелектуальних Систем GTE в Уолтемі, штат Массачусетс. У 1995 році він повернувся до Массачусетського університету в ролі старшого наукового співробітника.
З 1998 по 2002 рік Саттон працював у Шеннонській лабораторії AT&T у Флохем-Парку, штат Нью-Джерсі, як головний технічний співробітник відділу штучного інтелекту.
З 2003 року він є професором обчислювальної науки в університеті Альберти. Він очолював місцеву Лабораторію Навчання з підкріпленням та Штучного Інтелекту до 2018 року.
Зберігаючи свою професорську посаду, у червні 2017 року Саттон приєднався до компанії DeepMind як видатний вчений-дослідник і співзасновник її нового офісу в Едмонтоні.[5][6]
Саттон став громадянином Канади в 2015 році і відмовився від громадянства США в 2017 році.
Обрані публікації (англ. мовою)
- Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction. MIT Press, 1998. Also translated into Japanese and Russian. Second edition MIT Press 2018.
- Miller, W. T., Sutton, R. S., Werbos, P. J. (Eds.), Neural Networks for Control. MIT Press, 1991.
- Sutton, R. S. (Ed.), Reinforcement Learning. Reprinting of a special issue of Machine Learning Journal. Kluwer Academic Press, 1992
Нагороди та відзнаки
Саттон є членом Асоціації з Розвитку Штучного Інтелекту (AAAI) з 2001 року.[7] У 2003 році він отримав премію Президента від Міжнародного Суспільства Нейронних Мереж (англ. The International Neural Network Society),[8] а в 2013 році — премію за видатні досягнення в галузі досліджень від університету Массачусетса в Амгерсті[en].[9]
Номінація Саттона як члена AAAI звучить так:[7]
За значний внесок у велику кількість тем з машинного навчання, зокрема навчання з підкріпленням, методи часових різниць та нейронні мережі.
У 2021 році Саттон був обраний членом Королівського товариства.[10]
Примітки
- ↑ а б в г Czech National Authority Database
- ↑ Математичний генеалогічний проєкт — 1997.
- ↑ https://royalsociety.org/news/2021/05/new-fellows-announcement-2021/
- ↑ Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning. 11 січня 2018. Архів оригіналу за 11 січня 2018. Процитовано 17 грудня 2018.
- ↑ а б Brief Biography for Richard Sutton. incompleteideas.net. Процитовано 17 грудня 2018.
- ↑ DeepMind expands to Canada with new research office in Edmonton, Alberta. DeepMind. Процитовано 17 грудня 2018.
- ↑ а б Elected AAAI Fellows. www.aaai.org. Процитовано 17 грудня 2018.
- ↑ INNS Award Recipients. www.inns.org. Процитовано 17 грудня 2018.
- ↑ Outstanding Achievement and Advocacy Award Recipients. College of Information and Computer Sciences, University of Massachusetts Amherst (англ.). 5 жовтня 2010. Процитовано 17 грудня 2018.
- ↑ Royal Society elects outstanding new Fellows and Foreign Members. royalsociety.org. Процитовано 8 червня 2021.