Річард Саттон
Річард Саттон | |
---|---|
Народився | 20 століття Огайо, США |
Місце проживання | Канада |
Країна | Канада |
Діяльність | інформатик, інженер, дослідник штучного інтелекту, викладач університету |
Alma mater | Массачусетський університет в Емгерсті Стенфордський університет |
Галузь | навчання з підкріпленням, інформатика[d][1], ШІ[1], машинне навчання[1] і інформатика[1] |
Заклад | Альбертський університет |
Науковий керівник | Ендрю Барто |
Аспіранти, докторанти | Doina Precupd[2] Девід Сілвер (інформатик)d |
Членство | Асоціація з розвитку штучного інтелекту Лондонське королівське товариство[3] |
Відомий завдяки: | Метод часових різниць, Dyna, Options, GQ(λ) |
Нагороди | |
Особ. сторінка | incompleteideas.net |
Річард Саттон у Вікісховищі |
Річард С. Саттон (англ. Richard Sutton; нар. ?) — канадський науковець з інформатики. Він є видатним науковим дослідником у DeepMind і професором інформатики в Університеті Альберти. Саттон вважається одним із засновників сучасного обчислювального навчання з підкріпленням,[4] завдяки значному внеску у цю сферу, включаючи метод часових різниць і методи градієнтної стратегії.
Річард Саттон народився в Огайо та виріс в Оук-Бруку, штат Іллінойс, передмісті Чикаго.
Саттон отримав ступінь бакалавра з психології в Стенфордському університеті в 1978 році, перш ніж отримати ступінь магістра (1980) та доктора філософії (1984) з інформатики в Массачусетському університеті в Емгерсті під керівництвом Ендрю Барто. Його докторська дисертація «Тимчасове призначення кредиту в навчанні з підкріпленням» (англ. Temporal Credit Assignment in Reinforcement Learning) представила архітектуру критики діяча та тимчасове призначення кредиту.[5]
У 1984 році Саттон був постдокторантом Массачусетського університету в Емгерсті.
З 1985 по 1994 рік він був головним технічним співробітником Лабораторії Комп'ютерних та Інтелектуальних Систем GTE в Уолтемі, штат Массачусетс. У 1995 році він повернувся до Массачусетського університету в Емгерсті ролі старшого наукового співробітника.
З 1998 по 2002 рік Саттон працював у Шеннонській лабораторії AT&T у Флохем-Парку, штат Нью-Джерсі, як головний технічний співробітник відділу штучного інтелекту.
З 2003 року він є професором обчислювальної науки в університеті Альберти. Він очолював місцеву Лабораторію Навчання з підкріпленням та Штучного Інтелекту до 2018 року.
Зберігаючи свою професорську посаду, у червні 2017 року Саттон приєднався до компанії DeepMind як видатний вчений-дослідник і співзасновник її нового офісу в Едмонтоні.[5][6]
Саттон став громадянином Канади в 2015 році і відмовився від громадянства США в 2017 році.
- Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction [Архівовано 7 січня 2022 у Wayback Machine.]. MIT Press, 1998. Also translated into Japanese and Russian. Second edition [Архівовано 17 грудня 2021 у Wayback Machine.] MIT Press 2018.
- Miller, W. T., Sutton, R. S., Werbos, P. J. (Eds.), Neural Networks for Control [Архівовано 17 грудня 2021 у Wayback Machine.]. MIT Press, 1991.
- Sutton, R. S. (Ed.), Reinforcement Learning. Reprinting of a special issue of Machine Learning Journal. Kluwer Academic Press, 1992
Саттон є членом Асоціації з Розвитку Штучного Інтелекту (AAAI) з 2001 року.[7] У 2003 році він отримав премію Президента від Міжнародного Суспільства Нейронних Мереж (англ. The International Neural Network Society),[8] а в 2013 році — премію за видатні досягнення в галузі досліджень від Массачусетського університету в Емгерсті.[9]
Номінація Саттона як члена AAAI звучить так:[7]
За значний внесок у велику кількість тем з машинного навчання, зокрема навчання з підкріпленням, методи часових різниць та нейронні мережі.
У 2021 році Саттон був обраний членом Королівського товариства.[10]
- ↑ а б в г Чеська національна авторитетна база даних
- ↑ Математичний генеалогічний проєкт — 1997.
- ↑ https://royalsociety.org/news/2021/05/new-fellows-announcement-2021/
- ↑ Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning. 11 січня 2018. Архів оригіналу за 11 січня 2018. Процитовано 17 грудня 2018.
- ↑ а б Brief Biography for Richard Sutton. incompleteideas.net. Архів оригіналу за 6 липня 2018. Процитовано 17 грудня 2018.
- ↑ DeepMind expands to Canada with new research office in Edmonton, Alberta. DeepMind. Архів оригіналу за 30 травня 2019. Процитовано 17 грудня 2018.
- ↑ а б Elected AAAI Fellows. www.aaai.org. Архів оригіналу за 26 травня 2019. Процитовано 17 грудня 2018.
- ↑ INNS Award Recipients. www.inns.org. Архів оригіналу за 17 грудня 2021. Процитовано 17 грудня 2018.
- ↑ Outstanding Achievement and Advocacy Award Recipients. College of Information and Computer Sciences, University of Massachusetts Amherst (англ.). 5 жовтня 2010. Архів оригіналу за 17 грудня 2021. Процитовано 17 грудня 2018.
- ↑ Royal Society elects outstanding new Fellows and Foreign Members. royalsociety.org. Архів оригіналу за 6 травня 2021. Процитовано 8 червня 2021.
- Домашня сторінка Річарда Саттона [Архівовано 6 червня 2014 у Wayback Machine.]