Породжувальний штучний інтелект

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Детальна картина олією, що зображує фігури на футуристичній оперній сцені
«Театр „Космічна опера“[en]», зображення, породжене Midjourney

Поро́джувальний шту́чний інтеле́кт (поро́джувальний ШІ, англ. generative artificial intelligence, generative AI, GenAI[1]), також генерати́вний шту́чний і́нтелект — це штучний інтелект, здатний породжувати текст, зображення або інші медіа, використовуючи породжувальні моделі.[2][3][4] Породжувальні моделі ШІ навчаються взірців та структури своїх вхідних тренувальних даних і потім породжують нові дані, що мають подібні характеристики.[5][6]

На початку 2020-х років прогрес у глибоких нейронних мережах на основі трансформерів уможливив створення низки видатних систем породжувального ШІ, які приймають на вході підказки природною мовою. До них належать чат-боти великих мовних моделей (ВММ), як-от ChatGPT, Copilot, Bard і LLaMA, а також системи живопису на основі штучного інтелекту для зображення за текстом[en], як-от Stable Diffusion, Midjourney та DALL-E.[7][8][9]

Породжувальний ШІ застосовують у широкому спектрі галузей, включно з живописом, письменництвом, написанням сценаріїв, розробкою програмного забезпечення, дизайном продуктів, охороною здоров'я, фінансами, іграми, маркетингом та модою.[10][11][12] Інвестиції у породжувальний ШІ різко зросли на початку 2020-х років, коли великі компанії, як-от Microsoft, Google та Baidu, а також численні менші фірми розробляли моделі породжувального ШІ.[2][13][14] Проте існують також занепокоєння щодо потенційного неправильного використання породжувального ШІ, включно із кіберзлочинністю, створенням фейкових новин чи дипфейків, які можуть використовувати для обману чи маніпулювання людьми.[15][16]

Історія[ред. | ред. код]

Академічну дисципліну штучного інтелекту заснували на дослідницькому семінарі[en] в Дартмутському коледжі 1956 року, і вона пережила кілька хвиль розвитку та оптимізму протягом наступних десятиліть.[17] З моменту її зародження дослідники у цій галузі порушували філософські та етичні аргументи щодо природи людського розуму та наслідків створення штучних істот із людським інтелектом; ці питання раніше досліджували у міфах, фантастиці[en] та філософії з античних часів.[18] Концепція автоматизованого мистецтва сходить щонайменше до автоматонів давньогрецької цивілізації, де винахідників, таких як Дедал та Герон Александрійський, описували як розробників машин, здатних писати текст, створювати звуки та грати музику.[19][20] Традиція творчих автоматонів процвітала протягом історії, прикладом чого є створення на початку 1800-х років автоматона Майярде[en].[21]

Штучний інтелект — це ідея, яка захоплювала суспільство з середини 20 століття. Це почалося з того, що наукова фантастика познайомила світ із цією концепцією, але цю ідею не було повністю розглянуто в науковому ключі, доки Алан Тюрінг, ерудит, не зацікавився її здійсненністю. Новаторська стаття Тюрінга 1950 року «Обчислювальні машини та інтелект[en]» поставила основоположні питання про машинне міркування, подібне до людського інтелекту, зробивши значний внесок до концептуальної основи ШІ. Розвиток ШІ спершу не був дуже швидким через високу вартість і той факт, що комп'ютери не могли зберігати команди. Ситуація змінилася під час Дартмутського літнього дослідницького проєкту з ШІ[en] 1956 року, де пролунав надихаючий заклик до дослідження ШІ, що зробило його знаковою подією, оскільки створило прецедент для двох десятиліть швидкого просування в цій галузі.[22]

З часу заснування ШІ у 1950-х роках художники та дослідники використовували штучний інтелект для створення художніх творів. На початку 1970-х років Гарольд Коен[en] створював та виставляв роботи породжувального ШІ, які створювала AARON[en], комп'ютерна програма, створена Коеном для породжування картин.[23]

Ланцюги Маркова давно використовують для моделювання природних мов з часу їх розробки російським математиком Андрієм Марковим на початку XX століття. Марков опублікував свою першу статтю на цю тему 1906 року,[24][25][26] проаналізувавши схему голосних і приголосних у романі «Євгеній Онєгін», використовуючи ланцюги Маркова. Щойно ланцюга Маркова навчено на текстовому корпусі, його можливо використовувати як імовірнісний породжувач тексту.[27][28]

Галузь машинного навчання часто використовує статистичні моделі, включно з породжувальними моделями, для моделювання та передбачування даних. Починаючи з кінця 2000-х років, поява глибокого навчання сприяла прогресу та дослідженням у класифікуванні зображень, розпізнаванні мовлення, обробці природної мови та інших завданнях. Нейронні мережі цієї епохи зазвичай тренували як розрізнювальні моделі, через складність породжувального моделювання.[29]

2014 року такі досягнення як варіаційний автокодувальник та породжувальна змагальна мережа створили перші практичні глибокі нейронні мережі, здатні навчатися породжувальних моделей, а не розрізнювальних, для складних даних, таких як зображення. Ці глибокі породжувальні моделі були першими, які виводили не лише мітки класів для зображень, але й цілі зображення.

2017 року мережа Трансформер уможливила поступ у породжувальних моделях, порівняно зі старішими моделями довгої короткочасної пам'яті,[30] що призвело до створення 2018 року першого породжувального попередньо натренованого трансформера (англ. generative pre-trained transformer, GPT), відомого як GPT-1[en].[31] Це продовжив 2019 року GPT-2, який продемонстрував здатність узагальнювати некероване навчання для багатьох різних завдань як модель-основа[en].[32]

2021 року випуск DALL-E, піксельної породжувальної моделі на основі трансформера, за якою вийшли Midjourney та Stable Diffusion, позначив появу практичного високоякісного живопису на основі штучного інтелекту за підказками природною мовою.

У березні 2023 року було випущено GPT-4. Команда з Microsoft Research стверджувала, що «його можливо обґрунтовано розглядати як ранню (але все ще неповну) версію системи сильного штучного інтелекту (СШІ)».[33] Інші вчені оспорювали, що GPT-4 досягає цього порогу, називаючи породжувальний ШІ «ще далеким від досягнення еталону „загального людського інтелекту“» станом на 2023 рік.[34]

Модальності[ред. | ред. код]

Систему породжувального ШІ створюють, застосовуючи до набору даних некероване або самокероване машинне навчання. Можливості системи породжувального ШІ залежать від модальності чи типу використаного набору даних.

Породжувальний ШІ може бути як унімодальним (одномодальним, англ. unimodal), так і мультимодальним[en] (багатомодальним, англ. multimodal); унімодальні системи приймають лише один тип даних входу, тоді як багатомодальні системи можуть приймати понад один тип даних входу.[35] Наприклад, одна з версій GPT-4 від OpenAI приймає на вході як текст, так і зображення.[36]

Текст[ред. | ред. код]

Користувач спілкується з імітацією Людвіга Вітгенштайна у Character.ai

До систем породжувального ШІ, тренованих на словах або словесних токенах, належать GPT-3, LaMDA, LLaMA, BLOOM[en], GPT-4 та інші (див. перелік великих мовних моделей[en]). Вони здатні до обробки природної мови, машинного перекладу та породжування природної мови, і їх можливо використовуватися як моделі-основи[en] для інших завдань.[37] До наборів даних належать BookCorpus[en], Вікіпедія та інші (див. перелік текстових корпусів[en]).

Код[ред. | ред. код]

Окрім тексту природними мовами, великі мовні моделі можливо тренувати на текстах мовами програмування, що дозволяє їм породжувати первинний код для нових комп'ютерних програм.[38] До прикладів належить OpenAI Codex[en].

Зображення[ред. | ред. код]

Stable Diffusion, підказка a photograph of an astronaut riding a horse (укр. фотографія космонавта, який їде на коні)

Видатним застосуванням породжувального ШІ є створення високоякісного образотворчого мистецтва.[39] Багато таких художніх робіт отримали громадські нагороди та визнання.

До систем породжувального ШІ, натренованих на наборах зображень із текстовими підписами[en], належать Imagen, DALL-E, Midjourney, Adobe Firefly[en], Stable Diffusion та інші (див. живопис на основі штучного інтелекту, породжувальне мистецтво, та синтетичні медіа[en]). Їх зазвичай використовують для породжування зображень за текстом[en] та нейронного перенесення стилю[en].[40] До наборів даних належать LAION-5B[en] та інші (див. перелік наборів даних у комп'ютернім баченні та обробці зображень[en]).

Звук[ред. | ред. код]

Породжувальний ШІ також можливо широко навчати на звукових кліпах, щоби створювати синтез мовлення з природним звучанням і можливості перетворення тексту в мовлення, прикладами яких є інструменти контекстного синтезу ElevenLabs[en], та Voicebox від Meta Platforms.[41]

Породжена ШІ музика з сервера Riffusion Inference, за підказкою bossa nova with electric guitar (укр. босанова з електрогітарою)

Системи породжувального ШІ, такі як MusicLM[en][42] та MusicGen,[43] можливо також тренувати на формах хвиль звуку записаної музики разом з текстовими анотаціями, щоби породжувати нові музичні зразки на основі текстових описів, таких як заспокійлива скрипкова мелодія з гітарним рифом з дисторшном на тлі.

Відео[ред. | ред. код]

Runway Gen2, підказка A golden retriever in a suit sitting at a podium giving a speech to the white house press corps (укр. золотистий ретривер у костюмі, сидячи за трибуною, виголошує промову прес-корпусу Білого дому)

Породжувальний ШІ, натренований на анотованому відео, може породжувати часово узгоджені відеокліпи. До прикладів належать Gen-1 та Gen-2 від Runway[en][44] та Make-A-Video від Meta Platforms.[45]

Молекули[ред. | ред. код]

Системи породжувального ШІ можливо тренувати на послідовностях амінокислот або молекулярних поданнях, таких як SMILES, що подають ДНК або білки. Такі системи як AlphaFold[en] використовують для передбачування структури білків та пошук нових ліків[en].[46] До наборів даних належать різноманітні біологічні набори даних[en].

Робототехніка[ред. | ред. код]

Породжувальний ШІ також можливо тренувати на рухах робототехнічної системи, щоби породжувати нові траєкторії для планування руху або навігації[en]. Наприклад, UniPi від Google Research для керування рухами роботизованої руки використовує підказки на кшталт «підніми синю миску» та «витри тарілку жовтою губкою».[47] Мультимодальні моделі «бачення-мова-дія» (англ. "vision-language-action"), такі як RT-2 від Google, можуть виконувати елементарне міркування у відповідь на підказки користувача та візуальні вхідні дані, наприклад, підіймаючи іграшкового динозавра, коли дано підказку підніми вимерлу тварину, зі столу, заповненого іграшковими тваринами та іншими об'єктами.[48]

Планування[ред. | ред. код]

Терміни планува́ння поро́джувальним ШІ (англ. generative AI planning) та поро́джувальне планува́ння (англ. generative planning) використовували в 1980-х та 1990-х роках для позначування систем планування штучним інтелектом, особливо систем автоматизованого проєктування процесів, які використовували для породжування послідовностей дій задля досягнення визначеної мети.[49][50]

Системи планування породжувальним ШІ використовували методи символьного ШІ[en], такі як пошук простором станів[en] та виконання обмежень[en], і були «відносно зрілою» технологією на початку 1990-х років. Їх використовували для породжування планів дій у кризових ситуаціях для військового використання,[51] планів процесів для виробництва[49] та планів рішень, як у прототипах автономних космічних апаратів.[52]

Бізнесова аналітика[ред. | ред. код]

У нещодавніх розробках у галузі породжувального штучного інтелекту як помітне застосування з'явилося поняття «породжувальної бізнесової аналітики (БА)» (англ. "Generative Business Intelligence (BI)").[53] Породжувальна БА означає використання методик породжувального штучного інтелекту для покращення бізнесової та іншої аналітики, що забезпечує поглибленіші інтерпретування даних та процеси вирішування. Цей підхід використовує породжувальні можливості ШІ для моделювання потенційних бізнесових сценаріїв і результатів, надаючи цінне розуміння для стратегічного планування.

Програмне та апаратне забезпечення[ред. | ред. код]

Моделі породжувального ШІ використовують для забезпечення роботи чат-ботових продуктів, як-от ChatGPT, інструментів програмування, як-от GitHub Copilot,[54] продуктів зображення за текстом[en], як-от Midjourney, та продуктів відео за текстом, як-от Runway[en] Gen-2.[55] Функції породжувального ШІ інтегрували в різноманітні наявні комерційно доступні продукти, як-от Microsoft Office,[56] Google Фото,[57] та Adobe Photoshop.[58] Багато моделей породжувального ШІ також доступні як відкрите програмне забезпечення, включно зі Stable Diffusion та мовною моделлю LLaMA.[59]

Менші моделі породжувального ШІ з кількістю параметрів до декількох мільярдів можуть працювати на смартфонах, вбудованих пристроях та персональних комп'ютерах. Наприклад, LLaMA-7B (версія з 7 мільярдами параметрів) може працювати на Raspberry Pi 4[en],[60] а одна версія Stable Diffusion може працювати на iPhone 11.[61]

Більші моделі з десятками мільярдів параметрів можуть працювати на ноутбуках та настільних комп'ютерах. Для досягнення прийнятної швидкості моделі такого розміру можуть вимагати прискорювачів, таких як мікросхеми ГП, вироблені Nvidia та AMD, або Neural Engine, включений до продуктів Apple silicon. Наприклад, версію LLaMA з 65 мільярдами параметрів можливо налаштувати для роботи на настільному ПК.[62]

Мовні моделі з сотнями мільярдів параметрів, такі як GPT-4 та PaLM[en], зазвичай працюють на комп'ютерах центрів обробки даних, оснащених масивами ГП (такими як H100 від Nvidia) або мікросхемами ШІ-прискорювачів (такими як ТП від Google). Ці дуже великі моделі зазвичай доступні як хмарні послуги через Інтернет.

2022 року новий експортний контроль США з передових обчислень та напівпровідників до Китаю[en] запровадив обмеження на експорт до Китаю мікросхем ГП та ШІ-прискорювачів, які використовують для породжувального ШІ.[63] З урахуванням вимог цих санкцій було розроблено такі мікросхеми як Nvidia A800[64] та Biren Technology[en] BR104[65].

На ринку є безкоштовне програмне забезпечення, здатне розпізнавати текст, породжений породжувальним штучним інтелектом (таке як GPTZero), а також зображення, аудіо чи відео походженням з нього.[66]

Занепокоєння[ред. | ред. код]

Вплив ШІ на численні галузі був глибоким, революціонізувавши продуктивність, процеси вирішування й враження клієнтів. Проте на тлі цього прогресу з'явилися виклики й проблеми.

Розвиток породжувального ШІ викликав занепокоєння урядів, бізнесу та окремих осіб, що призвело до протестів, судових позовів, закликів до паузи в експериментах з ШІ[en] та дій з боку багатьох урядів. На брифінгу Ради Безпеки ООН у липні 2023 року генеральний секретар ООН Антоніу Гутерреш заявив: «Породжувальний ШІ має величезний потенціал для добра та зла у великих масштабах», що ШІ може «підсилити глобальний розвиток» та додати від 10 до 15 трильйонів доларів до глобальної економіки до 2030 року, але його зловмисне використання «може спричинити жахливі рівні смерті та руйнувань, широкомасштабну травму та глибокі психологічні ураження на неймовірному рівні».[67]

Втрати робочих місць[ред. | ред. код]

Пікетувальник під час страйку Гільдії сценаристів Америки 2023 року. Хоч це не й було головним пріоритетом, однією з вимог ГСА 2023 року було «регулювання використання (породжувального) ШІ».[68]

Ще з ранніх днів розвитку ШІ творець ELIZA Джозеф Вейценбаум та інші висунули аргументи щодо того, чи завдання, які можуть виконувати комп'ютери, насправді повинні виконуватися ними, враховуючи різницю між комп'ютерами та людьми, а також між кількісними розрахунками та якісними, ціннісними судженнями.[69] У квітні 2023 року було повідомлено, що ШІ для породжування зображень призвів до втрати 70 % робочих місць ілюстраторів відеоігор у Китаї.[70][71] У липні 2023 року розвиток породжувального ШІ посприяв трудовим спорам у Голлівуді. Френ Дрешер, президентка Гільдії кіноакторів США, під час страйку SAG-AFTRA 2023 року заявила, що «штучний інтелект становить екзистенційну загрозу для творчих професій».[72] ШІ породжування голосу розглядають як потенційний виклик для сектору озвучування.[73][74]

Важливим аспектом в усьому світі залишається взаємозв’язок штучного інтелекту та проблем зайнятості серед малопредставлених груп. Незважаючи на те, що штучний інтелект обіцяє підвищення ефективності та набуття навичок, серед цих груп, як зазначено в опитуваннях Fast Company[en], зберігається занепокоєння щодо звільнень та упередженості найму. Щоби використовувати ШІ для справедливішого суспільства, проактивні кроки охоплюють пом'якшування упереджень, підтримування прозорості, повагу до конфіденційності та згоди, а також залучення різних команд і етичних міркувань. Стратегії передбачають перенаправлення політичного акценту на регулювання, інклюзивний дизайн та освітній потенціал для персоналізованого викладання, щоби максимізувати користь і мінімізувати шкоду.[75]

Фінанси[ред. | ред. код]

У фінансовій сфері значні інвестиційні сплески, як підкреслював у дискусіях Дарон Аджемоглу, призвели до перетворювальних інструментів, таких як робоконсультанти, що змінили традиційні фінансові практики. Застереження Аджемоглу щодо потенційних несприятливих суспільних наслідків, спричинених ШІ, зокрема, у збиранні даних, маніпулюванні клієнтами та розбіжностях на ринку праці, підкреслюють складність впливу ШІ на суспільство.[76]

Соціальні ідентичності[ред. | ред. код]

Інтегрування ШІ з соціальними ідентичностями, висвітлена Марчіном Фрацкевичіним, містить як обіцянки, так і виклики. Здатність ШІ трансформувати традиційні дослідницькі методи, розкриваючи тонкі залежності у сфері соціальної ідентичності, має величезний потенціал. Однак упередження, вкорінені в системах ШІ, зберігають стереотипи й маргіналізують групи, підкреслюючи критичну необхідність усунути ці упередження заради інклюзивності.[77]

Дипфейки[ред. | ред. код]

Докладніше: Дипфейк

Дипфейки (від словозлиття англ. "deep learning" — глибоке навчання та англ. "fake" — підробка[78]) — це медіа, створені за допомогою ШІ, які замінюють особу в наявному зображенні чи відео подобою іншої особи за допомогою штучних нейронних мереж.[79] Дипфейки привернули широку увагу та занепокоєння через їх використання у дипфейкових порнографічних відео зі знаменитостями[en], порнопомсті, фейкових новинах, містифікаціях та фінансових шахрайствах[en].[80][81][82][83] Це викликало реакцію з боку як промисловості, так і уряду для виявляння та обмеження їх використання.[84][85]

Звукові дипфейки[ред. | ред. код]

Випадки, коли користувачі зловживають програмним забезпеченням для породжування суперечливих заяв голосом знаменитостей, державних службовців та інших відомих людей, викликали етичні занепокоєння щодо ШІ породжування голосу.[86][87][88][89][90][91] У відповідь такі компанії як ElevenLabs заявили, що працюватимуть над пом'якшенням потенційних зловживань за допомогою заходів безпеки та перевірок особи.[92]

Концерни та фандоми виявилися заваленими породженою ШІ музикою. Те саме програмне забезпечення, яке використовували для клонування голосів, використали для голосів відомих музикантів, щоби створювати пісні, які імітують їхні голоси, що отримало як величезну популярність, так і критику.[93][94][95] Подібні методики також використовували для створення покращеної якості або повнометражних версій пісень, які просочилися або ще не були випущені.[96]

Породжувальний ШІ також використовували для створення нових цифрових особистостей виконавців, причому деякі з них отримали достатньо уваги, щоб отримати контракти на звукозапис від великих лейблів.[97] Розробники цих віртуальних виконавців також зіткнулися зі своєю часткою критики за їхні персоніфіковані програми, включно з негативною реакцією за «дегуманізацію» форми мистецтва, а також створення виконавців, які створюють нереалістичні або аморальні звернення до своєї аудиторії.[98]

Кіберзлочинність[ред. | ред. код]

Здатність породжувального ШІ створювати реалістичний фальшивий вміст використовували в багатьох видах кіберзлочинності, включно з фішинговими аферами.[99] Відео- та звукові дипфейки використовували для створення дезінформації та для шахраювання. Колишній цар шахрайства Google Шуман Госемаджумдер[en] передбачив, що хоча спочатку відеодипфейки викликали сенсацію у ЗМІ, вони незабаром стануть буденними і, як наслідок, небезпечнішими.[100] Крім того, великі мовні моделі та інші види ШІ породжування тексту широко застосовують для ствоерння фальшивих відгуків на вебсайтах електронної комерції з метою підвищення рейтингів.[101] Кіберзлочинці створили великі мовні моделі, зосереджені на шахрайстві, включно з WormGPT та FraudGPT.[102]

Нещодавнє дослідження, проведене 2023 року, показало, що породжувальний ШІ має слабкості, якими злочинці можуть маніпулювати, щоби отримувати шкідливу інформацію в обхід етичних запобіжників. У цьому дослідженні наведено приклади атак на ChatGPT, включно з підвищенням привілеїв і зворотною психологією. Крім того, зловмисники можуть використовувати ChatGPT для атак з використанням соціальної інженерії та фішингу, розкриваючи шкідливий бік цих технологій.[103]

Зловживання у журналістиці[ред. | ред. код]

У січні 2023 року Futurism.com опублікував новину про те, що CNET використовував нерозкритий внутрішній інструмент ШІ для написання принаймні 77 своїх статей; після цього розголосу CNET опублікував виправлення до 41 з цих статей.[104]

У квітні 2023 року німецький таблоїд Die Aktuelle[de] опублікував породжене ШІ фальшиве інтерв'ю з колишнім гонщиком Міхаелем Шумахером, який не з'являвся на публіці з 2013 року після отримання черепно-мозкової травми внаслідок падіння на лижах. У статті було два можливі роз'яснення: на обкладинці було написано «оманливо реально», а в кінці інтерв'ю було зазначено, що його створили за допомогою ШІ. Головного редактора невдовзі після цього скандалу звільнили.[105]

Регулювання[ред. | ред. код]

В Європейському Союзі запропонований Закон про штучний інтелект включає вимоги розкривати захищені авторським правом матеріали, використані для тренування систем породжувального ШІ, та маркувати будь-який породжений ШІ вміст як такий.[106][107]

У Сполучених Штатах група компаній, включно з OpenAI, Alphabet та Meta, підписали добровільну угоду з Білим домом у липні 2023 року, щоби маркувати створений ШІ вміст.[108]

У Китаї Тимчасові заходи з управління послугами породжувального ШІ[en], запроваджені Управлінням кібербезпеки Китаю[en], регулюють будь-який публічний породжувальний ШІ. Вони містять вимоги маркувати породжені зображення та відео, регулювання щодо тренувальних даних та якості міток, обмеження на збирання особистих даних, а також настанову, що породжувальний ШІ повинен «дотримуватися основних соціалістичних цінностей».[109][110]

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. Newsom, Gavin; Weber, Shirley N. (6 вересня 2023). Executive Order N-12-23 (PDF) (англ.). Executive Department, State of California. Процитовано 7 вересня 2023.
  2. а б Griffith, Erin; Metz, Cade (27 січня 2023). Anthropic Said to Be Closing In on $300 Million in New A.I. Funding. The New York Times (англ.). Процитовано 14 березня 2023.
  3. Lanxon, Nate; Bass, Dina; Davalos, Jackie (10 березня 2023). A Cheat Sheet to AI Buzzwords and Their Meanings. Bloomberg News (англ.). Процитовано 14 березня 2023.
  4. Pinaya, Walter H. L.; Graham, Mark S.; Kerfoot, Eric; Tudosiu, Petru-Daniel; Dafflon, Jessica; Fernandez, Virginia; Sanchez, Pedro; Wolleb, Julia та ін. (2023). «Generative AI for Medical Imaging: extending the MONAI Framework» (en). arXiv:2307.15208 [eess.IV]. 
  5. Pasick, Adam (27 березня 2023). Artificial Intelligence Glossary: Neural Networks and Other Terms Explained. The New York Times (амер.). ISSN 0362-4331. Процитовано 22 квітня 2023.
  6. Karpathy, Andrej; Abbeel, Pieter; Brockman, Greg; Chen, Peter; Cheung, Vicki; Duan, Yan; Goodfellow, Ian; Kingma, Durk; Ho, Jonathan; Rein Houthooft; Tim Salimans; John Schulman; Ilya Sutskever; Wojciech Zaremba (16 червня 2016). Generative models (англ.). OpenAI.
  7. Metz, Cade (14 березня 2023). OpenAI Plans to Up the Ante in Tech's A.I. Race. The New York Times (амер.). ISSN 0362-4331. Процитовано 31 березня 2023.
  8. Thoppilan, Romal; De Freitas, Daniel; Hall, Jamie; Shazeer, Noam; Kulshreshtha, Apoorv (20 січня 2022). «LaMDA: Language Models for Dialog Applications» (en). arXiv:2201.08239 [cs.CL]. 
  9. Roose, Kevin (21 жовтня 2022). A Coming-Out Party for Generative A.I., Silicon Valley's New Craze. The New York Times (англ.). Процитовано 14 березня 2023.
  10. Don't fear an AI-induced jobs apocalypse just yet (англ.). The Economist. 6 березня 2023. Процитовано 14 березня 2023.
  11. Harreis, H.; Koullias, T.; Roberts, Roger. Generative AI: Unlocking the future of fashion (англ.).
  12. How Generative AI Can Augment Human Creativity. Harvard Business Review (англ.). 16 червня 2023. ISSN 0017-8012. Процитовано 20 червня 2023.
  13. The race of the AI labs heats up. The Economist (англ.). 30 січня 2023. Процитовано 14 березня 2023.
  14. Yang, June; Gokturk, Burak (14 березня 2023). Google Cloud brings generative AI to developers, businesses, and governments (англ.).
  15. Hendrix, Justin (16 травня 2023). Transcript: Senate Judiciary Subcommittee Hearing on Oversight of AI. techpolicy.press (англ.). Процитовано 19 травня 2023.
  16. Simon, Felix M.; Altay, Sacha; Mercier, Hugo (18 жовтня 2023). Misinformation reloaded? Fears about the impact of generative AI on misinformation are overblown. Harvard Kennedy School Misinformation Review (амер.). doi:10.37016/mr-2020-127. S2CID 264113883.
  17. Crevier, Daniel (1993). AI: The Tumultuous Search for Artificial Intelligence (en-us) . Нью-Йорк, New York: BasicBooks. с. 109. ISBN 0-465-02997-3.
  18. Newquist, H. P. (1994). The Brain Makers: Genius, Ego, And Greed In The Quest For Machines That Think publisher=Macmillan/SAMS (en-us) . Нью-Йорк. с. 45–53. ISBN 978-0-672-30412-5.
  19. Sharkey, Noel (4 липня 2007), A programmable robot from 60 AD (англ.), т. 2611, New Scientist, архів оригіналу за 13 січня 2018, процитовано 22 жовтня 2019
  20. Brett, Gerard (липень 1954), The Automata in the Byzantine "Throne of Solomon", Speculum (англ.), 29 (3): 477—487, doi:10.2307/2846790, ISSN 0038-7134, JSTOR 2846790, S2CID 163031682.
  21. kelinich (8 березня 2014). Maillardet's Automaton. The Franklin Institute (англ.). Процитовано 24 серпня 2023.
  22. Rockwell, Anyoha (28 серпня 2017). The History of Artificial Intelligence. Science in the News (амер.). Процитовано 8 грудня 2023.
  23. Bergen, Nathan; Huang, Angela (2023). A Brief History of Generative AI (PDF). Dichotomies: Generative AI: Navigating Towards a Better Future (англ.) (2): 4.
  24. Gagniuc, Paul A. (2017). Markov Chains: From Theory to Implementation and Experimentation (en-us) . USA, New Jersey: John Wiley & Sons. с. 2—8. ISBN 978-1-119-38755-8.
  25. Grinstead, Charles Miller; Snell, James Laurie (1997). Introduction to Probability (en-us) . American Mathematical Society. с. 464–466. ISBN 978-0-8218-0749-1.
  26. Bremaud, Pierre (9 березня 2013). Markov Chains: Gibbs Fields, Monte Carlo Simulation, and Queues (англ.). Springer Science & Business Media. с. ix. ISBN 978-1-4757-3124-8. Архів оригіналу за 23 березня 2017.
  27. Hayes, Brian (2013). First Links in the Markov Chain. American Scientist (англ.). 101 (2): 92. doi:10.1511/2013.101.92. ISSN 0003-0996.
  28. Fine, Shai; Singer, Yoram; Tishby, Naftali (1 липня 1998). The Hierarchical Hidden Markov Model: Analysis and Applications. Machine Learning (англ.). 32 (1): 41—62. doi:10.1023/A:1007469218079. ISSN 1573-0565. S2CID 3465810.
  29. Jebara, Tony (2012). Machine learning: discriminative and generative (англ.). Т. 755. Springer Science & Business Media.
  30. Cao, Yihan; Li, Siyu; Liu, Yixin; Yan, Zhiling; Dai, Yutong; Yu, Philip S.; Sun, Lichao (7 березня 2023). «A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT» (en). arXiv:2303.04226 [cs.AI]. 
  31. finetune-transformer-lm. GitHub. Процитовано 19 травня 2023.
  32. Radford, Alec; Wu, Jeffrey; Child, Rewon; Luan, David; Amodei, Dario; Sutskever, Ilya; others (2019). Language models are unsupervised multitask learners. OpenAI Blog (англ.). 1 (8): 9.
  33. Bubeck, Sébastien; Chandrasekaran, Varun; Eldan, Ronen; Gehrke, Johannes; Horvitz, Eric; Kamar, Ece; Lee, Peter; Lee, Yin Tat та ін. (22 березня 2023). «Sparks of Artificial General Intelligence: Early experiments with GPT-4» (en). arXiv:2303.12712 [cs.CL]. 
  34. Schlagwein, Daniel; Willcocks, Leslie (13 вересня 2023). ChatGPT et al: The Ethics of Using (Generative) Artificial Intelligence in Research and Science. Journal of Information Technology (англ.). 38 (2): 232—238. doi:10.1177/02683962231200411. S2CID 261753752.
  35. A History of Generative AI: From GAN to GPT-4 (англ.). 21 березня 2023.
  36. Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT?. Reuters (англ.). 17 березня 2023. Процитовано 17 березня 2023.
  37. Bommasani, R.; Hudson, D. A.; Adeli, E.; Altman, R.; Arora, S.; von Arx, S.; Bernstein, M. S.; Bohg, J. та ін. (2021-08-16). «On the opportunities and risks of foundation models» (en). arXiv:2108.07258 [cs.LG]. 
  38. Chen, Ming; Tworek, Jakub; Jun, Hongyu; Yuan, Qinyuan; Pinto, Hanyu Philippe De Oliveira; Kaplan, Jerry; Edwards, Haley; Burda, Yannick та ін. (2021-07-06). «Evaluating Large Language Models Trained on Code» (en). arXiv:2107.03374 [cs.LG]. 
  39. Epstein, Ziv; Hertzmann, Aaron; Akten, Memo; Farid, Hany; Fjeld, Jessica; Frank, Morgan R.; Groh, Matthew; Herman, Laura; Leach, Neil; Mahari, Robert; Pentland, Alex “Sandy”; Russakovsky, Olga; Schroeder, Hope; Smith, Amy (2023). Art and the science of generative AI. Science (англ.). 380 (6650): 1110—1111. arXiv:2306.04141. Bibcode:2023Sci...380.1110E. doi:10.1126/science.adh4451. PMID 37319193. S2CID 259095707.
  40. Ramesh, Aditya; Pavlov, Mikhail; Goh, Gabriel; Gray, Scott; Voss, Chelsea; Radford, Alec; Chen, Mark; Sutskever, Ilya (2021). Zero-shot text-to-image generation. International Conference on Machine Learning. PMLR. с. 8821—8831.
  41. Desai, Saahil (17 липня 2023). A Voicebot Just Left Me Speechless. The Atlantic (англ.). Процитовано 28 листопада 2023.
  42. Agostinelli, Andrea; Denk, Timo I.; Borsos, Zalán; Engel, Jesse; Verzetti, Mauro; Caillon, Antoine; Huang, Qingqing; Jansen, Aren та ін. (26 січня 2023). «MusicLM: Generating Music From Text» (en). arXiv:2301.11325 [cs.SD]. 
  43. Dalugdug, Mandy (3 серпня 2023). Meta in June said that it used 20,000 hours of licensed music to train MusicGen, which included 10,000 "high-quality" licensed music tracks. At the time, Meta's researchers outlined in a paper the ethical challenges that they encountered around the development of generative AI models like MusicGen (англ.).
  44. Metz, Cade (4 квітня 2023). Instant Videos Could Represent the Next Leap in A.I. Technology. The New York Times (англ.).
  45. >Wong, Queenie (29 вересня 2022). Facebook Parent Meta's AI Tool Can Create Artsy Videos From Text (англ.). cnet.com. Процитовано 4 квітня 2023.
  46. Heaven, Will Douglas (15 лютого 2023). AI is dreaming up drugs that no one has ever seen. Now we've got to see if they work. MIT Technology Review (англ.). Massachusetts Institute of Technology. Процитовано 15 березня 2023.
  47. Yang, Sherry; Du, Yilun (12 квітня 2023). UniPi: Learning universal policies via text-guided video generation. Google Research, Brain Team (англ.). Google AI Blog.
  48. Brohan, Anthony (2023). «RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control» (en). arXiv:2307.15818 [cs.RO]. 
  49. а б Alting, Leo; Zhang, Hongchao (1989). Computer aided process planning: the state-of-the-art survey. The International Journal of Production Research (англ.). 27 (4): 553—585. doi:10.1080/00207548908942569.
  50. Chien, Steve (1998). Automated planning and scheduling for goal-based autonomous spacecraft. IEEE Intelligent Systems and Their Applications (англ.). 13 (5): 50—55. doi:10.1109/5254.722362.
  51. Burstein, Mark H., ред. (1994). ARPA/Rome Laboratory Knowledge-based Planning and Scheduling Initiative Workshop Proceedings (англ.). The Advanced Research Projects Agency, Department of Defense, and Rome Laboratory, US Air Force, Griffiss AFB. с. 219. ISBN 155860345X.
  52. Pell, Barney; Bernard, Douglas E.; Chien, Steve A.; Gat, Erann; Muscettola, Nicola; Nayak, P. Pandurang; Wagner, Michael D.; Williams, Brian C. (1998). Bekey, George A. (ред.). An Autonomous Spacecraft Agent Prototype (англ.). Autonomous Robots Volume 5, No. 1. с. 29—45. Наш обмірковувач (англ. deliberator) це традиційний планувальник породжувальним ШІ на основі системи планування HSTS (Мускеттола, 1994), а наша керувальна складова це традиційна система орієнтації космічного приладу (Гекні зі співавт. 1993). Ми також додали архітектурну складову, спеціально присвячену моделюванню світу (ідентифікатор режиму), і розрізняємо керування та відстежування.
  53. Rumiantsau, Michael (16 листопада 2023). Generative BI: Setting a New Standard for Business Intelligence (англ.).
  54. Sabin, Sam (30 червня 2023). GitHub has a vision to make code more secure by design. Axios Codebook (англ.). Процитовано 15 серпня 2023.
  55. Vincent, James (20 березня 2023). Text-to-video AI inches closer as startup Runway announces new model. The Verge (англ.). Процитовано 15 серпня 2023. Відео за текстом є наступним рубежем для породжувального ШІ, хоч поточні результати й зачаткові. Runway каже, що зробить свою нову породжувальну модель відео, Gen-2, доступною для користувачів „найближчими тижнями“.
  56. Vanian, Jonathan (16 березня 2023). Microsoft adds OpenAI technology to Word and Excel (англ.). CNBC. Процитовано 15 серпня 2023. Microsoft привносить технології породжувального штучного інтелекту, такі як популярний чат-бот ChatGPT, до свого пакету програмного забезпечення для бізнесу Microsoft 365....нові функції ШІ, названі Copilot, будуть доступні в деяких з найпопулярніших бізнес-застосунках компанії, включно з Word, PowerPoint та Excel.
  57. Wilson, Mark (15 серпня 2023). The app's Memories feature just got a big upgrade. TechRadar (англ.). Додаток Google Фото отримує оновлену функцію „спогади“ (англ. Memories), яка працює на ШІ...ви зможете використовувати породжувальний ШІ для створення деяких запропонованих назв, таких як „пригода в пустелі“.
  58. Sullivan, Laurie (23 травня 2023). Adobe Adds Generative AI To Photoshop. MediaPost (англ.). Процитовано 15 серпня 2023. Породжувальний штучний інтелект (ШІ) стане однією з найважливіших функцій для творчих дизайнерів та маркетологів. Adobe у вівторок представила функцію Generative Fill (укр. породжувальне заповнення) у Photoshop, щоби привнести можливості ШІ Firefly до дизайну.
  59. Michael Nuñez (19 липня 2023). LLaMA 2: How to access and use Meta's versatile open-source chatbot right now. VentureBeat (англ.). Процитовано 15 серпня 2023. Якщо ви хочете запустити LLaMA 2 на своєму власному пристрої або змінити код, ви можете завантажити його безпосередньо з Hugging Face, провідної платформи для обміну моделями ШІ.
  60. Pounder, Les (25 березня 2023). How To Create Your Own AI Chatbot Server With Raspberry Pi 4 (англ.). Процитовано 15 серпня 2023. Використовуючи Pi 4 з 8 ГБ оперативної пам'яті, ви можете створити сервер на кшталт ChatGPT на основі LLaMA.
  61. Kemper, Jonathan (10 листопада 2022). "Draw Things" App brings Stable Diffusion to the iPhone. The Decoder (англ.). Процитовано 15 серпня 2023. Draw Things — це додаток, який привносить Stable Diffusion на iPhone. Зображення породжуються ШІ локально, тому з'єднання з Інтернет вам не потрібне.
  62. Witt, Allan (7 липня 2023). Best Computer to Run LLaMA AI Model at Home (GPU, CPU, RAM, SSD) (англ.). Щоби запустити модель LLaMA вдома, вам знадобиться комп'ютерна конфігурація з потужним ГП, який може обробляти велику кількість даних та обчислень, необхідних для висновування.
  63. Nellis, Stephen; Lee, Jane (1 вересня 2022). U.S. officials order Nvidia to halt sales of top AI chips to China. Reuters (англ.). Процитовано 15 серпня 2023.
  64. Shilov, Anton (7 травня 2023). Nvidia's Chinese A800 GPU's Performance Revealed (англ.). Tom's Hardware. Процитовано 15 серпня 2023. A800 працює на 70 % швидкості ГП A100, дотримуючись суворих стандартів експорту США, які обмежують обсяг обчислювальної потужності, яку може продавати Nvidia.
  65. Patel, Dylan (24 жовтня 2022). How China's Biren Is Attempting To Evade US Sanctions (англ.). Процитовано 15 серпня 2023.
  66. 5 free software to recognise fake AI-generated images (італ.). 28 жовтня 2023.
  67. Secretary-General's remarks to the Security Council on Artificial Intelligence. un.org (англ.). 18 липня 2023. Процитовано 27 липня 2023.
  68. The Writers Strike Is Taking a Stand on AI. Time (англ.). 4 травня 2023. Процитовано 11 червня 2023.
  69. Tarnoff, Ben (4 серпня 2023). Lessons from Eliza. The Guardian Weekly[en] (англ.). с. 34—39.
  70. Zhou, Viola (11 квітня 2023). AI is already taking video game illustrators' jobs in China. Rest of World (амер.). Процитовано 17 серпня 2023.
  71. Carter, Justin (11 квітня 2023). China's game art industry reportedly decimated by growing AI use. Game Developer (англ.). Процитовано 17 серпня 2023.
  72. Collier, Kevin (14 липня 2023). Actors vs. AI: Strike brings focus to emerging use of advanced tech (англ.). NBC News. SAG-'AFTRA приєдналася до Гільдії письменників [так] Америки у вимозі контракту, який явно вимагає регулювання ШІ для захисту письменників та творів, які вони створюють. ... Майбутнє породжувального штучного інтелекту в Голлівуді — і як його можливо використати для заміни робочої сили — стало ключовим моментом для акторів, які страйкують. На пресконференції у четвер Френ Дрешер, президентка Гільдії кіноакторів — Американської федерації телебачення та радіомовлення (більш знаної як SAG-AFTRA), заявила, що „штучний інтелект становить екзистенційну загрозу для творчих професій, і всі діячі та виконавці заслуговують на мову контракту, яка захищає їх від того, щоби їхню ідентичність та талант експлуатували без згоди та оплати.“
  73. Wiggers, Kyle (22 серпня 2023). ElevenLabs' voice-generating tools launch out of beta. TechCrunch (амер.). Процитовано 25 вересня 2023.
  74. Shrivastava, Rashi. 'Keep Your Paws Off My Voice': Voice Actors Worry Generative AI Will Steal Their Livelihoods. Forbes (англ.). Процитовано 28 листопада 2023.
  75. Gupta, Shalene (31 жовтня 2023). Underrepresented groups in countries around the world are worried about AI being a threat to jobs. Fast Company (англ.). Процитовано 8 грудня 2023.
  76. Dangers of unregulated artificial intelligence. CEPR (англ.). 23 листопада 2021. Процитовано 8 грудня 2023.
  77. Frąckiewicz, Marcin (29 серпня 2023). Artificial Intelligence and the Study of Social Identity. TS2 SPACE (амер.). Процитовано 8 грудня 2023.
  78. Brandon, John (16 лютого 2018). Terrifying high-tech porn: Creepy 'deepfake' videos are on the rise. Fox News (амер.). Архів оригіналу за 15 червня 2018. Процитовано 20 лютого 2018.
  79. Cole, Samantha (24 січня 2018). We Are Truly Fucked: Everyone Is Making AI-Generated Fake Porn Now. Vice (англ.). Архів оригіналу за 7 вересня 2019. Процитовано 4 травня 2019.
  80. What Are Deepfakes & Why the Future of Porn is Terrifying. Highsnobiety (амер.). 20 лютого 2018. Архів оригіналу за 14 липня 2021. Процитовано 20 лютого 2018.
  81. Experts fear face swapping tech could start an international showdown. The Outline (англ.). Архів оригіналу за 16 січня 2020. Процитовано 28 лютого 2018.
  82. Roose, Kevin (4 березня 2018). Here Come the Fake Videos, Too. The New York Times (амер.). ISSN 0362-4331. Архів оригіналу за 18 червня 2019. Процитовано 24 березня 2018.
  83. Schreyer, Marco; Sattarov, Timur; Reimer, Bernd; Borth, Damian (2019). «Adversarial Learning of Deepfakes in Accounting» (en). arXiv:1910.03810 [cs.LG]. 
  84. Join the Deepfake Detection Challenge (DFDC). deepfakedetectionchallenge.ai (англ.). Архів оригіналу за 12 січня 2020. Процитовано 8 листопада 2019.
  85. Clarke, Yvette D. (28 червня 2019). H.R.3230 – 116th Congress (2019-2020): Defending Each and Every Person from False Appearances by Keeping Exploitation Subject to Accountability Act of 2019. www.congress.gov (англ.). Архів оригіналу за 17 грудня 2019. Процитовано 16 жовтня 2019.
  86. People Are Still Terrible: AI Voice-Cloning Tool Misused for Deepfake Celeb Clips. PCMag Middle East (en-ae) . 31 січня 2023. Процитовано 25 липня 2023.
  87. The generative A.I. software race has begun. Fortune (англ.). Процитовано 3 лютого 2023.
  88. Milmo, Dan; Hern, Alex (20 травня 2023). Elections in UK and US at risk from AI-driven disinformation, say experts. The Guardian (en-GB) . ISSN 0261-3077. Процитовано 25 липня 2023.
  89. Seeing is believing? Global scramble to tackle deepfakes. news.yahoo.com (амер.). Процитовано 3 лютого 2023.
  90. Vincent, James (31 січня 2023). 4chan users embrace AI voice clone tool to generate celebrity hatespeech. The Verge (амер.). Процитовано 3 лютого 2023.
  91. Thompson, Stuart A. (12 березня 2023). Making Deepfakes Gets Cheaper and Easier Thanks to A.I. The New York Times (амер.). ISSN 0362-4331. Процитовано 25 липня 2023.
  92. A new AI voice tool is already being abused to make deepfake celebrity audio clips. Engadget (амер.). 31 січня 2023. Процитовано 3 лютого 2023.
  93. Gee, Andre (20 квітня 2023). Just Because AI-Generated Rap Songs Go Viral Doesn't Mean They're Good. Rolling Stone (амер.). Процитовано 6 грудня 2023.
  94. Coscarelli, Joe (19 квітня 2023). An A.I. Hit of Fake 'Drake' and 'The Weeknd' Rattles the Music World. The New York Times (англ.). Процитовано 5 грудня 2023.
  95. Lippiello, Emily; Smith, Nathan; Pereira, Ivan (3 листопада 2023). AI songs that mimic popular artists raising alarms in the music industry. ABC News (англ.). Процитовано 6 грудня 2023.
  96. Skelton, Eric. Fans Are Using Artificial Intelligence to Turn Rap Snippets Into Full Songs. Complex (en-us) . Процитовано 6 грудня 2023.
  97. Marr, Bernard. Virtual Influencer Noonoouri Lands Record Deal: Is She The Future Of Music?. Forbes (англ.). Процитовано 6 грудня 2023.
  98. Thaler, Shannon (8 вересня 2023). Warner Music signs first-ever record deal with AI pop star. New York Post (амер.). Процитовано 6 грудня 2023.
  99. Sjouwerman, Stu (26 грудня 2022). Deepfakes: Get ready for phishing 2.0. Fast Company[en] (англ.). Процитовано 31 липня 2023.
  100. Sonnemaker, Tyler. As social media platforms brace for the incoming wave of deepfakes, Google's former 'fraud czar' predicts the biggest danger is that deepfakes will eventually become boring. Business Insider (амер.). Процитовано 31 липня 2023.
  101. Collinson, Patrick (15 липня 2023). Fake reviews: can we trust what we read online as use of AI explodes?. The Guardian (en-GB) . ISSN 0261-3077. Процитовано 6 грудня 2023.
  102. After WormGPT, FraudGPT Emerges to Help Scammers Steal Your Data. PCMAG (англ.). Процитовано 31 липня 2023.
  103. Gupta, Maanak; Akiri, Charankumar; Aryal, Kshitiz; Parker, Eli; Praharaj, Lopamudra (2023). From ChatGPT to ThreatGPT: Impact of Generative AI in Cybersecurity and Privacy | IEEE Journals & Magazine | IEEE Xplore. IEEE Access (англ.). 11: 80218—80245. doi:10.1109/ACCESS.2023.3300381. S2CID 259316122.
  104. Roth, Emma (25 січня 2023). CNET found errors in more than half of its AI-written stories. The Verge (англ.). Процитовано 17 червня 2023.
  105. A magazine touted Michael Schumacher's first interview in years. It was actually AI. NPR (англ.). 28 квітня 2023. Процитовано 17 червня 2023.
  106. ChatGPT and the EU AI Act. mhc.ie (англ.). Mason Hayes & Curran. Процитовано 29 листопада 2023.
  107. Chee, Foo Yun; Mukherjee, Supantha (14 червня 2023). EU lawmakers vote for tougher AI rules as draft moves to final stage. Reuters (англ.). Процитовано 26 липня 2023.
  108. Bartz, Diane; Hu, Krystal (21 липня 2023). OpenAI, Google, others pledge to watermark AI content for safety, White House says. Reuters (англ.).
  109. Ye, Josh (13 липня 2023). China says generative AI rules to apply only to products for the public. Reuters (англ.). Процитовано 13 липня 2023.
  110. 生成式人工智能服务管理暂行办法 (кит.). 13 липня 2023.