GPT-4

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
GPT-4
Тип велика мовна модель
модель штучного інтелектуd і Generative Pre-Trained Transforme[1]
Розробник OpenAI
Мова програмування Python
Ліцензія пропрієтарна ліцензія[d]
Вебсайт openai.com/gpt-4

GPT-4 (Generative Pre-trained Transformer 4) — мультимодальна велика модель мови, створена компанією OpenAI, четверта в серії GPT. Випущена 14 березня 2023 року і доступна для користувачів платної версії ChatGPT — ChatGPT Plus[2]. Як трансформер, GPT-4 була попередньо навчена прогнозувати наступний токен (використовуючи окрім загальнодоступних даних також «дані, ліцензовані сторонніми постачальниками»), а потім допрацьована за допомогою навчання з підкріпленням на базі відгуків людей[3].

Можливості[ред. | ред. код]

В технічному звіті GPT-4 не вказано розмір моделі, посилаючись на «конкурентне середовище і наслідки для безпеки великомасштабних моделей»[3]. The Verge цитував плітки, що ніби-то GPT-4 суттєво збільшить кількість параметрів з 175 мільярдів в GPT-3 до 100 трильйонів, які генеральний директор OpenAI Сем Альтман назвав «повною маячнею»[4]. Представники США Дон Бейер і Тед Лью підтвердили для New York Times, що Альтман відвідував Конгрес США в січні 2023 року для того, щоб продемонструвати GPT-4 та його покращені «елементи керування безпекою» порівняно з іншими моделями ШІ[5].

Компанія OpenAI написала в своєму блозі, що «GPT-4 надійніший, креативніший та здатний обробляти набагато складніші інструкції, ніж GPT-3.5»[2]. Нова модель може читати, аналізувати чи генерувати до 25 000 слів тексту, що значно більше ніж попередня версія технології[6][7].

Сприйняття[ред. | ред. код]

Газета Нью-Йорк таймс писала, що модель GPT-4 продемонструвала вражаючі покращення в точності порівняно з GPT-3.5, отримала можливість узагальнювати складні тексти, коментувати зображення, пройшла адвокатський екзамен і декілька стандартних тестів, але все ж мала схильність до галюцинацій у відповідях[8].

Критика[ред. | ред. код]

Компанія OpenAI критикувалась багатьма дослідниками машинного навчання за рішення приховати технічні дані про процес навчання моделі, зокрема розмір та джерела навчальних даних, витрати електроенергії, інформацію про обладнання та методи навчання. Деякі дослідники висловили думку, що приховування джерел даних, які використовувались для навчання, ускладнить перевірку безпеки ШІ (зокрема, як і чому в GPT-4 трапляються галюцинації)[9].

Генеральний директор компанії Lightning AI, Вільям Фалькон, так прокоментував звіт OpenAI: «Я думаю усіх турбує те, що OpenAI створили цілий документ приблизно в 90 сторінок. Створюється враження, ніби модель відкрита та академічна, але це не так. Вони практичного нічого там не описали»[10]. Фалькон також вказав, що звіт OpenAI «замаскований під дослідження» і «це стане поганим прецедентом»

Використання[ред. | ред. код]

GPT-4 доступний як API та для користувачів ChatGPT Plus.

Компанія Microsoft підтвердила, що версії Bing, які використовували GPT, насправді використовували GPT-4 до його офіційного релізу[11]. 17 березня 2023 року Microsoft розповіла про плани подальшої інтеграції GPT-4 в свої продукти, анонсувавши Microsoft 365 Copilot, «який буде вбудований в програми, які мільйони людей використовують кожного дня: Word, Excel, PowerPoint, Outlook, Teams та інші»[12].

Duolingo інтегрували GPT-4 в свій додаток і додали дві нові функції: «Рольові ігри» і «Поясни мою відповідь». Функціонал поки що доступний лише для тих, хто вивчає французьку мову чи іспанську з англійської[13].

Джерела даних[ред. | ред. код]

Докладніше: ChatGPT#Джерела даних

GPT-4, як і його попередники, використовує різноманітні джерела даних для покращення розуміння мови та можливостей створення. Проте точні набори даних, які використовуються для його навчання, не були конкретно розкриті OpenAI через міркування конфіденційності. Тим не менш, можна зробити висновок з його продуктивності та загальних практик OpenAI, що його навчання включало великий корпус цифрового тексту[14].

Примітки[ред. | ред. код]

  1. а б https://www.makeuseof.com/gpt-models-explained-and-compared
  2. а б GPT-4. openai.com. 14 березня 2023. Архів оригіналу за 14 березня 2023. Процитовано 14 березня 2023.
  3. а б GPT-4 Technical Report (PDF). OpenAI. 2023. Архів (PDF) оригіналу за 14 березня 2023. Процитовано 14 березня 2023.
  4. Vincent, James (18 січня 2023). OpenAI CEO Sam Altman on GPT-4: "people are begging to be disappointed and they will be". The Verge. Архів оригіналу за 26 січня 2023. Процитовано 27 січня 2023.
  5. Kang, Cecilia (3 березня 2023). As A.I. Booms, Lawmakers Struggle to Understand the Technology. The New York Times. Архів оригіналу за 3 березня 2023. Процитовано 3 березня 2023.
  6. GPT-4. OpenAI. 14 березня 2023. Архів оригіналу за 14 березня 2023. Процитовано 14 березня 2023.
  7. GPT-4 Developer Livestream (Videotape) (англ.). OpenAI. 14 березня 2023. Архів оригіналу за 14 березня 2023. Процитовано 14 березня 2023 — через YouTube.
  8. Metz, Cade (14 березня 2023). 10 Ways GPT-4 Is Impressive but Still Flawed. The New York Times (амер.). Архів оригіналу за 14 березня 2023. Процитовано 14 березня 2023.
  9. Sanderson, Katharine (16 березня 2023). GPT-4 is here: what scientists think. Nature (англ.). doi:10.1038/d41586-023-00816-5.
  10. Lightning AI CEO slams OpenAI’s GPT-4 paper as ‘masquerading as research’. VentureBeat (амер.). 15 березня 2023. Процитовано 18 березня 2023.
  11. Microsoft’s new Bing was using GPT-4 all along. techcrunch.com. 14 березня 2023. Архів оригіналу за 15 березня 2023. Процитовано 14 березня 2023.
  12. Warren, Tom (16 березня 2023). Microsoft announces Copilot: the AI-powered future of Office documents. The Verge.
  13. Introducing Duolingo Max, a learning experience powered by GPT-4. Duolingo Blog. 14 березня 2023.
  14. GPT-4 (9 червня 2023). Create an ideal subchapter "Data sources" for the ideal Wikipedia article "GPT-4" (eng) . OpenAI.