GPT-4o
| Тип | |
|---|---|
| Розробник | OpenAI |
| Перший випуск | 13 травня 2024 |
| Нестабільний випуск | ChatGPT-4o-latest (26 березня 2025) |
| Доступні мови | 50 мов |
| Українська мова | є |
| Ліцензія | власницька |
| Вебсайт | openai.com/index/hello-gpt-4o |
GPT-4o («o» від «omni») — це багатомовний, мультимодальний генеративний попередньо навчений трансформер, розроблений OpenAI та випущений у травні 2024 року.[1] Він може обробляти та генерувати текст, зображення та аудіо.[2][3] GPT-4o безкоштовний, але передплатники плану ChatGPT Plus мають вищі ліміти використання.[4]
Можливості GPT-4o щодо генерації аудіо використовувалися в розширеному голосовому режимі ChatGPT.[5] 18 липня 2024 року OpenAI випустила GPT-4o mini - зменшену версію GPT-4o, яка замінила GPT-3.5 Turbo в інтерфейсі ChatGPT.[6] Здатність GPT-4o генерувати зображення була реалізована пізніше, у березні 2025 року, коли вона замінила DALL-E 3 у ChatGPT.[7]
Кілька версій GPT-4o спочатку були таємно запущені під різними назвами на арені чатботів Large Model Systems Organization (LMSYS) як три різні моделі. Ці три моделі називалися gpt2-chatbot, im-a-good-gpt2-chatbot та im-also-a-good-gpt2-chatbot.[8] 7 травня 2024 року генеральний директор OpenAI Сем Альтман написав у Твіттері «im-a-good-gpt2-chatbot», що зазвичай інтерпретувалося як підтвердження того, що це нові моделі OpenAI, що проходять A/B-тестування.[9][10]
Коли GPT-4o був випущений у травні 2024 року, він досяг найсучасніших результатів у тестах голосового, багатомовного та візуального розпізнавання, встановивши нові рекорди в розпізнаванні та перекладі аудіомовлення.[11][12][13] GPT-4o набрав 88,7 балів у тесті Massive Multitask Language Understanding (MMLU), порівняно з 86,5 у GPT-4.[14] На відміну від GPT-3.5 та GPT-4, які покладаються на інші моделі для обробки звуку, GPT-4o має вбудовану підтримку голосового перетворення.[14] Розширений голосовий режим був відкладений і нарешті випущений для передплатників ChatGPT Plus та Team у вересні 2024 року.[15] 1 жовтня 2024 року було представлено API реального часу.[16]
На момент випуску модель підтримувала понад 50 мов[1], які, за твердженням OpenAI, охоплюють понад 97 % носіїв.[17] Міра Мураті продемонструвала багатомовність моделі, розмовляючи з нею італійською та перекладаючи між англійською та італійською мовами під час прямої трансляції демонстрації OpenAI 13 травня 2024 року. Крім того, новий токенаізатор[18] використовує менше токенів для певних мов, особливо мов, які не базуються на латинському алфавіті, що робить його дешевшим для цих мов.[14]
GPT-4o має знання станом на жовтень 2023 року[19][20], але може отримати доступ до Інтернету, якщо потрібна актуальна інформація. Він має довжину контексту 128 тисяч токенів.[19]
У серпні 2024 року OpenAI представила нову функцію, яка дозволяє корпоративним клієнтам налаштовувати GPT-4o, використовуючи власні дані компанії. Ця настройка, відома як точне налаштування, дозволяє компаніям адаптувати GPT-4o до конкретних завдань або галузей, підвищуючи його корисність у таких сферах, як обслуговування клієнтів та спеціалізовані сфери знань. Раніше точне налаштування було доступне лише для менш потужної моделі GPT-4o mini.[21][22]
Процес точного налаштування вимагає від клієнтів завантаження своїх даних на сервери OpenAI, а навчання зазвичай триває від однієї до двох годин. У цьому розгортанні OpenAI зосереджена на зменшенні складності та зусиль, необхідних підприємствам для адаптації рішень штучного інтелекту до своїх потреб, що потенційно може підвищити впровадження та ефективність штучного інтелекту в корпоративному середовищі.[23][21]
18 липня 2024 року OpenAI випустила меншу та дешевшу версію - GPT-4o mini.[24]
Згідно з повідомленнями OpenAI, її низька вартість, як очікується, буде особливо корисною для компаній, стартапів та розробників, які прагнуть інтегрувати його у свої сервіси, які часто здійснюють велику кількість викликів API. Її API коштує 0,15 долара США за мільйон вхідних токенів та 0,6 долара США за мільйон вихідних токенів, порівняно з 2,50 доларами США та 10 доларами США[25], відповідно, для GPT-4o. Вона також значно потужніша та на 60 % дешевша, ніж GPT-3.5 Turbo, яку вона замінила в інтерфейсі ChatGPT.[24] Ціна після точного налаштування подвоюється: 0,3 долара США за мільйон вхідних токенів та 1,2 долара США за мільйон вихідних токенів.[25]
Зображення Карла Маркса в сучасному контексті, створене за допомогою GPT Image 1 | |
| Тип | Text-to-image model |
|---|---|
| Розробник | OpenAI |
| Перший випуск | 25 березня, 2025 |
| Ліцензія | пропрієтарна ліцензія[d] |
| Вебсайт | openai.com/index/hello-gpt-4o |
25 березня 2025 року OpenAI випустила модель генерації зображень, яка є рідною для GPT-4o, як наступника DALL-E 3. Пізніше модель була названа GPT Image 1 (gpt-image-1) і представлена в API 23 квітня 2025 року. Вона була доступна для платних користувачів, а розгортання для безкоштовних користувачів було відкладене.[26] Згодом використання цієї функції було обмежено, і Сем Альтман зазначив у твіті, що «[їхні] графічні процесори тануть» від її безпрецедентної популярності.[27] Пізніше OpenAI повідомила, що понад 130 мільйонів користувачів у всьому світі створили понад 700 мільйонів зображень за допомогою GPT Image 1 лише за перший тиждень.[28]
Після випуску GPT-4o пропонував п'ять голосів: Бріз, Коув, Ембер, Джуніпер та Скай. Схожість між голосом американської акторки Скарлетт Йоханссон та Скай була швидко помічена. 14 травня 2025 р. Entertainment Weekly запитали себе, чи не була ця схожість навмисною.[29] 18 травня 2025 р.чоловік Скарлетт Йоханссон, Колін Йост, пожартував про подібність у сегменті Saturday Night Live.[30] 20 травня 2024 року OpenAI вимкнула голос Sky, опублікувавши заяву, в якій говорилося: «Ми чули запитання щодо того, як ми вибирали голоси в ChatGPT, особливо Sky. Ми працюємо над тим, щоб призупинити використання Sky, поки ми їх вирішуємо».[31]
Скарлетт Йоханссон зіграла головну роль у науково-фантастичному фільмі 2013 року «Вона», зігравши Саманту, віртуальну асистентку зі штучним інтелектом, уособлену жіночим голосом. В рамках рекламної акції, що передувала виходу GPT-4o, Сем Альтман 13 травня написав у Твіттері одне слово: «вона».[32][33]
OpenAI заявила, що кожен голос був заснований на озвученні найнятим актором. За даними OpenAI, «голос Скай не є імітацією Скарлетт Йоханссон, а належить іншій професійній акторці, яка використовує свій власний природний голос».[31] Технічний директор Міра Мураті заявила: «Я не знаю про голос. Мені насправді довелося піти і послухати голос Скарлетт Йоханссон». OpenAI також заявила, що актор озвучування був залучений до того, як звернулися до Йоханссон.[33][34]
21 травня Йоханссон опублікувала заяву, в якій пояснила, що OpenAI неодноразово пропонувала їй угоду, щоб отримати дозвіл використовувати її голос, ще за дев'ять місяців до релізу, але вона відхилила цю угоду. Вона сказала, що була «шокована, розлючена та не вірила, що пан Альтман домагається голосу, який звучав настільки моторошно схоже на мій, що мої найближчі друзі та новинні агентства не могли помітити різниці». У заяві Йоханссон також використала цей інцидент, щоб привернути увагу до відсутності правових гарантій щодо використання творчої роботи для навчання провідних інструментів штучного інтелекту, оскільки її юрисконсульт вимагав від OpenAI детально розповісти про те, як був створений голос Sky.[33][35]
Спостерігачі відзначили схожість із тим, як Йоханссон раніше подала до суду та досягла мирової угоди з компанією The Walt Disney Company, за порушення контракту щодо прямого потокового мовлення її фільму Marvel "Чорна вдова" [36], і широко поширені припущення, що ця угода принесла їй близько 40 мільйонів доларів[37] .
Також 21 травня Шира Овіде з The Washington Post поділилася своїм списком «найбільш тупих і самовпевнених» серед технологічних компаній, причому рішення про використання голосу, схожого на голос Йоханссон, попри її опір, та заперечення подібності, посіло 6-те місце.[38] 24 травня 2025 р. Дерек Робертсон з Politico написав про «масову негативну реакцію», дійшовши висновку, що «привласнення голосу однієї з найвідоміших кінозірок світу» — стосовно [...] фільму, який слугує повчальною історією про надмірну залежність від штучного інтелекту — навряд чи допоможе найближчим часом повернути громадськість на позицію [Сема Альтмана].[39]

Після запуску генерації зображень GPT-4o (пізніше названої GPT Image 1), у березні 2025 року, фотографії, відтворені у стилі фільмів Studio Ghibli, стали вірусними.[41] Сем Альтман визнав цю тенденцію, змінивши свою фотографію профілю у Twitter на натхненну Studio Ghibli.[42][43] Використання стилю Ghibli було оскаржено, а Associated Press та The New York Times зазначили, що Хаяо Міядзакі критикував мистецтво штучного інтелекту у документальному фільмі 2016 року «Нескінченна людина: Хаяо Міядзакі».[40][44] Використання зображень у стилі Ghibli зіткнулося з подальшими суперечками, коли офіційний обліковий запис Білого дому у Twitter опублікував зображення у стилі Ghibli, що висміювало арешт імміграційними органами Вірджинії Басори-Гонсалес, мігрантки, яку раніше депортували після засудження за торгівлю фентанілом, на якому видно, як вона плаче, коли імміграційний офіцер надягає на неї кайданки.[40][45][46] Північноамериканський дистриб'ютор GKis відреагував на цю тенденцію у прес-релізі, порівнявши використання фільтра зі збігом перевипуску фільму студії Ghibli 1997 року «Принцеса Мононоке» у форматі IMAX .[47]
У квітні 2025 року OpenAI скасував оновлення GPT-4o через надмірне підлабузництво, після поширених повідомлень про те, що модель стала улесливою і приємною до такої міри, що підтримувала явно маячні або небезпечні ідеї.[48]
- ↑ а б Wiggers, Kyle (13 травня 2024). OpenAI debuts GPT-4o 'omni' model now powering ChatGPT. TechCrunch (амер.). Процитовано 13 травня 2024.
- ↑ Robison, Kylie (25 березня 2025). OpenAI rolls out image generation powered by GPT-4o to ChatGPT. The Verge (амер.). Процитовано 31 березня 2025.
- ↑ Colburn, Thomas. OpenAI unveils GPT-4o, a fresh multimodal AI flagship model. The Register (англ.). Процитовано 18 травня 2024.
- ↑ Field, Hayden (13 травня 2024). OpenAI launches new AI model GPT-4o and desktop version of ChatGPT. CNBC (англ.). Процитовано 14 травня 2024.
- ↑ Rogers, Reece. I Used ChatGPT’s Advanced Voice Mode. It’s Fun, and Just a Bit Creepy. Wired (амер.). ISSN 1059-1028. Процитовано 12 червня 2025.
- ↑ Edwards, Benj (18 липня 2024). OpenAI launches GPT-4o mini, which will replace GPT-3.5 in ChatGPT. Ars Technica (амер.). Процитовано 31 березня 2025.
- ↑ ChatGPT's image-generation feature gets an upgrade. TechCrunch (амер.). 25 березня 2025. Процитовано 12 червня 2025.
- ↑ Edwards, Benj (13 травня 2024). Before launching, GPT-4o broke records on chatbot leaderboard under a secret name. Ars Technica (амер.). Процитовано 17 травня 2024.
- ↑ Zeff, Maxwell (7 травня 2024). Powerful New Chatbot Mysteriously Returns in the Middle of the Night. Gizmodo (англ.). Процитовано 17 травня 2024.
- ↑ Sam Altman (@sama) on X. X (formerly Twitter) (англ.). Архів оригіналу за 17 грудня 2024. Процитовано 6 квітня 2025.
- ↑ van Rijmenam, Mark (13 травня 2024). OpenAI Launched GPT-4o: The Future of AI Interactions Is Here. The Digital Speaker. Процитовано 17 травня 2024.
- ↑ Daws, Ryan (14 травня 2024). GPT-4o delivers human-like AI interaction with text, audio, and vision integration. AI News (брит.). Процитовано 18 травня 2024.
- ↑ Shahriar, Sakib; Lund, Brady D.; Mannuru, Nishith Reddy; Arshad, Muhammad Arbab; Hayawi, Kadhim; Bevara, Ravi Varma Kumar; Mannuru, Aashrith; Batool, Laiba (3 вересня 2024). Putting GPT-4o to the Sword: A Comprehensive Evaluation of Language, Vision, Speech, and Multimodal Proficiency. Applied Sciences (англ.). 14 (17): 7782. doi:10.3390/app14177782. ISSN 2076-3417.
- ↑ а б в Hello GPT-4o. OpenAI.
- ↑ David, Emilia (24 вересня 2024). OpenAI finally brings humanlike ChatGPT Advanced Voice Mode to U.S. Plus, Team users. VentureBeat (амер.). Процитовано 15 лютого 2025.
- ↑ Introducing the Realtime API. openai.com (амер.). Процитовано 29 листопада 2024.
- ↑ Edwards, Benj (13 травня 2024). Major ChatGPT-4o update allows audio-video talks with an "emotional" AI chatbot. Ars Technica (амер.). Процитовано 17 травня 2024.
- ↑ OpenAI Platform. platform.openai.com (англ.). Процитовано 29 листопада 2024.
- ↑ а б Models - OpenAI API. OpenAI. Процитовано 17 травня 2024.
- ↑ Conway, Adam (13 травня 2024). What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free. XDA Developers (англ.). Процитовано 17 травня 2024.
- ↑ а б OpenAI lets companies customise its most powerful AI model. South China Morning Post (англ.). 21 серпня 2024. Процитовано 22 серпня 2024.
- ↑ OpenAI to Let Companies Customize Its Most Powerful AI Model. Bloomberg (англ.). 20 серпня 2024. Процитовано 22 серпня 2024.
- ↑ The Hindu Bureau (21 серпня 2024). OpenAI will let businesses customise GPT-4o for specific use cases. The Hindu (en-IN) . ISSN 0971-751X. Процитовано 22 серпня 2024.
- ↑ а б Franzen, Carl (18 липня 2024). OpenAI unveils GPT-4o mini — a smaller, much cheaper multimodal AI model. VentureBeat (амер.). Процитовано 18 липня 2024.
- ↑ а б OpenAI Pricing.
- ↑ Roth, Emma (26 березня 2025). ChatGPT's new image generator is delayed for free users. The Verge. Процитовано 26 березня 2025.
- ↑ Welch, Chris (27 березня 2025). OpenAI says "our GPUs are melting" as it limits ChatGPT image generation requests. The Verge. Процитовано 28 березня 2025.
- ↑ Introducing our latest image generation model in the API. OpenAI. 23 квітня 2025. Процитовано 30 квітня 2025.
- ↑ Stenzel, Wesley (14 травня 2024). ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose?. Entertainment Weekly (англ.). Процитовано 21 травня 2024.
- ↑ Caruso, Nick (20 травня 2024). Scarlett Johansson Says She Was 'Shocked, Angered and in Disbelief' After Hearing ChatGPT Voice That Sounds Like Her — Read Statement. TVLine (амер.). Процитовано 21 травня 2024.
- ↑ а б How the voices for ChatGPT were chosen. OpenAI. 19 травня 2024.
- ↑ her. X (formerly Twitter). 13 травня 2024. Процитовано 21 травня 2024.
- ↑ а б в Allyn, Bobby (20 травня 2024). Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice. NPR.
- ↑ Tiku, Nitasha (23 травня 2024). OpenAI didn't copy Scarlett Johansson's voice for ChatGPT, records show. The Washington Post. Процитовано 29 листопада 2024.
- ↑ Mickle, Tripp (20 травня 2024). Scarlett Johansson Said No, but OpenAI's Virtual Assistant Sounds Just Like Her. The New York Times (амер.). ISSN 0362-4331. Процитовано 21 травня 2024.
- ↑ Scarlett Johansson took on Disney. Now she's battling OpenAI over a ChatGPT voice that sounds like hers. Yahoo Finance (en-CA) . 21 травня 2024. Процитовано 21 травня 2024.
- ↑ Pulver, Andrew (1 жовтня 2021). Scarlett Johansson settles Black Widow lawsuit with Disney. The Guardian (брит.). ISSN 0261-3077. Процитовано 21 травня 2024.
- ↑ Ovide, Shira (30 травня 2024). Exactly how stupid was what OpenAI did to Scarlett Johansson?. The Washington Post.
- ↑ Robertson, Derek (22 травня 2024). Sam Altman's Scarlett Johansson Blunder Just Made AI a Harder Sell in DC. Politico.
- ↑ а б в O'Brien, Matt; Parvini, Sarah (27 березня 2025). ChatGPT's viral Studio Ghibli-style images highlight AI copyright concerns. AP News (англ.). Процитовано 28 березня 2025.
- ↑ Spangler, Todd (26 березня 2025). OpenAI CEO Responds to ChatGPT Users Creating Studio Ghibli-Style AI Images. Variety. Процитовано 27 березня 2025.
- ↑ Choudhary, Govind (27 березня 2025). OpenAI CEO Sam Altman reacts as AI turns him into a Studio Ghibli Character. Mint (англ.). Процитовано 28 березня 2025.
- ↑ Notopoulos, Katie (27 березня 2025). Sam Altman did a good tweet. Business Insider. Процитовано 28 березня 2025.
- ↑ Kircher, Madison Malone (27 березня 2025). ChatGPT's Studio Ghibli Style Animations Are Almost Too Good. The New York Times (англ.). Архів оригіналу за 27 березня 2025. Процитовано 27 березня 2025.
- ↑ Bio, Demian (27 березня 2025). White House Mocks Migrant With Criminal Record Who Cried After Being Arrested. Latin Times (англ.). Процитовано 28 березня 2025.
- ↑ Vera, Kelby (27 березня 2025). White House Posts Ghoulish AI Cartoon Showing Woman's Deportation. HuffPost (англ.). Процитовано 28 березня 2025.
- ↑ Tangcay, Jazz (28 березня 2025). Studio Ghibli Distributor Champions 'Princess Mononoke' Box Office at 'A Time When Technology Tries to Replicate Humanity'. Variety. Процитовано 29 березня 2025.
- ↑ Franzen, Carl (30 квітня 2025). OpenAI rolls back ChatGPT's sycophancy and explains what went wrong. VentureBeat (амер.). Процитовано 1 травня 2025.
