DeepSeek
кит.: 杭州深度求索人工智能基础技术研究有限公司 англ. Hangzhou DeepSeek Artificial Intelligence Co., Ltd. | |
---|---|
![]() | |
Тип | Стартап і технологічна компанія ![]() |
Правова форма | приватна компанія ![]() |
Галузь | Інформаційні технології |
Засновано | травень 2023 |
Засновник(и) | |
Штаб-квартира | Ханчжоу, Чжецзян, КНР |
Ключові особи |
|
Власник(и) | High-Flyer |
Холдингова компанія | High-Flyer ![]() |
deepseek.com | |
![]() ![]() |
DeepSeek (спрощ.: 深度求索; піньїнь: Shēndù Qiúsuǒ) — китайська компанія в галузі штучного інтелекту, яка розробляє великі мовні моделі (Large Language Model, LLM) з відкритим кодом. За офіційними даними, фінансується китайським гедж-фондом High-Flyer і базується в місті Ханчжоу, провінція Чжецзян, КНР.
Рівень відповідей моделі R1, розробленої DeepSeek, знаходиться на такому ж рівні, як інші сучасні LLM, наприклад як GPT-4o та o1 від компанії OpenAI[3], при цьому заявлено, що навчання моделі коштує значно менше — 6 мільйонів доларів США порівняно зі 100 мільйонами доларів для GPT-4 OpenAI у 2023 році[4] — і вимагає в десять разів менше обчислювальної потужності[4][5][6][7]. Навчання моделей DeepSeek відбувалось на тлі санкцій США, які забороняли постачання чіпів Nvidia до Китаю з метою обмежити здатність країни розробляти передові системи штучного інтелекту[8].
10 січня 2025 року DeepSeek представила безкоштовний чат-бот на основі моделі DeepSeek-R1 для iOS та Android; до 27 січня DeepSeek-R1 обігнав ChatGPT, ставши найбільш завантажуваним безкоштовним додатком в iOS App Store у США[9], що призвело до падіння ціни акцій Nvidia на 18 %[10][11]. Успіх DeepSeek у конкуренції з більшими та відомішими аналогами був описаний як «переворот у сфері штучного інтелекту»,[9] що став «першим пострілом у тому, що переростає в глобальну гонитву у сфері ШІ»,[12] і відкриває «нову еру ШІ з „балансуванням на межі“»[13].
DeepSeek публікує свої алгоритми, моделі та деталі навчання під відкритою ліцензією[14]. Повідомляється, що компанія набирає молодих дослідників штучного інтелекту з провідних китайських університетів[15] і наймає людей за межами сфери комп'ютерних наук, щоб урізноманітнити знання та здібності при розробці своїх моделей[16].
Моделі штучного інтелекту DeepSeek можна розглядати як значний крок до розвитку передових технологій у країнах Азії, допомагаючи утримувати таланти та зменшуючи відтік мізків із таких країн, як Індія та Китай[17].
В 2015 році три випускники Чжецзянського університету, які з часів глобальної фінансової кризи 2008 року цікавились торгівлею акціями, заснували компанію High-Flyer[18], яка використовувала для торгівлі машинне навчання[19].
До 2019 року High-Flyer перетворився на гедж-фонд, зосереджений на розробці та використанні штучного інтелекту в алгоритмах торгівлі. До 2021 року High-Flyer використовував у торгівлі виключно ШІ[20], при цьому часто працюючи з чіпами Nvidia[21].
У 2021 році High-Flyer почав накопичувати графічні процесори Nvidia для проєкту з ШІ[22]. Як стверджує китайське медіа 36Kr, до моменту, коли уряд США наклав обмеження на постачання графічних процесорів до КНР, компанія встигла накопичити запас із 10 000 графічних процесорів Nvidia A100, що використовувались для навчання ШІ[23][24].
У квітні 2023 року High-Flyer заснував лабораторію штучного інтелекту, присвячену розробці ШІ-інструментів окремо від фінансового бізнесу High-Flyer[25][26]. У травні 2023 року за участю High-Flyer як одного з інвесторів лабораторія перетворилась на окрему компанію DeepSeek[27][28][26].
Після випуску моделі DeepSeek-V2 у травні 2024 року, яка пропонувала високу продуктивність за низьку ціну, компанія DeepSeek стала відомою як каталізатор війни цін на ШІ-моделі в КНР. Великі китайські технологічні гіганти, такі як ByteDance, Tencent, Baidu та Alibaba почали знижувати ціни на свої моделі, щоб конкурувати з компанією. Незважаючи на низьку ціну, встановлену DeepSeek, компанія була прибутковою, в той час як конкуренти втрачали гроші[29].
DeepSeek не має детальних планів комерціалізації;[30] це дозволяє її технологіям уникати найсуворіших китайських обмежень щодо ШІ, зокрема вимоги, щоб споживацькі інформаційні продукти відповідали урядовому контролю над інформацією[31].
Китайська газета South China Morning Post пише, що у DeepSeek при наймі надають перевагу технічним здібностям кандидата, а не його досвіду роботи, в результаті чого більшість нових наймів є або нещодавними випускниками університетів, або розробниками, чия кар'єра в області штучного інтелекту менш відома[32][33].
2 листопада 2023 року DeepSeek представила свою першу модель, DeepSeek Coder, доступну безкоштовно[34]. Код моделі було опубліковано під відкритою ліцензією MIT[35].
29 листопада 2023 року DeepSeek випустила модель DeepSeek LLM, розроблену як конкурент іншим доступним мовним моделям і з продуктивністю, що наближалась до GPT-4. Однак компанія зіткнулася з проблемами обчислювальної ефективності та масштабованості продукту[36]. Також була випущена версія чат-бота моделі під назвою DeepSeek Chat[37].
У травні 2024 року було випущено DeepSeek-V2.[38] Financial Times повідомила, що він дешевше аналогів, пропонуючи ціну в два юаня за кожен мільйон токенів. В рейтингу великих мовних моделей Tiger Lab від університету Ватерлоо DeepSeek-V2 посів сьоме місце[39].
У грудні 2024 року було запущено DeepSeek-V3. Порівняльні тести показали, що модель перевершила Llama 3.1 і Qwen 2.5, водночас зрівнявшись із GPT-4o та Claude 3.5 Sonnet[40][41][42][43]. Розвиток DeepSeek в умовах порівняно невеликої кількості ресурсів підкреслив потенційну обмеженість санкцій США щодо розвитку штучного інтелекту в КНР[40][44]. Газета The Hill порівняла реліз DeepSeek-V3 з «супутниковою кризою»[45].
20 січня 2025 року вийшли версії DeepSeek-R1 і DeepSeek-R1-Zero[46][47], що базуються на оптимізованій версії V3. За результатами перших тестів, при виконанні певних завдань з математики, хімії та програмування продуктивність R1 перебуває на одному рівні з OpenAI o1[48][49][50]. Ця безоплатна opensource модель ШІ, в останні вихідні січня 2025 року стала топовим застосунком в рейтингу App Store, що призвело до падіння цін на акції технологічних компаній інших країн[51]. Вебверсія підтримує тільки китайську та англійську мови інтерфейсу. Мобільний застосунок повністю перекладено українською[52].
27 січня 2025 DeepSeek представила модель Janus Pro — генеративну модель для генерування зображень[53].
Коли популярність DeepSeek різко зросла в січні 2025 року, користувачі зауважили, що версія R1 використовує механізми цензури для тем, які стосуються політики Китайської Народної Республіки. Наприклад, модель відмовляється відповідати на запитання про події на площі Тяньаньмень 1989 року, переслідування уйгурів або становище прав людини в Китаї[54][55]. Іноді ШІ додає прокитайські коментарі. Наприклад, на запитання хто такий далай-лама, дає правильне визначення, доповнюючи його словами, що Тибет «невіддільна частина Китаю зі стародавніх часів»[56].
У січні 2025 року західним дослідникам вдалося змусити DeepSeek дати точні відповіді на деякі з цих тем шляхом уточнення поставленого запитання. Наприклад, якщо попросити дати відповідь, де літери замінені на візуально схожі цифри (як 4 і A, див. Leet), то ШІ покаже нецензурований текст[56].
- ↑ https://www.deepseek.com
- ↑ https://hznews.hangzhou.com.cn/chengshi/content/2025-01/22/content_8846722.htm
- ↑ Gibney, Elizabeth (23 січня 2025). China's cheap, open AI model DeepSeek thrills scientists. Nature (англ.). doi:10.1038/d41586-025-00229-6. ISSN 1476-4687. PMID 39849139.
- ↑ а б Vincent, James (28 січня 2025). The DeepSeek panic reveals an AI world ready to blow. The Guardian.
- ↑ Hoskins, Peter; Rahman-Jones, Imran (27 січня 2025). Nvidia shares sink as Chinese AI app spooks markets. BBC (брит.). Процитовано 28 січня 2025.
- ↑ Metz, Cade; Tobin, Meaghan (23 січня 2025). How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants. The New York Times (амер.). ISSN 0362-4331. Процитовано 27 січня 2025.
- ↑ Cosgrove, Emma (27 січня 2025). DeepSeek's cheaper models and weaker chips call into question trillions in AI infrastructure spending. Business Insider.
- ↑ Saran, Cliff (10 грудня 2024). Nvidia investigation signals widening of US and China chip war | Computer Weekly. Computer Weekly. Процитовано 27 січня 2025.
- ↑ а б Metz, Cade (27 січня 2025). What is DeepSeek? And How Is It Upending A.I.?. The New York Times (амер.). ISSN 0362-4331. Процитовано 27 січня 2025.
- ↑ Field, Hayden (27 січня 2025). China's DeepSeek AI dethrones ChatGPT on App Store: Here's what you should know. CNBC.
- ↑ What is DeepSeek, and why is it causing Nvidia and other stocks to slump?. www.cbsnews.com. 27 січня 2025.
- ↑ Zahn, Max. Nvidia, Microsoft shares tumble as China-based AI app DeepSeek hammers tech giants. ABC News (англ.). Процитовано 27 січня 2025.
- ↑ Roose, Kevin (28 січня 2025). Why DeepSeek Could Change What Silicon Valley Believe About A.I. The New York Times (амер.). ISSN 0362-4331. Процитовано 28 січня 2025.
- ↑ Romero, Luis E. ChatGPT, DeepSeek, Or Llama? Meta's LeCun Says Open-Source Is The Key. Forbes.
- ↑ Metz, Cade (27 січня 2025). What is DeepSeek? And How Is It Upending A.I.?. The New York Times (амер.). ISSN 0362-4331. Процитовано 27 січня 2025.
- ↑ Metz, Cade; Tobin, Meaghan (23 січня 2025). How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants. The New York Times (амер.). ISSN 0362-4331. Процитовано 27 січня 2025.
- ↑ Panda, Aishwarya (28 січня 2025). Deepseek Wounds Redirected to Low-Cost H1-Bs. M9 news (амер.). Процитовано 28 січня 2025.
- ↑ Chen, Caiwei (24 січня 2025). How a top Chinese AI model overcame US sanctions. MIT Technology Review (англ.). Архів оригіналу за 25 січня 2025. Процитовано 25 січня 2025.
- ↑ Billions Going to China's Quants Takes Fight to Global Funds. Bloomberg (англ.). 31 травня 2020. Архів оригіналу за 25 травня 2022. Процитовано 28 грудня 2024.
- ↑ Ottinger, Lily (9 грудня 2024). Deepseek: From Hedge Fund to Frontier Model Maker. ChinaTalk (англ.). Архів оригіналу за 28 грудня 2024. Процитовано 28 грудня 2024.
- ↑ Olcott, Eleanor; Wu, Zijing (24 січня 2025). How small Chinese AI start-up DeepSeek shocked Silicon Valley. Financial Times. Процитовано 31 січня 2025.
- ↑ Olcott, Eleanor; Wu, Zijing (24 січня 2025). How small Chinese AI start-up DeepSeek shocked Silicon Valley. Financial Times. Процитовано 31 січня 2025.
- ↑ Leswing, Kif (23 лютого 2023). Meet the $10,000 Nvidia chip powering the race for A.I. CNBC. Процитовано 30 січня 2025.
- ↑ Ottinger, Lily (9 грудня 2024). Deepseek: From Hedge Fund to Frontier Model Maker. ChinaTalk (англ.). Архів оригіналу за 28 грудня 2024. Процитовано 28 грудня 2024.
- ↑ Yu, Xu (17 квітня 2023). [Exclusive] Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says. Yicai Global (англ.). Архів оригіналу за 31 грудня 2023. Процитовано 28 грудня 2024.
- ↑ а б Jiang, Ben; Perezi, Bien (1 січня 2025). Meet DeepSeek: the Chinese start-up that is changing how AI models are trained. South China Morning Post (англ.). Архів оригіналу за 22 січня 2025. Процитовано 1 січня 2025.
- ↑ Ottinger, Lily (9 грудня 2024). Deepseek: From Hedge Fund to Frontier Model Maker. ChinaTalk (англ.). Архів оригіналу за 28 грудня 2024. Процитовано 28 грудня 2024.
- ↑ McMorrow, Ryan; Olcott, Eleanor (9 червня 2024). The Chinese quant fund-turned-AI pioneer. Financial Times. Архів оригіналу за 17 липня 2024. Процитовано 28 грудня 2024.
- ↑ Schneider, Jordan (27 листопада 2024). Deepseek: The Quiet Giant Leading China's AI Race. ChinaTalk (англ.). Процитовано 28 грудня 2024.
- ↑ Schneider, Jordan (27 листопада 2024). Deepseek: The Quiet Giant Leading China's AI Race. ChinaTalk (англ.). Процитовано 28 грудня 2024.
- ↑ Metz, Cade; Tobin, Meaghan (23 січня 2025). How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants. The New York Times (амер.). ISSN 0362-4331. Процитовано 27 січня 2025.
- ↑ Jiang, Ben; Perezi, Bien (1 січня 2025). Meet DeepSeek: the Chinese start-up that is changing how AI models are trained. South China Morning Post (англ.). Архів оригіналу за 22 січня 2025. Процитовано 1 січня 2025.
- ↑ Metz, Cade; Tobin, Meaghan (23 січня 2025). How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants. The New York Times (амер.). ISSN 0362-4331. Процитовано 27 січня 2025.
- ↑ Se, Ksenia (28 серпня 2024). Inside DeepSeek Models. Turing Post (англ.). Архів оригіналу за 18 вересня 2024. Процитовано 28 грудня 2024.
- ↑ DeepSeek-Coder/LICENSE-MODEL at main · deepseek-ai/DeepSeek-Coder. GitHub (англ.). Архів оригіналу за 22 січня 2025. Процитовано 24 січня 2025.
- ↑ Se, Ksenia (28 серпня 2024). Inside DeepSeek Models. Turing Post (англ.). Архів оригіналу за 18 вересня 2024. Процитовано 28 грудня 2024.
- ↑ Sharma, Shubham (1 грудня 2023). Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model. VentureBeat (амер.). Архів оригіналу за 23 грудня 2024. Процитовано 28 грудня 2024.
- ↑ DeepSeek-AI; Liu, Aixin; Feng, Bei; Wang, Bin; Wang, Bingxuan; Liu, Bo; Zhao, Chenggang; Dengr, Chengqi; Ruan, Chong (19 червня 2024), DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model, arXiv, doi:10.48550/arXiv.2405.04434, arXiv:2405.04434
- ↑ McMorrow, Ryan; Olcott, Eleanor (9 червня 2024). The Chinese quant fund-turned-AI pioneer. Financial Times. Архів оригіналу за 17 липня 2024. Процитовано 28 грудня 2024.
- ↑ а б Jiang, Ben; Perezi, Bien (1 січня 2025). Meet DeepSeek: the Chinese start-up that is changing how AI models are trained. South China Morning Post (англ.). Архів оригіналу за 22 січня 2025. Процитовано 1 січня 2025.
- ↑ Jiang, Ben (27 грудня 2024). Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products. South China Morning Post (англ.). Архів оригіналу за 27 грудня 2024. Процитовано 28 грудня 2024.
- ↑ Sharma, Shubham (26 грудня 2024). DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch. VentureBeat (амер.). Архів оригіналу за 27 грудня 2024. Процитовано 28 грудня 2024.
- ↑ Wiggers, Kyle (26 грудня 2024). DeepSeek's new AI model appears to be one of the best 'open' challengers yet. TechCrunch. Архів оригіналу за 2 січня 2025. Процитовано 31 грудня 2024.
- ↑ Shilov, Anton (27 грудня 2024). Chinese AI company's AI model breakthrough highlights limits of US sanctions. Tom's Hardware (англ.). Архів оригіналу за 28 грудня 2024. Процитовано 28 грудня 2024.
- ↑ Wade, David (6 грудня 2024). American AI has reached its Sputnik moment. The Hill (амер.). Архів оригіналу за 8 грудня 2024. Процитовано 25 січня 2025.
- ↑ Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce. GitHub (англ.). Архів оригіналу за 21 січня 2025. Процитовано 21 січня 2025.
- ↑ DeepSeek-AI; Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Zhang, Ruoyu; Xu, Runxin; Zhu, Qihao; Ma, Shirong (22 січня 2025), DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, arXiv, doi:10.48550/arXiv.2501.12948, arXiv:2501.12948
- ↑ Elizabeth Gibney. China’s cheap, open AI model DeepSeek thrills scientists // Nature. — 2025. — 23 January. — ISSN 1476-4687. — DOI: .
- ↑ Chowdhury, Hasan (25 січня 2025). KI aus China: Überholt dieses Startup jetzt OpenAI?. Business Insider (нім.).
- ↑ Sharma, Shubham (20 січня 2025). Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost. VentureBeat (амер.).
- ↑ Що таке DeepSeek або як китайський ШІ обвалив світові фондові ринки в США та Японії. 24 Канал (укр.). 27 січня 2025. Процитовано 27 січня 2025.
- ↑ Усі говорять про DeepSeek: що це за чат-бот і чому його називають "вбивцею" ChatGPT. www.unian.ua (укр.). Процитовано 29 січня 2025.
- ↑ DeepSeek представила новий ШІ Janus Pro — генеративна модель краща за DALL-E 3. ITC.ua. 27 січня 2025. Процитовано 27 січня 2025.
- ↑ Field, Matthew; Titcomb, James (27 січня 2025). What is DeepSeek? The Chinese AI that has sparked a $1 trillion panic. The Telegraph (брит.). ISSN 0307-1235. Процитовано 29 січня 2025.
- ↑ Steinschaden, Jakob (27 січня 2025). DeepSeek: This is what live censorship looks like in the Chinese AI chatbot. Trending Topics (англ.). Процитовано 29 січня 2025.
- ↑ а б Lu, Donna (28 січня 2025). We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan. The Guardian (брит.). ISSN 0261-3077. Процитовано 29 січня 2025.