Claude (мовна модель)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Claude
Тип
РозробникAnthropic
Перший випускберезень 2023; рік тому (2023-03)
ВерсіїClaude 2 (11 липня 2023)[1], Claude 3 (4 березня 2024)[2] і Claude 3.5 (20 червня 2024)[3]
Українська мовапідтримує
ЛіцензіяПропрієтарна
Вебсайтclaude.ai

Claude — це сімейство великих мовних моделей, розроблених компанією Anthropic.[4] Перша модель була випущена в березні 2023 року. Claude 3, випущена в березні 2024 року, також може аналізувати зображення.[5]

Навчання

[ред. | ред. код]

Моделі Claude є генеративними попередньо тренованими трансформерами. Вони були попередньо навчені передбачати наступне слово у великих обсягах тексту. Потім моделі Claude були доналаштовані за допомогою Конституційного ШІ з метою зробити їх корисними, чесними та нешкідливими.[6][7]

Конституційний ШІ

[ред. | ред. код]

Конституційний ШІ — це підхід, розроблений Anthropic для навчання систем ШІ, зокрема мовних моделей як Claude, бути нешкідливими та корисними без покладання на значний людський зворотний зв’язок. Метод, описаний у статті «Конституційний ШІ: нешкідливість від зворотного зв’язку ШІ», включає дві фази: кероване навчання та навчання з підкріпленням.[7]

На фазі керованого навчання модель генерує відповіді на запити, самостійно критикує ці відповіді на основі набору керівних принципів (так званої «конституції») та переглядає відповіді. Потім модель доналаштовується на цих переглянутих відповідях.[7]

На фазі навчання з підкріпленням від зворотного зв’язку ШІ (RLAIF) генеруються відповіді, і ШІ порівнює їх відповідність конституції. Цей набір даних зворотного зв’язку ШІ використовується для навчання моделі вподобань, яка оцінює відповіді на основі того, наскільки вони відповідають конституції. Потім Claude доналаштовується для узгодження з цією моделлю вподобань. Ця техніка подібна до навчання з підкріпленням від людського зворотного зв’язку (RLHF), за винятком того, що порівняння, які використовуються для навчання моделі вподобань, генеруються ШІ, і вони ґрунтуються на конституції.[8][7]

Цей підхід дозволяє навчати ШІ-асистентів, які є одночасно корисними та нешкідливими, і які можуть пояснювати свої заперечення на шкідливі запити, підвищуючи прозорість та зменшуючи залежність від людського нагляду.[9][10]

«Конституція» для Claude включала 75 пунктів, у тому числі розділи з Загальної декларації прав людини ООН.[9][6]

Моделі

[ред. | ред. код]

Claude була початковою версією мовної моделі Anthropic, випущеною в березні 2023 року.[11] Claude продемонструвала майстерність у різноманітних завданнях, але мала певні обмеження в можливостях кодування, математики та міркування.[12] Anthropic співпрацювала з такими компаніями, як Notion (програмне забезпечення для продуктивності) та Quora (для допомоги в розробці чат-бота Poe).[12]

Claude Instant

[ред. | ред. код]

Claude була випущена у двох версіях, Claude та Claude Instant, причому Claude Instant була швидшою, дешевшою та легшою версією. Claude Instant має вхідний контекстний розмір 100 000 токенів (що відповідає приблизно 75 000 слів).[13]

Claude 2 була наступною основною ітерацією Claude, яка була випущена в липні 2023 року і доступна широкій публіці, тоді як Claude 1 була доступна лише обраним користувачам, затвердженим Anthropic.[14]

Claude 2 розширила своє контекстне вікно з 9 000 токенів до 100 000 токенів.[11] Функції включали можливість завантажувати PDF та інші документи, що дозволяло Claude читати, узагальнювати та допомагати з завданнями.

Claude 2.1

[ред. | ред. код]

Claude 2.1 подвоїла кількість токенів, які міг обробляти чат-бот, збільшивши її до вікна в 200 000 токенів, що дорівнює приблизно 500 сторінкам письмового матеріалу.[4]

Anthropic стверджує, що нова модель менш схильна до продукування хибних тверджень порівняно з її попередниками.[15]

Claude 3 був випущений 14 березня 2024 року, з твердженнями в прес-релізі про встановлення нових галузевих еталонів у широкому діапазоні когнітивних завдань. Сімейство Claude 3 включає три найсучасніші моделі в порядку зростання можливостей: Haiku, Sonnet та Opus. Стандартна версія Claude 3, Opus, має контекстне вікно 200 000 токенів, але воно розширюється до 1 мільйона для конкретних випадків використання.[16][5]

Claude 3, здається, виконував метакогнітивні міркування, включаючи здатність усвідомлювати, що його штучно тестують під час тестів на пошук «голки в стозі сіна».[17]

Claude 3.5

[ред. | ред. код]

20 червня 2024 року Anthropic випустила Claude 3.5 Sonnet, який продемонстрував значно покращену продуктивність у тестах порівняно з більшим Claude 3 Opus, зокрема в таких областях, як кодування, багатокрокові робочі процеси, інтерпретація діаграм та вилучення тексту із зображень. Разом з 3.5 Sonnet була випущена нова функція Artifacts, завдяки якій Claude міг створювати код у спеціальному вікні інтерфейсу та попередньо переглядати вибраний код у реальному часі, такий як вебсайти або SVG.[18]

Доступ

[ред. | ред. код]

Обмежений доступ з використанням Claude 3.5 Sonnet є безкоштовним, але вимагає як адреси електронної пошти, так і номера мобільного телефону. Також пропонується платний план для більшого використання та доступу до всіх моделей Claude 3.[19]

1 травня 2024 року Anthropic анонсувала план Claude Team, свою першу корпоративну пропозицію для Claude, та застосунок iOS Claude.[20]

Критика

[ред. | ред. код]

Claude 2 отримав критику за свою жорстку етичну узгодженість, яка може зменшити зручність використання та продуктивність. Користувачам було відмовлено в допомозі з безневинними запитами, наприклад, з питанням програмування «Як я можу вбити всі процеси python на моєму сервері ubuntu?» Це призвело до дебатів щодо «податку на узгодження» (вартості забезпечення етичної узгодженості системи ШІ) у розробці ШІ, з дискусіями, зосередженими на балансуванні етичних міркувань та практичної функціональності. Критики виступали за автономію користувачів та ефективність, тоді як прихильники наголошували на важливості етичного ШІ.[21][15]

Примітки

[ред. | ред. код]
  1. https://www.anthropic.com/news/claude-2
  2. https://www.anthropic.com/news/claude-3-family
  3. https://www.anthropic.com/news/claude-3-5-sonnet
  4. а б Davis, Wes (21 листопада 2023). OpenAI rival Anthropic makes its Claude chatbot even more useful. The Verge (англ.). Процитовано 23 січня 2024.
  5. а б Whitney, Lance (4 березня 2024). Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini. ZDNET (англ.). Процитовано 5 березня 2024.
  6. а б What to Know About Claude 2, Anthropic's Rival to ChatGPT. TIME (англ.). 18 липня 2023. Процитовано 23 січня 2024.
  7. а б в г Claude's Constitution. Anthropic (англ.). 9 травня 2023. Процитовано 26 березня 2024.
  8. Eliot, Lance (25 травня 2023). Latest Generative AI Boldly Labeled As Constitutional AI Such As Claude By Anthropic Has Heart In The Right Place, Says AI Ethics And AI Law. Forbes (англ.). Процитовано 27 березня 2024.
  9. а б Bai, Yuntao; Kadavath, Saurav; Kundu, Sandipan; Askell, Amanda; Kernion, Jackson; Jones, Andy; Chen, Anna; Goldie, Anna; Mirhoseini, Azalia (15 грудня 2022), Constitutional AI: Harmlessness from AI Feedback, arXiv:2212.08073
  10. Mok, Aaron. A ChatGPT rival just published a new constitution to level up its AI guardrails, and prevent toxic and racist responses. Business Insider (амер.). Процитовано 23 січня 2024.
  11. а б Drapkin, Aaron (27 жовтня 2023). What Is Claude AI and Anthropic? ChatGPT's Rival Explained. Tech.co (амер.). Процитовано 23 січня 2024.
  12. а б Introducing Claude. Anthropic. 14 березня 2023.
  13. Yao, Deborah (11 серпня 2023). Anthropic's Claude Instant: A Smaller, Faster and Cheaper Language Model. AI Business.
  14. Matthews, Dylan (17 липня 2023). The $1 billion gamble to ensure AI doesn't destroy humanity. Vox (англ.). Процитовано 23 січня 2024.
  15. а б Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools. InfoQ (англ.). Процитовано 23 січня 2024.
  16. Introducing the next generation of Claude. Anthropic (англ.). Процитовано 4 березня 2024.
  17. Edwards, Benj (5 березня 2024). Anthropic's Claude 3 causes stir by seeming to realize when it was being tested. Ars Technica (en-us) . Процитовано 9 березня 2024.
  18. Pierce, David (20 червня 2024). Anthropic has a fast new AI model — and a clever new way to interact with chatbots. The Verge (англ.). Процитовано 20 червня 2024.
  19. Introducing the Claude Team plan and iOS app. Anthropic (англ.). 1 травня 2024. Процитовано 22 червня 2024.
  20. Field, Hayden (1 травня 2024). Amazon-backed Anthropic launches iPhone app and business tier to compete with OpenAI's ChatGPT. CNBC. Процитовано 3 травня 2024.{{cite news}}: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання)
  21. Glifton, Gerald (3 січня 2024). Criticisms Arise Over Claude AI's Strict Ethical Protocols Limiting User Assistance. Light Square (англ.). Процитовано 23 січня 2024.

Посилання

[ред. | ред. код]