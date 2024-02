OpenAI представила модель штучного інтелекту Sora для перетворення тексту на відео.

Компанія, яка раніше створила ChatGPT, стверджує, що Sora "може створювати реалістичні та творчі сцени з текстових інструкцій".

Згідно з повідомленням блогу OpenAI, модель може видати "складні сцени з кількома персонажами, певними типами руху та точними деталями об'єкта та фону".

Компанія зазначає, що Sora розуміє, як об'єкти "існують у фізичному світі", а також "точно інтерпретує реквізит і створює переконливі персонажі, що виражають яскраві емоції".

Sora також здатна генерувати відео на основі нерухомого зображення та заповнювати відсутні кадри існуючого відео. Приклади робіт Sora мають деталі, які вказують на явні ознаки ШІ - наприклад, підлога, що підозріло рухається, на відео з музею.

OpenAI кажуть, що модель "може мати труднощі з точним моделюванням фізики складної сцени", але загальні результати можна назвати вражаючими.

На даний час Sora доступна лише обмеженій кількості користувачів, які оцінюють її на предмет потенційної шкоди та ризиків. OpenAI також пропонує доступ деяким дизайнерам та кінематографістам для отримання зворотного зв'язку.

Вони зазначають, що існуюча модель може неточно моделювати фізику складної сцени та неправильно інтерпретувати певні випадки причини та наслідки.

Прикладом роботи Sora є відео, створене за підказкою про напівкачку-напівдракона, що літає крізь гарний захід сонця з хом'яком у пригодницькому спорядженні.

