...
Вівторок, 20 Травня, 2025
11.5 C
Kyiv

Alibaba Cloud Open джерела своїх моделей AI для генерації відео

Генерується Qwen

Alibaba Cloud заявила в середу, що зробила свої моделі AI для генерації відео, вільно доступних у рамках останніх зусиль, щоб внести свій внесок у спільноту з відкритим кодом.

Компанія з хмарних обчислень-це чотири моделі її 14-мільярд (b) -параметр та 1,3 мільярда (b) -параметр версії серії WAN2.1, остання ітерація своєї моделі відео Фонду Tongyi Wanxiang (WAN) .

Чотири моделі, включаючи T2V-14B, T2V-1.3B, I2V-14B-720P та I2V-14B-480P, розроблені для створення високоякісних зображень та відео з входів тексту та зображень. Вони доступні для завантаження в модельній спільноті AI AI Cloud Cloud, модельної сфери моделі та спільної платформи AI, що обіймає обличчя, доступну для науковців, дослідників та комерційних установок у всьому світі.

Опублікована на початку цього року, серія WAN2.1 – це перша модель генерації відео, яка підтримувала текстові ефекти як китайської та англійської мови. Він переважає при створенні реалістичних візуальних зображень шляхом точно обробки складних рухів, підвищення якості пікселів, дотримуючись фізичних принципів та оптимізуючи точність виконання інструкцій. Його точність у наступних інструкціях підштовхнула WAN2.1 на вершину лідера VBench, всеосяжного орієнтиру для відеороликів для відео. Це також єдина модель генерації відео з відкритим кодом серед першої п'ятірки на лідері VBench Holed Face.

За даними VBench, серія WAN2.1 із загальною оцінкою 86,22%веде в ключових розмірах, таких як динамічна ступінь, просторові взаємозв'язки, колір та багатооб'єктні взаємодії.

Ван 2.1Ван 2.1Ван 2.1

Навчальні моделі фонду відео вимагають величезних обчислювальних ресурсів та величезної кількості високоякісних даних про навчання. Відкритий доступ допомагає знизити бар'єр для більшої кількості підприємств для використання AI, що дозволяє їм створювати високоякісний візуальний контент, пристосований до їх потреб.

Модель T2V-14B краще підходить для створення високоякісних візуальних зображень із значною динамікою руху. На відміну від цього, модель T2V-1.3B врівноважує якість генерації та обчислювальну потужність, що робить її ідеальною для широкого спектру розробників, що проводять вторинний розвиток та академічні дослідження. Наприклад, модель T2V-1.3B дозволяє користувачам із стандартними особистими ноутбуками генерувати 5-секундне відео в роздільній здатності 480p всього за 4 хвилини.

Текстовий підказ: чоловік, який займається професійним дайвінгом на платформі стрибків. У панорамному плоскому пострілі він носить червоні плавки, його тіло знаходиться вгорі вниз, його руки розтягнуті, а ноги закриті разом. Камера рухалася вниз, і він стрибнув у воду, бризкаючи. Синій басейн на задньому плані. Англійський переклад: «У ширококутному, лобовому пострілі чоловік занурюється з платформи в червоних плавках, руках і ногах разом. фон ».

Моделі I2V-14B-720P та I2V-14B-480P підтримують генерацію тексту до відео та пропонують можливості зображення до відео. Щоб генерувати динамічний відеоконтент, користувачам просто потрібно ввести одне зображення разом із коротким описом тексту. Платформа підтримує входи зображення звичайного розміру будь-якого виміру.

Alibaba Cloud була однією з перших великих глобальних технологічних компаній, які відкриті кодом її саморозвинену масштабну модель AI, випустивши свою першу відкриту модель, Qwen (Qwen-7b), у серпні 2023 року. Відкриті моделі Qwen постійно очолювали Huggingface Відкриті лідери LLM, з виступами, що відповідають виступом провідних глобальних моделей AI у різних орієнтирах.

На даний момент понад 100 000 похідних моделей, заснованих на сімействі моделей QWEN, були розроблені на обняті обличчя, що робить його однією з найвизначніших сімей моделей AI у всьому світі.

Дізнайтеся більше про Подорож AI з відкритим кодом Алібаби

Гаряче цього тижня

Використовуйте IndexNow для пошуку AI та SEO покупок

Microsoft Bing опублікувала оголошення, в якій зазначається, що технологія...

Web Pulse SEO показує дорогі помилки

Нова служба аудиту діагностики від...

Alphaevovve за допомогою DeepMind автоматизує оптимізацію коду та виявляє нові алгоритми

Alphaevolve допоміг Google відновити 0,7% глобальних обчислювальних ресурсів за...

Будівельне агентство Link Serpify запускає передову

Serpify.co на Мальті Агентство з будівництва посиланьоголосив...

Теми

Використовуйте IndexNow для пошуку AI та SEO покупок

Microsoft Bing опублікувала оголошення, в якій зазначається, що технологія...

Web Pulse SEO показує дорогі помилки

Нова служба аудиту діагностики від...

Alphaevovve за допомогою DeepMind автоматизує оптимізацію коду та виявляє нові алгоритми

Alphaevolve допоміг Google відновити 0,7% глобальних обчислювальних ресурсів за...

Будівельне агентство Link Serpify запускає передову

Serpify.co на Мальті Агентство з будівництва посиланьоголосив...