Привет, Хабр!Мне надоело платить подписки за генерацию видео. Каждый сервис хочет $20–50 в месяц, а если тебе нужно генерировать контент на нескольких языках, тПривет, Хабр!Мне надоело платить подписки за генерацию видео. Каждый сервис хочет $20–50 в месяц, а если тебе нужно генерировать контент на нескольких языках, т

Нейросеть для генерации видео бесплатно

2026/02/18 14:41
8м. чтение

Привет, Хабр!

Мне надоело платить подписки за генерацию видео. Каждый сервис хочет $20–50 в месяц, а если тебе нужно генерировать контент на нескольких языках, то расходы множатся. Поэтому я сделал YumCut - генератор коротких видео с открытым исходным кодом, который превращает одну текстовую идею в готовое озвученное видео. Без GPU, без дорогих подписок, без ограничений на количество.

В этой статье расскажу, как он устроен, какие технические решения пришлось придумывать, как ИИ-агенты писали за меня код и мобильное приложение, и почему faceless-видео - это тренд, который стоит понять и использовать.

Что такое faceless-видео и почему это тренд

Faceless-видео (видео без лица) - это формат коротких вертикальных роликов, где автор не появляется в кадре. Вместо этого - изображения, анимации, эффекты и закадровый голос. Формат взлетел на TikTok, YouTube Shorts и других платформах с вертикальным контентом.

Почему это работает:

  • Низкий порог входа - не нужна камера, свет, монтаж и умение держаться в кадре

  • Масштабируемость - один человек может вести десятки каналов на разных языках

  • Анонимность - автору не обязательно раскрывать себя

  • Автоматизация - весь процесс можно делегировать ИИ

Формат особенно популярен для историй, страшилок, новостных дайджестов, образовательного контента и «факт-видео». Одно из моих видео, сгенерированных YumCut, набрало 90,000 просмотров в русскоязычном TikTok.

Спрос на такие видео есть. Но большинство инструментов для их создания - платные SaaS-сервисы с подписками. Я хотел изменить это.

Что умеет YumCut

YumCut принимает на вход текстовую идею, буквально одно предложение, и генерирует готовое короткое видео длительностью от 30 секунд до минуты. Весь процесс выглядит так:

  1. LLM генерирует сценарий - на основе вашего промпта создаётся структурированная история

  2. Для каждой сцены генерируется промпт изображения - LLM описывает, что должно быть на каждом кадре

  3. Генерируются изображения (~20 штук на видео) - через подключаемые API или локально

  4. Генерируется озвучка - текст превращается в речь на нужном языке

  5. Собирается видео - изображения, эффекты, переходы, оверлеи и аудио объединяются через FFmpeg

  6. Видео готово - от промпта до результата около 20 минут

Всё заточено под вертикальный формат, идеальный для TikTok и YouTube Shorts.

Многоязычность: одна идея - семь языков

Одна из ключевых возможностей YumCut - генерация видео сразу на нескольких языках: английском, русском, испанском, французском, немецком, португальском и итальянском.

Как это работает: вы пишете один промпт, например «Напиши жуткую историю про жуков, живущих в стенах». YumCut генерирует историю, переводит её на нужные языки, генерирует изображения один раз и использует их во всех языковых версиях. Визуал остаётся одинаковым, а текст и озвучка адаптируются.

Для каждого языка можно выбрать отдельный голос. Это важно: один голос редко звучит хорошо на всех языках. Но для каждого языка найдётся голос, который звучит естественно. YumCut позволяет настроить это.

Такой подход позволяет из одной идеи получить контент для аудитории в разных странах при минимальных дополнительных затратах.

9ee0dd735968e93371b473096cf7cdd3.png

Шаблоны: контроль качества

В YumCut есть система настраиваемых шаблонов. Шаблон определяет структуру и стиль видео: как строится история, какой визуальный стиль используется, как расположены элементы. Шаблоны можно добавлять, обновлять и адаптировать под свои задачи.

Принцип простой: чем лучше шаблон, тем качественнее видео на выходе. AI генерирует контент, но рамки задаёт шаблон. Это даёт контроль, которого не хватает при работе с полностью автоматическими сервисами.

Примеры шаблонов
Примеры шаблонов

Постоянство персонажа

Если вы хотите использовать брендированного персонажа во всех видео - YumCut это поддерживает. Можно загрузить своего персонажа или сгенерировать его на основе истории. Персонаж будет использоваться на протяжении всего видео.

Для генерации изображений с постоянным персонажем поддерживаются:

  • Qwen-Image-Edit - генерирует изображения с персонажем недорого, но лучше всего работает с рисованным, анимационным стилем

  • NanoBanana - может генерировать фотореалистичные изображения с постоянством персонажа, но стоит существенно дороже

Для некоторых типов контента (новости, факты, страшные истории) постоянство персонажа не обязательно и можно просто не заморачиваться с этим.

Эффект дудлинга

Простой набор картинок - это скучно. Зритель пролистает. Поэтому одним из первых реализованных эффектов стал дудлинг или имитация рисования картинки.

Технически это работает так:

  1. Утилита получает изображение на вход

  2. Формирует контуры (outline)

  3. Контуры конвертируются в SVG

  4. SVG-контуры появляются постепенно, создавая анимацию «рисования»

Существующие решения в интернете предлагают аналогичный эффект через API по ценам, сопоставимым с генерацией самого изображения. В YumCut это реализовано полностью на open-source утилитах, без сторонних платных сервисов.

Честно скажу, что у текущей реализации есть нюанс: контуры появляются постепенно, но не совсем так, как если бы их рисовала рука. Полноценная имитация штриха - задача на будущее. Но уже сейчас эффект работает: именно видео с дудлингом набрало те самые 90к просмотров.

Дудлинг органичнее всего работает с рисованными изображениями. Обработка занимает больше времени из-за конвертаций и дополнительных обработок, но результат интересный.

Оверлеи и работа с прозрачным видео

Изображения с эффектами и переходами создают динамичность, но иногда недостаточную. Поэтому в YumCut реализована система оверлеев: прозрачные видео, которые накладываются поверх основного и делают финальный ролик более живым.

Звучит просто, но на реализацию ушло много времени. Проблема в форматах. Большинство видеокодеков, поддерживающих альфа-канал (прозрачность), хранят видео в очень объёмных форматах. Одна минута оверлея может весить гигабайт и более.

Решение нашлось в формате WebM с кодеком VP9 - одном из самых современных открытых форматов с поддержкой прозрачности. Но «из коробки» он не заработал. Пришлось потратить значительное время на настройку FFmpeg, подбор параметров кодирования и интеграцию в пайплайн. Сейчас всё настроено и работает, оверлеи хранятся компактно и накладываются без проблем.

Откуда брать изображения, озвучку и музыку

Изображения

Топовые модели генерации видео (Veo, Sora, Kling) закрыты и доступны только за деньги. Open-source модели существуют, но требуют GPU стоимостью в десятки тысяч долларов. Поэтому YumCut строит видео на основе генерируемых изображений.

Генерировать картинки можно локально на обычном железе. Но для создания видео нужно около 20 изображений, поэтому удобнее использовать один из бесплатных или условно-бесплатных API:

Провайдер

Особенности

ImageRouter

Бесплатный роутинг по моделям

BotHub

Поддержка нескольких моделей

OpenRouter

Иногда бывают бесплатные модели, оплата криптой

Google AI Studio

Бесплатный биллинг с бонусом $300

Runware

Обширный выбор моделей, $2 welcome-бонус

Благодаря архитектуре с подключаемыми утилитами можно использовать любую модель генерации изображений - достаточно написать скрипт, который принимает описание и возвращает файл.

Озвучка (TTS)

Я начинал с ElevenLabs, но их модель подписки раздражала: каждый месяц нужно вырабатывать определённый лимит. Это неудобно при небольших объемах. Локальные модели TTS хороши для английского, но с мультиязычностью возникают проблемы с качеством. Зато локально можно клонировать голос любого персонажа без ограничений.

Сейчас есть бюджетные облачные решения: InWorld и Minimax. У них доступна генерация аудио и возможность клонирования голосов. В исходном коде YumCut можно найти варианты локальной генерации через различные утилиты (требуется установка Python-зависимостей).

Музыка

Из соображений авторского права в YumCut не встроена музыкальная библиотека. Варианты:

  • Накладывать музыку вручную при публикации (TikTok и другие платформы предлагают лицензированные треки)

  • Использовать AI-сгенерированную музыку - её качество сейчас достаточно высокое

LLM: разные модели для разных задач

YumCut использует OpenRouter для доступа к языковым моделям, и для разных задач применяются разные LLM:

  • Генерация сценария - лучше всего справляются модели от Claude (Anthropic)

  • Описание изображений (промпты для генератора) - хорошо работает gpt-oss-120b и аналогичные модели

Всё это конфигурируемо. Вы можете подключить любую LLM через OpenRouter и перенастроить под свои задачи.

Архитектура: утилиты вместо монолита

Чтобы проект можно было легко разрабатывать и расширять (в том числе с помощью AI-агентов), я выбрал архитектуру на основе подключаемых утилит.

Каждый этап обработки - генерация изображений, дудлинг, сборка видео - выполняется отдельной утилитой, которая получает входные данные и возвращает результат. Основные утилиты написаны на TypeScript с использованием open-source библиотек, но можно подключить утилиту на любом языке, поддерживаемом системой.

Стек:

  • Backend - Next.js (TypeScript)

  • База данных - MySQL

  • Обработка видео - FFmpeg

  • Мобильное приложение - Swift (iOS)

GPU не требуется. FFmpeg-команды генерируются динамически для сборки финального видео с эффектами, переходами и оверлеями.

Есть REST API, что открывает возможность автоматизации и интеграции.

Cursor vs Codex: как AI писал YumCut

Изначально я разрабатывал проект в Cursor с моделями от Claude. Cursor работал как мидл-разработчик, выпивший 10 кружек кофе: кроме того, что я просил реализовать, он генерировал кучу дополнительных вещей, которые работали неправильно. Приходилось постоянно вычищать лишний код.

Затем я перешёл на Codex от OpenAI. Разница оказалась существенной: Codex понимает задачи и исполняет их конкретно. Обновлять и менять отдельные части проекта стало просто, без страха, что агент сломает что-то в другом месте.

Codex также написал мобильное приложение для iOS целиком - от аутентификации до сохранения видео. Чистый Swift, ни одной строчки я не писал вручную. Приложение работает через REST API сайта и позволяет создавать, просматривать и делиться видео.

Сравнение сервисов для генерации faceless-видео

На рынке сейчас множество инструментов для создания faceless-видео. Вот как они соотносятся:

Сервис

Open Source

Кастомные шаблоны

Постоянство персонажа

Локальный запуск

YumCut

Revid.ai

Faceless.video

Ограничено

AutoShorts.ai

Ограничено

Shorts Generator AI

BigMotion.ai

Creatify

InVideo AI

Fliki.ai

Pictory

Vizard.ai

Ограничено

Большинство сервисов работают по модели подписки ($20–50+/мес) и являются закрытыми SaaS-решениями. YumCut - единственный в этом списке, который можно развернуть локально и использовать без ограничений. Онлайн-версия позволяет попробовать сервис, сгенерировав 3 видео бесплатно.

Лицензия и планы

Проект выложен под лицензией, которая разрешает использование для личных целей. Для коммерческого деплоя в качестве сервиса необходимо связаться со мной. В будущем планирую ослабить лицензию - вплоть до полностью свободной, если будет запрос от сообщества.

Итого

YumCut - это инструмент, который я сделал в первую очередь для себя. Мне нужно было генерировать короткие видео для YouTube-канала с новостями, не тратя на это часы. Получилось решение, которое:

  • Работает из одного промпта

  • Генерирует видео на 7 языках с общим визуалом

  • Не требует GPU

  • Использует любые модели через подключаемые утилиты

  • Полностью open-source для личного использования

Если вы SMM-щик, маркетолог, блогер или просто хотите экспериментировать с AI-видео - клонируйте YumCut из GitHub. Для получения обновлений по развитию проекта - подписывайтесь на мой X.

Источник

Возможности рынка
Логотип NodeAI
NodeAI Курс (GPU)
$0.03254
$0.03254$0.03254
+2.97%
USD
График цены NodeAI (GPU) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.