- Регистрация
- 25.08.2011
- Сообщения
- 942
- Благодарностей
- 1 065
- Баллы
- 93
И снова привет всем.
От бесплатного использования нейросетей по API перейдем к практике использованию локальных моделей на Zennoposter.
Понадобятся:
1. Zennoposter + мой шаблон
2. LMstudio
3. Модель нейросети google/gemma-3-4b с компьютерным зрением. Можете загрузить любую модель с компьютерным зрением (жёлтый глаз напротив модели).
После установки и запуска LMstudio, нажимаем на значок лупы слева в панели и вводим в поле поиска: google/gemma-3-4b и скачиваем её.
Затем выбираем эту модель в чате. Загружаем.
Внизу панели выбираем Developer, затем слева нажимаем на зеленый квадрат и запускаем сервер.
Всё должно быть как на картинке ниже:
Всё, настройка закончена, теперь всё действо происходит только в Zennoposter.
1. Анализ изображений.
Теперь Zennoposter обладает компьютерным зрением и может видеть и понимать любое изображение, которое вы ему покажете.
Проверим.
Пишем промт:
Некоторые квены и прочие дикпики норовят ответить на китайском, даже когда их нормально просишь, поэтому предлагаем отвечать на ведущем языке планеты.
Следующее изображение не слабонервных и вообще 18+. Сильнонервные могут смотреть смело.
Результат:
Вроде неплохо.
От себя добавлю, что ни одно животное не пострадал во время работы кода.
2. Распознавание каптчи.
Промт:
Если б такая штука была несколько лет назад, сколько можно было бы дел натворить. Впрочем, и сейчас половина каптч, которые встречаются под силу победить локально. Причём, абсолютно бесплатно.
Вот эти каптчи распознаются на раз:
Время распознавания - от 2 до 9 секунд.
Я попробовал сделать рассылку с донора с распознаванием каптчи через LMstudio - выходило примерно 7 писем в один поток за минуту.
По-моему, нормально.
Думаю, если видеокарта крутая, будет значительно быстрее.
3. Оценка и отчёт по фото.
Промт:
4. Диагноз и отчёт.
Теперь поиграем в доктора. Вот результат УЗИ.
Промт:
И не надо 7 лет учиться!! Шучу (нервно)...
Проверим как работает на рукописной жалобе.
Промт:
Эрудированность модели и знание советской уголовной истории немного удивляет.
5. Работа с текстом/документами.
Промт:
Результат:
Текстовый документ обработан за 18 секунд. Суммаризация получилась понятная, в 4 раза короче исходного документа.
PDF.
С pdf без дополнительных инструментов и библиотек беда - нейросеть не смогла ничего понять.
Это малая часть примеров того, как можно сократить время и расходы в работе.
Все упомянутые шаблоны и файлы прилагаю, возможно, кому-то пригодятся в работе.
От бесплатного использования нейросетей по API перейдем к практике использованию локальных моделей на Zennoposter.
Понадобятся:
1. Zennoposter + мой шаблон
2. LMstudio
3. Модель нейросети google/gemma-3-4b с компьютерным зрением. Можете загрузить любую модель с компьютерным зрением (жёлтый глаз напротив модели).
После установки и запуска LMstudio, нажимаем на значок лупы слева в панели и вводим в поле поиска: google/gemma-3-4b и скачиваем её.
Затем выбираем эту модель в чате. Загружаем.
Внизу панели выбираем Developer, затем слева нажимаем на зеленый квадрат и запускаем сервер.
Всё должно быть как на картинке ниже:
Всё, настройка закончена, теперь всё действо происходит только в Zennoposter.
1. Анализ изображений.
Теперь Zennoposter обладает компьютерным зрением и может видеть и понимать любое изображение, которое вы ему покажете.
Проверим.
Пишем промт:
C#:
string userMessage = "Опиши подробно, что на этом изображении. Отвечай только на русском языке. Always respond in Russian language.";
Следующее изображение не слабонервных и вообще 18+. Сильнонервные могут смотреть смело.
Результат:
Выполнение кода C# Результат: На изображении представлен маленький полосатый котенок, вероятно, британская короткошерстная порода, из-за характерных полосок.
У котенка светло-серый мех с темными полосками. Он стоит на задних лапах и пытается ухватиться за зелёную игрушку в виде гранаты (скорее всего, это имитация игрушки для кошек).
Граната имеет металлический корпус и рычаг. Котенок смотрит прямо в камеру с любопытством и вниманием.
Фон белый, немного отражает свет, что создает эффект мягкого освещения.
Общий вид фотографии – весёлый и забавный.
Вроде неплохо.
От себя добавлю, что ни одно животное не пострадал во время работы кода.
2. Распознавание каптчи.
Промт:
C#:
string userMessage = "Опиши подробно, что на этом изображении. Если там текст - воспроизведи его точно, если арифметическое действие - напиши его результат (решение).";
Вот эти каптчи распознаются на раз:
Время распознавания - от 2 до 9 секунд.
Я попробовал сделать рассылку с донора с распознаванием каптчи через LMstudio - выходило примерно 7 писем в один поток за минуту.
По-моему, нормально.
Думаю, если видеокарта крутая, будет значительно быстрее.
3. Оценка и отчёт по фото.
Промт:
C#:
string userMessage = "You will have to act as a vehicle damage assessment expert . You will be given an image of a car. Your task is to analyze the images and assess whether there is any damage (dents, scratches, etc.). Based on your assessment, we will determine whether the car needs cosmetic repairs or not. Отвечай только на русском языке. Always respond in Russian language.";
Почти отчет страхового оценщика.Выполнение кода C# Результат: Оценка повреждений автомобиля по изображению:
**Общий вид:** На представленной фотографии видно значительное повреждение боковой панели автомобиля. Видны серьезные вмятины и царапины, возможно, даже порез на краске.
**Детали повреждений:**
* **Вмятины:** Есть несколько глубоких вмятин на боковой панели, особенно заметно в области двери.
* **Царапины/Порезы:** Краска растреслась, что указывает на царапины или даже порезы. Видны следы от инструментов или ударов.
* **Окно:** Окно не повреждено.
* **Колеса:** Колесо выглядит целым, но возможно, есть повреждения в области диска, которые не видны на этой фотографии.
**Вывод:**
Учитывая масштаб повреждений боковой панели, автомобиль **требует косметического ремонта**. Необходимо провести ремонт кузова, включая шпаклевку, покраску и полировку для восстановления внешнего вида автомобиля.
Если вам нужна более детальная оценка (например, определение типа вмятин или оценка объема работы), потребуется более качественное изображение с разных ракурсов.
4. Диагноз и отчёт.
Теперь поиграем в доктора. Вот результат УЗИ.
Промт:
C#:
string userMessage = "Ты врач. Сделай заключение и рекомендую медицинские действия/лечение, если необходимо, и выпиши лекарства. Отвечай только на русском языке. Always respond in Russian language.";
Выполнение кода C# Результат: ## Заключение и Рекомендации
**Диагноз:** Беременность 5-6 недель. Угрожающий выкидыш.
**Клиническая картина:** На основании представленных данных, беременность на сроке 5-6 недель характеризуется значительными осложнениями:
* **УЗИ ОМТ (15.02.19):** По передней стенке участок отслойки, что является крайне серьезным признаком и представляет непосредственную угрозу для матери и плода.
* **Биохимические показатели:** Выявлены отклонения в биохимии крови: понижен уровень креатинина, общий билирубин, а также уровень белка в сыворотке крови. Эти изменения могут быть связаны с патологией беременности или другими осложнениями.
* **УЗИ ОМТ (25.02.19):** Повторная отслойка по передней стенке.
**Обоснование лечения:** Наличие отслойки и другие отклонения требуют немедленного вмешательства для предотвращения дальнейших осложнений, включая потерю беременности.
**Лечение:**
* **Джафастон 40 мг однократно** – для быстрого снижения давления и стабилизации состояния.
* **Джафастон 10 мг х3 раза в день** - для поддержания антигипертензивного эффекта.
* **Транексам 500мг х2р/д** – препарат, способствующий уменьшению кровопотери и укреплению сосудистой стенки (при отслойке).
* **Фолиевая кислота 400 мг 1 р/д** – для поддержки развития плода и компенсации дефицита фолиевой кислоты.
* **Йодомарин 200 мг 1 р/д** - для обеспечения достаточного потребления йода, необходимого в период беременности.
**Рекомендации:**
1. **Госпитализация:** Немедленная госпитализация в гинекологическое отделение для тщательного наблюдения и проведения дополнительных обследований (например, УЗИ с допплерографией).
2. **Явка к врачу в течении 7 дней.**
3. **Половая покой, физическая покой, профилактика запоров.** Важно избегать стресса и переутомления.
4. **Джафастон 10 мг х2р/д до 20 недель.** Продолжение приема препарата для контроля артериального давления.
5. **Алентум пренаталь IТ №960** - для поддержания нормального уровня белка во время беременности и период лактации.
6. **Йодомарин 200 мг 1 р/д в дозе беременности и период лактации.**
7. **УЗИ скрининг 12-13 недель.** Для контроля состояния плода и исключения других патологий.
8. **Пероральный глюкозо-толерантный тест для исключения эстилоцитоза сахарного диабета, который может быть сопряжен с повышенным риском осложнений.**
**Важные замечания:**
* Данное заключение и рекомендации основаны исключительно на предоставленных данных. Необходимо учитывать индивидуальные особенности пациентки, ее анамнез и результаты дополнительных исследований.
* Прием любых лекарственных препаратов должен осуществляться только по назначению врача!
* Необходимо строго соблюдать режим приема препаратов, указанный врачом.
**Обязательно проконсультируйтесь с квалифицированным врачом для получения окончательного диагноза и плана лечения.**
**Диагноз:** Беременность 5-6 недель. Угрожающий выкидыш.
**Клиническая картина:** На основании представленных данных, беременность на сроке 5-6 недель характеризуется значительными осложнениями:
* **УЗИ ОМТ (15.02.19):** По передней стенке участок отслойки, что является крайне серьезным признаком и представляет непосредственную угрозу для матери и плода.
* **Биохимические показатели:** Выявлены отклонения в биохимии крови: понижен уровень креатинина, общий билирубин, а также уровень белка в сыворотке крови. Эти изменения могут быть связаны с патологией беременности или другими осложнениями.
* **УЗИ ОМТ (25.02.19):** Повторная отслойка по передней стенке.
**Обоснование лечения:** Наличие отслойки и другие отклонения требуют немедленного вмешательства для предотвращения дальнейших осложнений, включая потерю беременности.
**Лечение:**
* **Джафастон 40 мг однократно** – для быстрого снижения давления и стабилизации состояния.
* **Джафастон 10 мг х3 раза в день** - для поддержания антигипертензивного эффекта.
* **Транексам 500мг х2р/д** – препарат, способствующий уменьшению кровопотери и укреплению сосудистой стенки (при отслойке).
* **Фолиевая кислота 400 мг 1 р/д** – для поддержки развития плода и компенсации дефицита фолиевой кислоты.
* **Йодомарин 200 мг 1 р/д** - для обеспечения достаточного потребления йода, необходимого в период беременности.
**Рекомендации:**
1. **Госпитализация:** Немедленная госпитализация в гинекологическое отделение для тщательного наблюдения и проведения дополнительных обследований (например, УЗИ с допплерографией).
2. **Явка к врачу в течении 7 дней.**
3. **Половая покой, физическая покой, профилактика запоров.** Важно избегать стресса и переутомления.
4. **Джафастон 10 мг х2р/д до 20 недель.** Продолжение приема препарата для контроля артериального давления.
5. **Алентум пренаталь IТ №960** - для поддержания нормального уровня белка во время беременности и период лактации.
6. **Йодомарин 200 мг 1 р/д в дозе беременности и период лактации.**
7. **УЗИ скрининг 12-13 недель.** Для контроля состояния плода и исключения других патологий.
8. **Пероральный глюкозо-толерантный тест для исключения эстилоцитоза сахарного диабета, который может быть сопряжен с повышенным риском осложнений.**
**Важные замечания:**
* Данное заключение и рекомендации основаны исключительно на предоставленных данных. Необходимо учитывать индивидуальные особенности пациентки, ее анамнез и результаты дополнительных исследований.
* Прием любых лекарственных препаратов должен осуществляться только по назначению врача!
* Необходимо строго соблюдать режим приема препаратов, указанный врачом.
**Обязательно проконсультируйтесь с квалифицированным врачом для получения окончательного диагноза и плана лечения.**
И не надо 7 лет учиться!! Шучу (нервно)...
Проверим как работает на рукописной жалобе.
Промт:
C#:
string userMessage = "Ты полицейский. Дай правовую и нравственную оценку содержанию текста на изображении. Отвечай только на русском языке. Always respond in Russian language.";
Выполнение кода C# Результат: Прежде всего, я должен отметить, что представленный текст является фрагментом старой советской уголовной истории – дело № 16-5 от 1947 года, известного как "Дело о кукольном театре". Оценивать его с точки зрения современной правовой и нравственной системы крайне сложно и требует осторожного подхода.
**Правовая оценка:**
* **Недопустимость использования доказательств, полученных в результате пыток и насилия:** Самое главное – это то, что дело было построено на признаниях, полученных под воздействием жестоких методов допроса, включая длительные периоды содержания под стражей без возможности видений родственников, лишение сна, пищи и других элементарных условий. Признания были вызваны исключительно физическим и моральным давлением, а не добровольным согласием. В современных правовых системах подобные доказательства считаются недопустимыми и не имеют юридической силы.
* **Нарушение прав человека:** Деятельность органов НКВД по расследованию этого дела представляет собой грубое нарушение фундаментальных прав человека – права на свободу, неприкосновенность личности, право на справедливый суд. Сбор информации осуществлялся незаконными способами, без соблюдения законных процедур.
* **Несоответствие советской судебной системы:** В то время советская судебная система была подчинена политическим требованиям и не могла обеспечить объективного рассмотрения дела. Судьи были вынуждены принимать решения в угоду властям.
* **Устаревший законодательный контекст:** С юридической точки зрения, действия, описанные в тексте (покушение на убийство, угрозы, подделка документов) являются преступными и подлежали бы преследованию по действующему на тот момент уголовному кодексу. Однако, учитывая обстоятельства производства доказательств, эти обвинения не имели бы юридической силы сегодня.
**Нравственная оценка:**
* **Несправедливость и жестокость:** Дело о кукольном театре – это пример бесчеловечности, несправедливости и морального разложения, которые были характерны для периода сталинского террора.
* **Нарушение человеческого достоинства:** Попытки вырвать признания из людей под давлением, лишить их семьи и будущего – это грубое нарушение человеческого достоинства.
* **Отсутствие моральной ответственности:** Органы НКВД несли полную ответственность за преступления, совершенные ими в ходе расследования. Их действия были аморальными и недопустимыми с любой точки зрения.
**Заключение:**
Текст представляет собой исторический документ, свидетельствующий о трагических событиях в истории Советского Союза. С юридической точки зрения он не имеет никакой ценности из-за незаконного получения доказательств. С моральной точки зрения – это пример бесчеловечности и несправедливости, который должен служить предостережением для будущих поколений. Как полицейский, я считаю, что важно помнить об этой истории, чтобы никогда больше не допустить повторения подобных злодеяний.
**Важно отметить:** Этот ответ основан на юридической и моральной оценке представленного текста в контексте исторических событий.
**Правовая оценка:**
* **Недопустимость использования доказательств, полученных в результате пыток и насилия:** Самое главное – это то, что дело было построено на признаниях, полученных под воздействием жестоких методов допроса, включая длительные периоды содержания под стражей без возможности видений родственников, лишение сна, пищи и других элементарных условий. Признания были вызваны исключительно физическим и моральным давлением, а не добровольным согласием. В современных правовых системах подобные доказательства считаются недопустимыми и не имеют юридической силы.
* **Нарушение прав человека:** Деятельность органов НКВД по расследованию этого дела представляет собой грубое нарушение фундаментальных прав человека – права на свободу, неприкосновенность личности, право на справедливый суд. Сбор информации осуществлялся незаконными способами, без соблюдения законных процедур.
* **Несоответствие советской судебной системы:** В то время советская судебная система была подчинена политическим требованиям и не могла обеспечить объективного рассмотрения дела. Судьи были вынуждены принимать решения в угоду властям.
* **Устаревший законодательный контекст:** С юридической точки зрения, действия, описанные в тексте (покушение на убийство, угрозы, подделка документов) являются преступными и подлежали бы преследованию по действующему на тот момент уголовному кодексу. Однако, учитывая обстоятельства производства доказательств, эти обвинения не имели бы юридической силы сегодня.
**Нравственная оценка:**
* **Несправедливость и жестокость:** Дело о кукольном театре – это пример бесчеловечности, несправедливости и морального разложения, которые были характерны для периода сталинского террора.
* **Нарушение человеческого достоинства:** Попытки вырвать признания из людей под давлением, лишить их семьи и будущего – это грубое нарушение человеческого достоинства.
* **Отсутствие моральной ответственности:** Органы НКВД несли полную ответственность за преступления, совершенные ими в ходе расследования. Их действия были аморальными и недопустимыми с любой точки зрения.
**Заключение:**
Текст представляет собой исторический документ, свидетельствующий о трагических событиях в истории Советского Союза. С юридической точки зрения он не имеет никакой ценности из-за незаконного получения доказательств. С моральной точки зрения – это пример бесчеловечности и несправедливости, который должен служить предостережением для будущих поколений. Как полицейский, я считаю, что важно помнить об этой истории, чтобы никогда больше не допустить повторения подобных злодеяний.
**Важно отметить:** Этот ответ основан на юридической и моральной оценке представленного текста в контексте исторических событий.
Эрудированность модели и знание советской уголовной истории немного удивляет.
5. Работа с текстом/документами.
Промт:
C#:
string userMessage = "Проанализируй документ и ответь на вопрос: какие основные темы обсуждаются?";
string systemMessage = "Ты эксперт по анализу документов. Отвечай структурировано и на русском языке.";
Wan 2.2 - это революционная open-source модель от Alibaba, которая использует архитектуру Mixture of Experts (MoE) с 27 миллиардами параметров. Особенность модели - она активирует только 14 миллиардов параметров за раз, что делает её эффективнее конкурентов при меньших вычислительных затратах.
Фишки Wan 2.2
Генерация видео в 1080p нативно
Поддержка сложных движений и спортивных сцен
Улучшенное понимание физики мира
Бесплатная генерация 5-секундных роликов
Доступна для локального запуска с RTX видеокартами от 8 ГБ
Универсальные рецепты
1. Базовая формула (для новичков)
Prompt = Субъект + Сцена + Движение
Субъект - основной объект видео: человек, животное, предмет или фантастическое существо.
Сцена - где происходит действие: реальная локация или вымышленная обстановка.
Движение - что происходит: от неподвижности до активных действий.
Пример: Рыжий кот на кухонном столе медленно играет с клубком пряжи.
2. Продвинутая формула (для опытных пользователей)
Prompt = Субъект (+ описание) + Сцена (+ детали) + Движение (+ характеристики) + Контроль эстетики + Стилизация
Описание субъекта: внешность, одежда, эмоции - "Девушка с чёрными волосами в традиционном китайском платье"
Детали сцены: особенности окружения - "В заснеженном бамбуковом саду при лунном свете"
Характеристики движения: скорость, амплитуда, эффекты - "Плавно танцует с развевающимися рукавами"
Контроль эстетики: освещение, ракурс, движение камеры - "Боковое освещение, средний план, медленная панорама"
Стилизация: визуальный стиль - "Кинематографический стиль, аниме-эстетика"
Пример полного промпта: "Девушка с чёрными волосами в традиционном красном ципао, заснеженный бамбуковый сад при лунном свете, плавно танцует с развевающимися рукавами, боковое освещение, средний план, медленная панорама влево, кинематографический стиль"
3. Image-to-Video формула
Когда у вас есть исходное изображение, оно уже определяет субъект, сцену и стиль. Фокусируйтесь только на движении и камере.
Prompt = Описание движения + Движение камеры
Движение: "бежит", "машет рукой", "медленно поворачивается"
Управление камерой: "dolly in" (наезд), "pan left" (панорама влево), "static shot" (статичный кадр)
Примеры:
"Мальчик весело машет рукой, плавная панорама вправо"
"Дракон медленно открывает крылья, статичный крупный план"
Практические советы для всех ИИ-генераторов
Универсальные принципы промптинга
Чем детальнее тем лучше. Нейросети лучше понимают конкретные описания вместо абстрактных понятий. Вместо "красивая девушка" пишите "25-летняя девушка с каштановыми волосами в белом летнем платье".
Структурируйте промпт логично. Начинайте с главного объекта, затем переходите к окружению, действию и техническим деталям.
Используйте кинематографические термины
"Close-up" (крупный план), "Wide shot" (общий план)
"Golden hour lighting" (освещение золотого часа)
"Tracking shot" (трекинг), "Handheld camera" (съёмка с рук)
Контроль качества и стиля
Добавляйте качественные теги:"4K", "cinematic", "professional", "high quality", "detailed".
Указывайте художественный стиль:"Cyberpunk", "Studio Ghibli style", "Film noir", "Documentary style".
Управляйте настроением:"Dramatic", "peaceful", "energetic", "mysterious", "dreamlike".
Сравнение с топовыми генераторами 2025 года
Wan 2.2 показывает отличные результаты на уровне Veo 3, Kling 2.1 и Runway Gen 4. Главное преимущество - бесплатный доступ и возможность локального запуска.
Практические примеры промптов
Для Wan 2.2 и аналогов:
Простой: "Белый кот играет с красным мячиком на зелёной траве".
Средний: "Молодой мужчина в спортивной форме бежит по утреннему парку, камера следует сбоку, мягкий рассветный свет".
Продвинутый: "Киберпанк-танцовщица с неоновыми имплантами, тёмный клуб с разноцветными лазерами, энергичные движения под электронную музыку, динамичные ракурсы камеры, стиль Blade Runner, 4K, кинематографический".
Фишки Wan 2.2
Генерация видео в 1080p нативно
Поддержка сложных движений и спортивных сцен
Улучшенное понимание физики мира
Бесплатная генерация 5-секундных роликов
Доступна для локального запуска с RTX видеокартами от 8 ГБ
Универсальные рецепты
1. Базовая формула (для новичков)
Prompt = Субъект + Сцена + Движение
Субъект - основной объект видео: человек, животное, предмет или фантастическое существо.
Сцена - где происходит действие: реальная локация или вымышленная обстановка.
Движение - что происходит: от неподвижности до активных действий.
Пример: Рыжий кот на кухонном столе медленно играет с клубком пряжи.
2. Продвинутая формула (для опытных пользователей)
Prompt = Субъект (+ описание) + Сцена (+ детали) + Движение (+ характеристики) + Контроль эстетики + Стилизация
Описание субъекта: внешность, одежда, эмоции - "Девушка с чёрными волосами в традиционном китайском платье"
Детали сцены: особенности окружения - "В заснеженном бамбуковом саду при лунном свете"
Характеристики движения: скорость, амплитуда, эффекты - "Плавно танцует с развевающимися рукавами"
Контроль эстетики: освещение, ракурс, движение камеры - "Боковое освещение, средний план, медленная панорама"
Стилизация: визуальный стиль - "Кинематографический стиль, аниме-эстетика"
Пример полного промпта: "Девушка с чёрными волосами в традиционном красном ципао, заснеженный бамбуковый сад при лунном свете, плавно танцует с развевающимися рукавами, боковое освещение, средний план, медленная панорама влево, кинематографический стиль"
3. Image-to-Video формула
Когда у вас есть исходное изображение, оно уже определяет субъект, сцену и стиль. Фокусируйтесь только на движении и камере.
Prompt = Описание движения + Движение камеры
Движение: "бежит", "машет рукой", "медленно поворачивается"
Управление камерой: "dolly in" (наезд), "pan left" (панорама влево), "static shot" (статичный кадр)
Примеры:
"Мальчик весело машет рукой, плавная панорама вправо"
"Дракон медленно открывает крылья, статичный крупный план"
Практические советы для всех ИИ-генераторов
Универсальные принципы промптинга
Чем детальнее тем лучше. Нейросети лучше понимают конкретные описания вместо абстрактных понятий. Вместо "красивая девушка" пишите "25-летняя девушка с каштановыми волосами в белом летнем платье".
Структурируйте промпт логично. Начинайте с главного объекта, затем переходите к окружению, действию и техническим деталям.
Используйте кинематографические термины
"Close-up" (крупный план), "Wide shot" (общий план)
"Golden hour lighting" (освещение золотого часа)
"Tracking shot" (трекинг), "Handheld camera" (съёмка с рук)
Контроль качества и стиля
Добавляйте качественные теги:"4K", "cinematic", "professional", "high quality", "detailed".
Указывайте художественный стиль:"Cyberpunk", "Studio Ghibli style", "Film noir", "Documentary style".
Управляйте настроением:"Dramatic", "peaceful", "energetic", "mysterious", "dreamlike".
Сравнение с топовыми генераторами 2025 года
Wan 2.2 показывает отличные результаты на уровне Veo 3, Kling 2.1 и Runway Gen 4. Главное преимущество - бесплатный доступ и возможность локального запуска.
Практические примеры промптов
Для Wan 2.2 и аналогов:
Простой: "Белый кот играет с красным мячиком на зелёной траве".
Средний: "Молодой мужчина в спортивной форме бежит по утреннему парку, камера следует сбоку, мягкий рассветный свет".
Продвинутый: "Киберпанк-танцовщица с неоновыми имплантами, тёмный клуб с разноцветными лазерами, энергичные движения под электронную музыку, динамичные ракурсы камеры, стиль Blade Runner, 4K, кинематографический".
Результат:
Выполнение кода C# Результат: **Анализ документа: Основные темы обсуждения**
Документ представляет собой описание новой open-source модели для генерации видео – Wan 2.2 от Alibaba. Основные темы, которые в нем обсуждаются, можно структурировать следующим образом:
1. **Описание Wan 2.2:**
* **Технические характеристики:** Подробно описывается модель как Mixture of Experts, её эффективность (использование только 14 миллиардов параметров), функциональность (генерация видео в 1080p с продвинутыми движениями и физикой) и требования к оборудованию (RTX видеокарты от 8 ГБ).
* **Доступность:** Подчеркивается, что Wan 2.2 является бесплатной open-source моделью.
2. **Формулы для создания запросов (prompts):**
* Представлены базовые и примеры формул для генерации видео, основанные на структуре "Субъект + Сцена + Движение". Это ключевой элемент для пользователя в использовании модели.
3. **Контроль качества и стиля:**
* Обсуждаются методы улучшения результатов:
* Использование качественных тегов (4K, cinematic, professional и т.д.)
* Указание художественного стиля (Cyberpunk, Studio Ghibli style и т.д.)
* Управление настроением видео (Dramatic, peaceful и т.д.).
4. **Сравнение с другими генераторами:**
* Wan 2.2 сравнивается по результатам с Veo 3, Kling 2.1 и Runway Gen 4, подчеркивая её конкурентоспособность на уровне топовых моделей.
5. **Image-to-Video формула**: Представлена новая формула для генерации видео из изображения.
**В целом, документ направлен на ознакомление с Wan 2.2 как с перспективным бесплатным инструментом для создания видеороликов, и предоставляет пользователям рекомендации по эффективному использованию модели.**
Документ представляет собой описание новой open-source модели для генерации видео – Wan 2.2 от Alibaba. Основные темы, которые в нем обсуждаются, можно структурировать следующим образом:
1. **Описание Wan 2.2:**
* **Технические характеристики:** Подробно описывается модель как Mixture of Experts, её эффективность (использование только 14 миллиардов параметров), функциональность (генерация видео в 1080p с продвинутыми движениями и физикой) и требования к оборудованию (RTX видеокарты от 8 ГБ).
* **Доступность:** Подчеркивается, что Wan 2.2 является бесплатной open-source моделью.
2. **Формулы для создания запросов (prompts):**
* Представлены базовые и примеры формул для генерации видео, основанные на структуре "Субъект + Сцена + Движение". Это ключевой элемент для пользователя в использовании модели.
3. **Контроль качества и стиля:**
* Обсуждаются методы улучшения результатов:
* Использование качественных тегов (4K, cinematic, professional и т.д.)
* Указание художественного стиля (Cyberpunk, Studio Ghibli style и т.д.)
* Управление настроением видео (Dramatic, peaceful и т.д.).
4. **Сравнение с другими генераторами:**
* Wan 2.2 сравнивается по результатам с Veo 3, Kling 2.1 и Runway Gen 4, подчеркивая её конкурентоспособность на уровне топовых моделей.
5. **Image-to-Video формула**: Представлена новая формула для генерации видео из изображения.
**В целом, документ направлен на ознакомление с Wan 2.2 как с перспективным бесплатным инструментом для создания видеороликов, и предоставляет пользователям рекомендации по эффективному использованию модели.**
Текстовый документ обработан за 18 секунд. Суммаризация получилась понятная, в 4 раза короче исходного документа.
PDF.
С pdf без дополнительных инструментов и библиотек беда - нейросеть не смогла ничего понять.
Выполнение кода C# Результат: **Основные темы документа:**
Судя по предоставленному тексту, документ не содержит никаких осмысленных тем или ключевых элементов. Это последовательность случайных символов и букв, которая не имеет никакой структуры или содержания.
**Вывод:**
Документ является бессмысленным и не подлежит анализу с точки зрения выделения основных тем.
Судя по предоставленному тексту, документ не содержит никаких осмысленных тем или ключевых элементов. Это последовательность случайных символов и букв, которая не имеет никакой структуры или содержания.
**Вывод:**
Документ является бессмысленным и не подлежит анализу с точки зрения выделения основных тем.
Это малая часть примеров того, как можно сократить время и расходы в работе.
Все упомянутые шаблоны и файлы прилагаю, возможно, кому-то пригодятся в работе.
Вложения
-
18,1 КБ Просмотры: 4