Бояндин Константин Юрьевич : другие произведения.

Генеративные сервисы для звуковых композиций. Suno, урок 1: Мета-теги (2024-11-19)

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:
Школа кожевенного мастерства: сумки, ремни своими руками
 Ваша оценка:
  • Аннотация:
    Генеративные сервисы для звуковых композиций

Сервисы и ПО для создания музыкальных композиций

Ниже, при наилучшем стечении обстоятельств, будет перечень сервисов и программного обеспечения для создания и правки музыкальных композиций.

Автор текста предпочитает работать на компьютере под управлением ОС Линукс (обычно Ubuntu или Kali); соответственно, все поиски и советы даются с этим выбором по умолчанию. Почти все мало-мальски полезные инструменты или не зависят от выбора ОС (т.е., работают из браузера), или доступны на нескольких платформах.

Suno

Suno — сервис, использующий технологии искусственного интеллекта для генерации музыкальных треков (инструментальных, песенных, прочих), в т.ч. "по мотивам" уже существующих (каверы) либо загруженных пользователем из музыкального файла).

Для оплаты услуг сервиса используется внутренняя расчётная единица, "кредиты"; бесплатные пользователи могут использовать до 50 кредитов в сутки; в настоящее время любая генеративная функция стоит 5 кредитов. При создании треков и замене их секций всегда запускается парная генерация по одним и тем же параметрам.

Возможно оплатить коммерческую подписку (в т.ч. из России), тогда, в зависимости от типа подписки, будет или 2500, или 10000 кредитов ежемесячно (неизрасходованная ежемесячная часть сбрасывается). Коммерческая подписка передаёт всё, сгенерированное в сервисе пользователем в его собственность и разрешает в т.ч. коммерческое использование (бесплатная - только использование для личных некоммерческих нужд).

Урок 1. Мета-теги

В интерфейсе Suno есть секция "Слова" ("Lyrics"), до 3000 символов ввода, и секция "Стиль музыки" ("Style of Music"), до 120 символов ввода.

Начинающие пользователи обычно впечатывают слова песни в секцию слов и своё понимание стиля и жанра - в секцию "Стиль музыки". Стоит обратить внимание на функцию этих двух полей.

Поле "Lyrics" позволяет полностью задать структуру, жанр, стиль, темп музыки. Это прямая цепочка директив для двигателя, что и в каком порядке генерировать, и какие изменения вносить в выходные данные.

Поле "Style of Music" определяет звуковой ландшафт, общее впечатление от композиции. В случае конфликтов директивы из "Lyrics" имеют преимущество перед "Stylе of Music".

Для указания директив (и отделения их от собственно слов) используются мета-теги - указания на английском языке в квадратных скобках. Ниже приведён (не исчерпывающий, будет уточняться) перечень известных в Suno мета-тегов. Все они используются только в поле "Lyrics".

Важно: Suno использует для генерации звуковых файлов двигатель Bark собственной разработки (доступный на бесплатной основе - никто не мешает вам организовать собственный вариант Suno). Особенностью его является то, что многие параметры выходной композиции можно задавать мноеством разных способов. Практически всега совет один: экспериментировать и делать выводы, работает или нет.

Мета-тегНазначениеПример
[genre]Жанр произведения - указывайте как можно ближе к началу определения.
[genre:rock]
[genre:hypnagogic-pacific-reggae]
Обратите внимание: во втором случае определение жанра состоит из нескольких слов. В таком случае используется написание через знак минус, как в примере.
[mood]Передаёт желательное настроение композиции.
[mood:happy]: Бодрый и жизнеутверждающий трек.
[mood:sad]: Мрачное и меланхоличное настроение.
[mood:energetic]: Стремительная, динамичная композиция.
[mood:calm]: Умиротворяющая, успокаивающая мелодия.
[mood:romantic]: Романтические, нежные, эмоциональные тона.
[mood:dark]: Создаёт мрачную, таинственную атмосферу.
[mood:uplifting]: Вдохновляющая, позитивная тема.
[mood:angry]: Агрессивный, резкий тон.
[mood:nostalgic]: Побуждает вспоминать и тепло упоминать.
[mood:peaceful]: Ясный, гармоничный и жизнеутверждающий тон.
[tempo]Темп (скорость); или в относительном выражении, или в количестве единиц тактов в минуту (BPM). Специальное значение "none" означает, что композиция не содержит ритма как такового.
[tempo:fast]
[tempo:slow]
[tempo:none]
[tempo:120bpm]
[instruments]Инструменты: партии каких инструментов необходимо подчеркнуть (т.е., в т.ч. использовать)
[instruments:guitar, piano]
[vocals]Тип вокала (голоса исполнителя) - половая принадлежность, тип исполнения и т.д.
[vocals:female, melodic]
[vocals:male, rap]
[intro]Обозначает вступление, начало композиции, экспозицию темы. Следующие за этим и перед следующим мета-тегом слова, если есть, использовать во время экспозиции.
[intro]
[verse]Обозначает, что следом идут слова куплета. В теге может быть необязательный параметр, его влияния на генерацию не отмечено - чисто для удобства прочтения определения композиции.
[verse]
[verse 1]
[chorus]Обозначает, что идущий следом текст, до очередного мета-тега, входит в припев.
[chorus]
[bridge]Бридж - фрагмент, где меняется тема композиции, прежде чем вернуться к исходной. Слова, следующие за тегом, исполняются в пределах бриджа.
[bridge]
[interlude]Интерлюдия, включение инструментального фрагмента, обычно отличающегося от основной темы.
[interlude]
[outro]Обозначает финальную часть композиции, закрывающую её. Текст следом за тегом исполняется в финальной части.
[outro]
[end]Указание, что других тегов не ожидается, логический конец композиции. Стоит учитывать, что точного указания времени для композиций нет, и этот тег - не более чем указание для составителя.
[end]
[style]Указание на желательный стиль (см. также поле "Style of Music")
[style:jazz]
[style:classical]
[style:acoustic]
[style:lo-fi]
[style:synthwave]
[style:orchestral]
[style:folk]
[style:ambient]
[style:funk]
[style:disco]
[style:punk]
[style:grunge]
[instrumental]Указание включить инструментальную часть (проигрыш). Параметры тега могут включать желательный тип проигрыша (инструменты, манеру и т.д.).
[instrumental harmonica solo]
[sfx]Вставить звуковой эффект
[sfx:applause]
[sfx:rain]
[whisper]Шёпот: предписывает, что последующий вокал должен произноситься шёпотом
[whisper]
[male] / [female]Половая принадлежность певца (голоса): мужской или женский. Необязательные параметры могут включать диапазон, особенности тембра, манеру.
[male]
[female]
[emotional]Эмоционально: усилить эмоциональный окрас следующего за тегом вокала
[emotional]
[happy] / [sad]Предписать эмоциональный окрас (счастливо / грустно) вокалу, следующему за тегом.
[happy]
[sad]
[epic]Эпично: придать последующей части композиции возвышенность, торжественность, грандиозность.
[epic]
[break]Пауза: временно оборвать или сделать значительно тише композицию. Обычно следом используют тег вида sfx или любой другой для смены манеры или других параметров.
[break]
[hook]Буквально: (рыболовный) крючок. Следующий за тегом вокал выделить, сделать заметнее, чтобы обратил внимание слушателя.
[hook]
[refrain]Обозначить начало повторяющейся части композиции (аналогично припеву, по возможности - с повторением соотв. фраз темы)
[refrain]
[pre-chorus]Предвкушение (ожидание) припева: секция, предшествующая припеву. Должна предвосхитить его, как-то обозначить.
[pre-chorus]
[drop]Сброс: резко снизить напряжение темы (часто используется в электронных композициях)
[drop]
[start]Начало композиции; предполагается, если не использована.
[start]
[female vocals] / [male vocals]Половая принадлежность вокала (женский или мужской) - влияет на сопровождающие или одновременно идущие вокальные вставки
[female vocals]
[male vocals]
[female singer] / [male singer] / [kid singer]Ещё один способ задать тембр и возраст голоса. Обратите внимание на [kid singer]: в общем и целом в сервисе сложно добиться, чтобы вокал исполнялся детским голосом.
[female singer]
[male singer]
[kid singer]
[whispering]Предписывает исполнять вокал шёпотом.
[whispering]
[laughter]Смех: добавляет звуковой фрагмент со смехом; необязательные параметры могут уточнять, каким должен быть смех.
[laughter]
[piano interlude], [guitar solo], [rhodes piano and blues guitar solo], [ending riff, drum solo], [guitar turnaround, with drums]], [acoustic], [african], [alternative metal], [alternative pop], [ambient], [atlanta], [ballad], [baroque], [blues], [boom bap], [cello], [chill], [christian & gospel], [christmas], [country & american], [dance & electronic], [drums], [dubstep ], [edm], [girl group], [gospel], [hardcore rap], [heavy metal], [hip hop], [indie], [indie rock], [j-pop], [lo-fi], [opera], [orchestra], [party], [piano], [polka], [pop], [pop-rock], [post-hardcore], [punk rock], [r&b], [r&b & soul], [rap], [reggae], [rock], [romantic], [soul], [soundrack cinematic], [synth pop], [synth], [techno], [trap], [violin], [1920s], [1940s], [1980s]Эти теги можно использовать для задания стилей, жанров и манеры инструментальных вставок. Исторически сложилось, что двигатели, которые использует сервис (Bark, Chirp) понимают не только структурные теги наподобие [genre], но и такие вот способы задать параметры: "один тег, один жанр". Примеров использования не привожу, поскольку они или совпадают с указанным слова, или подсказываются вашим воображением. Обратите внимание на способ задать "музыкальную эпоху", на которую нужно ориентироваться ([1920s] - двадцатые годы двадцатого века).
 

Пример к уроку 1

Обратите внимание, что поле "Style of Music" пусто, всё определение песни задано в "Lyrics".

Пример к уроку 1: блюз

Поле "Lyrics"

[genre:blues] [mood:sentimental] [tempo:slow] [instruments:guitar, harmonica, piano] [vocals:melodic]

[verse]
I wandered the streets, my heart so torn,  
A melody of love that's weathered and worn.  
Your name's like the wind, soft but so strong,  
And I hum to myself a forgotten song.  

[chorus]
Oh, love, you're the light in the storm,  
A warmth in my heart that keeps me warm.  
Though time may fade and skies may dim,  
You're the song in my soul, my sweetest hymn.  

[verse]
The rain hits the window, a sad serenade,  
Dreams of you linger, they never will fade.  
The blues on my strings tell of nights so cold,  
But your love is the treasure, more precious than gold.  

[chorus]
Oh, love, you're the light in the storm,  
A warmth in my heart that keeps me warm.  
Though time may fade and skies may dim,  
You're the song in my soul, my sweetest hymn.  

[bridge]
Lorem ipsum dolor sit amet,  
Consectetur adipiscing elit.  
Vestibulum in nulla vitae nisi feugiat,  
A fleeting moment I won't forget.  

[interlude]
[instrumental harmonica solo]

[chorus]
Oh, love, you're the light in the storm,  
A warmth in my heart that keeps me warm.  
Though time may fade and skies may dim,  
You're the song in my soul, my sweetest hymn.

Поле "Style of Music": пусто.

Пример #13: блюз

Вопросы и ответы

1. Есть ли возможность влиять на длину и прочие параметры секций?

Гарантированного способа указать на длину, в секундах, тех или иных секций нет. Можете попробовать добавлять в тело тегов необходимые указания на длину и стиль, например

[intro:soft ambient pads for 10 seconds]
[verse:calm melody with gentle percussion for 30 seconds]
[chorus:uplifting theme with full instrumentation for 20 seconds]

Напоминание: практически всё в сервисе обнаруживается при помощи экспериментов, официальная документация по директивам для ИИ скудная и противоречивая.

Внешние ресурсы

Suno.wiki (на английском языке): более подробная документация по составлению задания для генерирования трека.

https://civitai.com/articles/6235 (на английском языке): одно из руководств-примеров от пользователя.

https://discord.com/channels/1069381916492562582/1261146873331318835 (на английском языке): основное руководство, где описываются теги-комментарии (#intro, #genre, #mood и т.д.).

https://discord.com/channels/1069381916492562582/1267186894601584690 (на английском языке): метод шести тегов - построение запроса.

eMastered

Stable Audio v2

Soundful

===== Перейти к комментариям


 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список

Кожевенное мастерство | Сайт "Художники" | Доска об'явлений "Книги"