Технологии, основанные на нейронных сетях, значительно продвинулись за последние годы, и теперь даже легкодоступные инструменты демонстрируют впечатляющие результаты, такие как этот трек, построенный на лексике Эминема, его стиле и интонациях.

Для создания эмуляции текстовых и музыкальных особенностей Маршалла авторы YouTube-канала Calamity AI начали с повествования трека. Они использовали текстовый генератор GPT-3, работающий на генераторе ShortRead, и ввели такой запрос: “Дисс Марка Цукерберга в стиле Эминема”. Полученный текст был отправлен на YouTube-канал 30 Hertz, на котором публикуются эмуляции голосов, в том числе голосов Эминема и Тупака. Для вокализации дисса на Цукерберга была использована архитектура нейронной сети Tacotron 2 для синтеза речи непосредственно из текста.

Текст этого дисса не идет ни в какое сравнение с любым текстом Эминема, машина не в состоянии приблизиться к уровню его игры слов и пластов смысла. Но текст последователен и упорен в нагромождении оскорблений, какими бы смехотворно сюрреалистичными эти оскорбления ни казались. Нейронная сеть использовала слово “тупой” так много раз, что трек звучал почти как хит 6ixty9ine.

Эмуляция голоса, однако, звучала более убедительно, выдавая узнаваемую раннюю интонацию Слима Шейди. Этот эксперимент был отмечен в СМИ в основном из-за объекта дисса, но вы можете сравнить упражнение Calamity AI в оскорблении Цукерберга с тем, что обычно делает 30 Hertz ниже:

30 Hertz