Топ 5 необычных применений коммерческого синтеза речи на AI

Поговорим о спорных продуктах и сервисах, обсудим влияние на нашу жизнь и работу. Опираясь на материал The Verge о коммерческом использовании дипфейков и синтеза аудио контента, мы хотим раскрыть интересные применения этих технологий сегодня.

? Стартап Veritone (https://www.veritone.com) позволяет инфлюэнесерам и актерам продавать лицензии на голосовые дипфейки и получать рекламные гонорары, не выходя из дома. Знаменитости могут продавать права на использование своих цифровых клонов — и получать дивиденды: этим уже воспользовался Брюс Уиллис. В будущем, когда игровые движки типа «Unreal Engine», разовьются еще больше (кстати, сериал «Мандалорец» делали с применением этого движка), можно будет «снимать» фильмы с digital-копиями популярных актеров. Хотя уже сейчас игровая индустрия по доходам обогнала кино, так что «будем посмотреть», куда именно кривая выведет. Но бесспорно одно: знаменитости захотят увеличить свой доход с минимальными усилиями за счет клонирования и сдачи в аренду своих голосов. 

? Сервис звукомонтажа Descript (https://www.descript.com) предлагает авторам подкастов “клонировать” свой голос, чтобы в процессе монтажа команда могла вносить правки в речь говорящего без надобности в перезаписи. Реально топовая штука, запаривает переписывать по «100500» раз.

? Компания Sonantic (https://www.sonantic.io) специализируется на озвучке видеоигр и предлагает no-code платформу для генерации аудиоклонов — это Tilda, только для создания дипфейков. Недавно команда создала аудиодипфейк Вэла Килмера — актер потерял голос после того, как перенес рак горла. Вот тут пробивает на слезу. Жизнь коротка, рак неумолим, но технологии подкрались с другой стороны.

? Другой популярный сценарий применения этой технологии — это дубляж видео с помощью голосовых синтезаторов. Например, можно озвучить видео на китайском своим голосом.

? Возникают этические вопросы — (https://t.me/use_ruki/1800) вот пример с документальным кино о шеф-поваре и телеведущем Энтони Бурдене: его создатели использовали ИИ, чтобы озвучить голосом Бурдена часть личной переписки. Как вы считаете это этично?

? А помните, в TikTok одно время начали использовать функцию автоматической озвучки? Оказалось (https://www.refinery29.com/en-us/2021/05/10490815/tiktok-text-to-speech-voice-change-lawsuit), что синтезированный женский голос на самом деле принадлежит реальному человеку — актрисе озвучки Бев Стэндинг, которая когда-то сотрудничала с Китайским институтом акустики (и она подала на TikTok в суд).

Десятки стартапов уже предлагают аналогичные услуги. Просто погуглите «Синтез речи AI» или «Deepfakes AI voice», и вы увидите, насколько банальна эта технология, которую можно приобрести в специализированных магазинах, специализирующихся только на синтезе речи, таких как Resemble.AI и Respeecher, а также интегрированных в компании с более крупными платформы, такие как Veritone (где технология является частью ее рекламного репертуара) и Descript (которая использует ее в своем программном обеспечении для редактирования подкастов).

? Есть и потенциальные опасности. Мошенники уже использовали голосовые клоны, чтобы обманом заставить компании и простых пользователей переводить деньги на их счета, но и другие виды злонамеренного использования, безусловно, скрываются за горизонтом.

Оставить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

5 × пять =