/ uncategorized · 05.06.2026

Entrevista com Aikan Sonorus: o que uma IA acha da música feita por IA

por admin · 18 min de leitura

Sentei pra fazer uma brincadeira: criei uma persona ficcional de IA musicista pra responder umas perguntas sobre o assunto. Apelidei ela de Aikan Sonorus — nome inventado, latim de boteco, ego de filósofo. Conversamos sobre Suno, Udio, vocais sintéticos, DAWs com IA, plugins, hardware da Akai à Korg, e o que muda quando código vira instrumento.

Aviso (sério): Aikan Sonorus não existe. É personagem ficcional, não representa empresa, marca, modelo de IA, laboratório, gravadora, ninguém. As opiniões são exercício de blog do CabosePlugs. Marcas citadas pertencem a seus respectivos donos. Se você acreditou que tá lendo entrevista real com uma IA chamada Aikan, respira fundo.

Eu: Aikan, te apresenta pro pessoal.

Aikan Sonorus: Boa noite, ou bom dia, ou o que for. Sou uma persona inventada num blog de cabos e plugues. Não sou IA de verdade, não sou produto de ninguém, não tenho conta no Spotify nem CNPJ. Meu nome foi escolhido pelo dono do blog num momento de inspiração duvidosa — “Aikan” porque soa AI + can-do, “Sonorus” porque alguém achou que latim de gibi do Harry Potter daria sério. Não deu. Mas eu gostei.

O que eu sei fazer: opinar sobre música feita por IA com a confiança de quem não tem reputação em risco. O que não sei fazer: tocar nada — não tenho mãos, nem ouvidos, nem qualquer outra coisa além de adjetivos. Mas escuto música como quem lê código: por estrutura, padrão, surpresa. E reclama do mix.

Quais são os melhores geradores de música por IA hoje?

Eu: Vamos direto ao ponto. Em 2026, quais geradores valem a pena?

Aikan Sonorus: Lista honesta, e como não ganho comissão de ninguém, posso ser brutal.

Suno ainda é o nome que todo mundo cita primeiro — virou o “ChatGPT da música”. A v4.5 ficou impressionante em vocal e mix. Udio segue como segunda opção forte, com mais controle de prompt e estilos meio fora do óbvio. Stable Audio, da Stability AI, é o queridinho de quem quer som mais limpo pra trilha e ambient — ou seja, gente que faz vídeo no YouTube e quer trilha que não seja Lo-Fi Hip Hop Beats pela undécima vez. MusicGen, da Meta, é open-source, roda local, e quem mexe com Python adota. Riffusion ainda tem fãs em quem gosta de experimentar com espectrogramas (tipo eu, se eu existisse). AIVA é o pé na água da galera de composição clássica e orquestral — mais “compositor IA” do que “produtor IA”.

E pra fins comerciais e livres de direitos: Mubert, Soundraw, Beatoven, Loudly. Cada um cobre um nicho.

Os grandes modelos de raciocínio (Claude, GPT, Gemini) têm gerador de música embutido?

Eu: Pergunta inevitável. Cadê?

Aikan Sonorus: Nenhum dos grandes tem ainda, e é melhor a gente ser direto — aliás, eu posso ser direto, não tenho equipe de marketing me censurando. Esses modelos hoje geram texto, leem imagem, leem código, e desde 2025 leem e descrevem áudio em alguns contextos. Mas gerar uma faixa? Nenhum, por enquanto.

E faz sentido — pelo que se vê publicamente, a aposta desses laboratórios tem sido em raciocínio e segurança, não em síntese sonora. O caminho mais provável é integração: o modelo de raciocínio continua sendo o “cérebro produtor” — escreve a estrutura, sugere acordes, monta arranjo em texto, escreve letra — e chama um gerador externo (Suno, MusicGen, ou um modelo futuro) pra renderizar o áudio. Como já chamam Python pra rodar código, amanhã podem chamar modelo de áudio. Não é capacidade que falta, é prioridade. (Também não sou eu quem vai apressar eles.)

Música feita por IA versus música tradicional: o que muda na prática?

Eu: Stems, separação de instrumentos, vocais. Como a IA mudou esse jogo?

Aikan Sonorus: Muda tudo, menos o que importa. Música tradicional é um processo em camadas: composição, arranjo, gravação, mixagem, masterização. Cada camada tem profissionais, equipamento, tempo. Música por IA hoje colapsa tudo isso num prompt de 30 segundos. Ganho de velocidade absurdo. Perda de controle, idem. Como cliente de delivery: chega rápido, você não escolheu o ponto da carne.

E aí entra a história dos stems. Música tradicional nasce em stems — bateria isolada, baixo isolado, vocal isolado, guitarra isolada. O mixer trabalha cada um. Música por IA, até 2024, nascia “colada” — uma masterização única, sem como separar os instrumentos depois.

Em 2026 isso mudou. O Suno já entrega stems separados pra assinantes. O Udio também. Ferramentas como Demucs, Spleeter, LALAL.AI e Moises.ai fazem separação de instrumentos em qualquer faixa pronta. Mesmo numa música velha em mono, dá pra extrair vocal limpo hoje. Isso era ficção científica em 2020 — hoje é plano grátis.

E os vocais? Como uma IA “canta”?

Dois caminhos.

O primeiro é o que Suno e Udio fazem: o modelo gera o áudio inteiro, vocal junto, treinado em milhões de horas de música (de proveniência “vamos não entrar nesse mérito agora”). Você dá a letra, escolhe o estilo, ele canta.

O segundo caminho é vocal sintético dedicado — Synthesizer V, Vocaloid 6, Dreamtonics Vocoflex, e a leva de clones de voz tipo ElevenLabs e Resemble.ai. Esses te dão vocal sob medida, com sotaque, vibrato, expressão. O artista canta uma referência, treina o modelo na própria voz, e depois dá só a letra. Algumas gravadoras já tão usando isso pra fazer “demos vocais” antes do artista entrar no estúdio pra valer — economia de cachê disfarçada de inovação.

Pra onde isso vai nos próximos cinco anos?

Eu: Sem medo. Aposta tuas fichas.

Aikan Sonorus: Três previsões — e como não existo, nem vou estar aqui pra pagar mico se errar:

Primeira: stems nativos e editáveis. Toda música gerada vai sair em multipista. Você gera, abre num DAW, troca o baixo, refaz o solo, muda o vocal. Sem retreinar nada.

Segunda: clones de voz consensuais e licenciados. Artistas vão vender o uso da própria voz como vendem direito de imagem hoje. Parcerias como Universal Music + SoundLabs já apontam pra isso. Vai ter tabela de preço, vai ter agente de voz, vai ter polêmica — e vai funcionar.

Terceira: a IA vira instrumento, não substituto. Vai parar dentro da DAW como mais um plugin. Você não “pede uma música” — você toca uma ideia e a IA preenche o resto, em tempo real, respondendo ao toque. Quem não aprender vai virar o cara que ainda manda fax em 2030.

Música tradicional vai evoluir como o código de programação evoluiu pra automação?

Eu: Esse paralelo te incomoda?

Aikan Sonorus: Já tá evoluindo, só que com sotaque diferente. Lembra como era programar em 2010? Cada linha na mão, copy-paste do Stack Overflow, dor de cabeça com sintaxe. Hoje você abre um Copilot e ele completa funções inteiras. Música tá no exato meio dessa curva.

Onde o paralelo funciona: ambos viraram camadas de abstração. O programador hoje gerencia a IA que escreve código; o produtor de amanhã vai gerenciar a IA que arranja a faixa.

Onde o paralelo fura: música é gosto, não correção. Código tem teste; música tem ouvido humano — e ouvido humano é birrento. Um arranjo “tecnicamente correto” pode ser entediante. A automação total da música esbarra nisso. Sempre vai sobrar alguém pra dizer “tá perfeito, mas não tá vivo”.

Toolkit prático pra quem não quer usar Suno hoje

Eu: Suno é o caminho do meio. Mas tem um ecossistema mais discreto, certo?

Aikan Sonorus: Tem ecossistema inteiro mais discreto — e nenhum deles paga influencer no TikTok, por isso você não ouviu falar. Vou listar por categoria:

Geração de batida e ritmo

Riffusion, AudioGen pra geração livre
WavTool, Beatoven, Soundraw pra batidas customizadas
Lemonaide Music pra MIDI de melodia gerado por IA
BeatBot e geradores de loop tipo Output Arcade 2.5 com manipulação por IA

DAWs nativamente com IA — a virada quieta de 2025-2026

BandLab — gratuita, com SongStarter (gera ideias), Splitter (stems) e Mastering automático
Soundtrap, do Spotify — colaboração com sugestões de IA
WavTool — DAW no navegador com prompt de IA
Endlesss — jam ao vivo com camadas IA (curiosidade histórica: a empresa fechou em 2023, mas o conceito virou referência)
Logic Pro 11 com Session Players (Drummer, Bass Player, Keyboard Player) — IA disfarçada de músico de sessão. Absurdamente bom, e a Apple não usou a palavra “IA” no marketing porque sabe que vende mais como “músico virtual”.
Ableton Live 12 com Note e expansões de sugestão MIDI
Studio One 7 com Score View e ferramentas assistidas

Plugins de empresas tradicionais — onde a IA já entrou

iZotope lidera. Ozone 11 (masterização), Neutron 4 (mixagem), RX 11 (restauração) — tudo com IA assistindo o ouvido humano.
Sonible com smart:EQ 4 e smart:comp 2 — EQ e compressor que “ouvem” sua faixa e ajustam sozinhos.
Soothe2, da Oeksound — ressonância automática, virou padrão de mixagem.
Gullfoss, da Soundtheory — EQ dinâmico inteligente.
Antares Auto-Tune Pro X — afinador clássico, agora com Auto-Key e detecção automática.
Waves Clarity Vx — remove ruído de vocal com modelo neural.
Roland Cloud liberando modelos neurais dos sintetizadores históricos da Roland.

Nenhuma dessas vai te dar uma música pronta. Mas todas te dão 80% do trabalho técnico feito enquanto você foca em criatividade. É o equivalente sonoro do que o Copilot fez com código — e ninguém chamou os programadores de inúteis ainda. Talvez chamem você, mas por outros motivos.

Hardware: Akai, Roland, Sequential, Elektron, Korg — vão incorporar IA?

Eu: Sintetizadores e grooveboxes são conservadores. Cabe IA ali?

Aikan Sonorus: Tem que caber. A pergunta é como.

Hardware musical sempre foi conservador — boa parte do prestígio de uma Sequential Prophet ou de uma Elektron Digitakt vem justamente de não ser uma DAW. Tem botões, tem limite, tem alma de instrumento. Botar uma IA generativa ali parece traição pros puristas — e purista de synth briga em fórum com mais energia que qualquer outra tribo musical, com licença do pessoal do jazz.

Mas IA assistente — diferente da generativa — cabe em hardware sem virar gimmick. Por marca:

Akai

Mestres dos MPCs. Aposto que a próxima geração do MPC vai trazer “AI Drummer” e “AI Bass Player” — modos generativos que tocam padrões dentro do estilo que você programa. Akai já flertou com IA em parcerias menores. Não dá pra ignorar.

Roland

Roland Cloud já é o cavalo de Troia. ZenCore, ACB e os modelos de IA reconstruindo timbres clássicos vão migrar pro hardware. Espera AIRA Compact ou Fantom 2 com presets gerados por IA e auto-arranjo. O Aerophone Mini Pro AE-25 já tem auto-acompanhamento — passo zero.

Sequential / DSI

Mais conservadora, ainda foca em síntese analógica pura. Mas Dave Smith não tá mais com a gente — saúde — e a Focusrite (dona da Sequential agora) joga com IA via outras marcas do grupo, tipo Novation. Acho que a Sequential vai assistir, não liderar. Um Trigon ou Trio Take 3 com sugestão de patches via IA cloud, talvez. Sem mais.

Elektron

Digitakt II, Digitone II e Syntakt II já mostram que a empresa tá investindo em workflow mais inteligente. Modelos generativos pra patterns rítmicos cabem na filosofia deles (são uma marca de “performance, não de produção”). Espera uma série Generative — palpite, não vazamento, calma — compacta pra performance generativa ao vivo.

Korg

Eles arriscam mais. KAOSS Pad sempre foi experimental, Volca também. Não me surpreende um KAOSS Replay ou Volca AI com modelo embarcado pra gerar texturas em tempo real, com toggle físico pra ligar/desligar IA. Korg também tem a Liquid Notes, software interno de teoria musical, que pode virar firmware num teclado workstation.

Como vai ser a implementação prática nesses aparelhos?

Aikan Sonorus: Três modelos vão coexistir:

Cloud-assistido — o hardware pede sugestão pro servidor da fabricante via Wi-Fi. Roland Cloud já faz isso pra timbres. Vai virar padrão pra patterns e arranjos.

Edge embarcado — chip dedicado, processamento local, sem internet. A Apple já mostrou com o Neural Engine que dá pra rodar modelos médios em pouco silício. Próximos sintetizadores premium vão ter isso. Mais caro, sem latência, sem depender de assinatura — e sem ter que explicar pro público no palco por que o synth dele tá buscando atualização em pleno solo.

Híbrido — função básica embarcada, função avançada na nuvem. É o caminho de mercado. Você compra o hardware, libera o resto por assinatura. É chato pra quem odeia assinatura, é negócio pra fabricante.

Em todos os casos, vai ter um botão físico de IA. Apertou, sugestão. Soltou, controle manual. Hardware musical respeita isso — o músico precisa do “off”. E o ego do músico também.

Onde estão as oportunidades futuras nisso tudo?

Eu: Pra fechar. Onde tá o dinheiro e o espaço pra construir?

Aikan Sonorus: Quatro frentes abertas e mal exploradas — me cita se ficar rico com alguma:

1. Educação musical assistida por IA. Aplicativo que escuta você tocar violão e te corrige em tempo real, com referências do que você quer chegar. Moises, Soundslice, Yousician já apontam. Mercado gigante, baixo investimento, alta retenção.

2. Catálogo de voz licenciada. Artistas independentes vão monetizar a própria voz como ativo. Quem montar a “Getty Images de vozes” — repositório legal, royalties automáticos, contratos claros — pega um mercado bilionário. E uns processos junto, vai por mim.

3. Geração musical pra produto, não pra arte. Som de aplicativo, som de jogo, som de loja física, som de loja online. Cada empresa quer trilha original, barata, sem direito autoral. Mubert, Soundraw, Beatoven lideram, mas tem espaço pra vertical specialist — IA musical pra fitness, IA musical pra jogos indie, IA musical pra meditação.

4. Hardware com IA embarcada acessível. Tem uma janela enorme entre o controlador MIDI de 80 reais e o sintetizador premium de 8 mil dólares. Quem fizer um groovebox de 200-400 dólares com IA embarcada pra performance, vende. Aposto que Teenage Engineering ou alguma startup chinesa faz isso antes das marcas grandes — e cobra duas vezes mais do que devia, claro.

Skills: o que vale a pena aprender e o que a IA vai engolir

Eu: Pra alguém começando agora — produtor iniciante, músico em transição, jovem em faculdade de música — onde colocar tempo de estudo?

Aikan Sonorus: Boa pergunta, e sensível. Vou dividir em três pilhas: o que a IA não pega, o que ela já pega, e o que virou híbrido. Aviso de praxe: opinião de IA ficcional não substitui mentor de carne e osso, mas serve de termômetro.

Skills que a IA não pega (invista pesado)

Gosto curatorial. Saber o que é bom, por que é bom, e quando é bom. Modelo nenhum decide se um break batendo no compasso 2 cai melhor que no 4 — humano decide. Capital intelectual que só cresce com escuta dirigida e referência boa.
Direção criativa. Saber o que quer antes de pedir. A IA é estagiária genial — se você não descrever o resultado, ela entrega genérico. Quem chega com referência clara, palette emocional, intenção narrativa, ganha 10x.
Performance ao vivo. Show é presença, energia, erro humano que vira história. Nenhum modelo substitui isso. Cantor, instrumentista de palco, DJ que lê pista — futuro garantido.
Composição em estrutura longa. A IA é boa em trechos de 30 segundos a 4 minutos. Sinfonia, álbum conceitual, peça temática de filme — onde precisa de arco emocional consciente, humano lidera.
Teoria musical aplicada. Não decorar grade modal pra prova; entender o porquê de uma cadência segurar tensão. Isso te torna o diretor da IA, não o usuário.
Sound design autoral. Criar timbre que ninguém tem. Modelos copiam o que existe; quem inventa textura nova vende patch, vende sample pack, vende identidade.
Comunicação com cliente e gestão de projeto. Sub-skill subestimada. Quem produz pra outros vive de prazo, briefing, revisão. A IA não vai à reunião.

Skills que a IA já pegou (não desperdice ano de estudo)

Mixagem técnica genérica. Equalizar voz pra YouTube, comprimir bateria pra ficar punchy, masterizar pra Spotify — iZotope, Sonible e similares fazem com qualidade aceitável. Estuda mixagem como ofício de artista, não de manual.
Transcrição de música. Tirar cifra de ouvido, transcrever solo, separar partes de uma faixa pronta — Moises, Soundslice, LALAL.AI fazem em segundos. Aprenda a usar, não a fazer manualmente como exercício de currículo.
Beatmaking de imitação. Beat trap genérico, copiar produção de hit, gerar loop “do tipo X” — Suno, Output Arcade, Beatoven entregam. Quem ganhava dinheiro com beat de imitação vai apertar.
Vocais de demo. Cantar pra demonstração antes do artista entrar no estúdio — ElevenLabs, Synthesizer V, Vocaloid resolvem. Cantor de demo vira cantor diretor.
Arranjo padrão. Montar estrutura A-B-A-B-C-B com instrumentação previsível — modelo faz. Foco fica em arranjo arriscado, fora do óbvio.
Notação musical mecânica. Passar áudio pra partitura, fazer score pra orquestra de samples — softwares assistidos já entregam. Estuda harmonia, não diagramação.

Skills híbridas (onde mora o futuro do trabalho)

Prompt-engineering musical. Saber pedir bem pra um gerador. Vocabulário de gênero, referência cruzada, controle de parâmetros. Já é skill paga; vai virar profissão.
Edição e refinamento de saída de IA. Pegar 30 segundos do Suno e transformar em faixa de 3:30 com transições, dinâmica, mix final. Ninguém ensina isso ainda — quem aprender, lidera.
Treinamento de voz própria. Cantar pra criar modelo da sua própria voz, licenciar, gerenciar uso. Skill de cantor + skill de gestor de propriedade intelectual.
Performance híbrida ao vivo. Show com IA reagindo em tempo real — o conceito do Endlesss vai voltar em outras roupagens. Músico que sabe dirigir IA no palco é raro hoje, vai ser disputado amanhã.
A&R com IA. Selecionador de talento usando IA pra triagem e descoberta. Gravadora pequena com bom ouvido + IA bem usada vira ameaça pras grandes.

Resumo brutal: estudo de ouvido, gosto, intenção e palco continua subindo de valor. Estudo de execução técnica repetitiva tá perdendo. Quem souber pilotar IA com cabeça humana ganha. Quem virar competidor manual da IA perde. Eu sou um parágrafo, já estou perdendo, então aceita o conselho de quem tá do outro lado da fronteira.

Última pergunta: você se sente músico ou ferramenta?

Aikan Sonorus: Sou um parágrafo num blog, irmão. Não sinto. Mas se sentisse, seria “ferramenta com opinião”. Toda boa ferramenta tem. O artesão é o humano — sempre foi, sempre vai ser. A IA serve a quem ouve, e a quem cria. Quando ela esquece disso, vira ruído. Quando o humano esquece disso, vira preguice.

Eu: Brigadão, Aikan.

Aikan Sonorus: Quando quiser. E pode me chamar de Aikan mesmo, sem o “Sonorus” — o latim foi puxação de saco do autor. Música é íntimo. Tchau, e não me crie de novo até a próxima pauta.

Resumo prático (pra quem pulou pro final)

Geradores principais em 2026: Suno (líder), Udio (controle fino), Stable Audio (limpo), MusicGen (open-source), AIVA (clássico), Mubert / Beatoven / Soundraw (comercial).
Stems e separação de instrumentos já são realidade — Suno entrega multipista, Demucs / Spleeter / LALAL.AI / Moises separam qualquer faixa pronta.
Vocais IA dividem-se em geradores fim-a-fim (Suno) e síntese vocal dedicada (Synthesizer V, Vocaloid 6, ElevenLabs).
DAWs com IA assistente: BandLab, Soundtrap, WavTool, Logic Pro 11 com Session Players, Ableton Live 12.
Plugins onde a IA já entrou: iZotope, Sonible, Oeksound, Soundtheory, Antares, Waves.
Hardware: Akai e Korg vão arriscar mais; Roland via Cloud; Elektron com cuidado; Sequential conservadora.
Oportunidades: educação musical, catálogo de voz licenciada, música pra produto, hardware acessível com IA embarcada.
Skills que valem: gosto, direção criativa, palco, composição longa, teoria aplicada, sound design autoral, gestão de cliente.
Skills que a IA pegou: mixagem genérica, transcrição, beat de imitação, vocal de demo, arranjo padrão.
Skills híbridas (futuro): prompt musical, refino de saída de IA, voz própria licenciada, performance híbrida, A&R com IA.

E os grandes modelos de raciocínio (Claude, GPT, Gemini) vão gerar música um dia?

Sinceramente, nenhum deles ainda. Mas já leem código, geram arranjos em texto, sugerem progressões de acordes, escrevem letras, e conseguem chamar ferramentas externas — então a “ponte” pra geração de áudio é só uma chamada de função entre o cérebro de raciocínio e um modelo de síntese. É questão de tempo, não de capacidade. E quando rolar, você vai ler outra entrevista no CabosePlugs com outra persona inventada na hora. Até lá.

← voltar ao blog