Monitoramento de Home Studio Sem Gastar Muito
Por David Payette · engenheiro de áudio, músico profissional · Sobre →
Por que monitores caros não são o único caminho
Alguns dos discos com melhor som já feitos foram mixados em caixas terríveis.
Os Beatles gravaram a maior parte de Abbey Road em um sistema que envergonharia um produtor caseiro contemporâneo. As Yamaha NS-10M — os monitores de campo próximo que se tornaram o padrão em estúdios profissionais ao longo dos anos 1980 e 1990 — são notoriamente ásperas, cansativas e com poucos graves. Os engenheiros as usavam não porque soavam bem, mas porque soavam igual ao que a maioria das pessoas ouvia em casa. Aja, do Steely Dan, amplamente citado como um dos discos melhor engenheirados do pop, foi checado obsessivamente em reprodução de qualidade de consumo durante todo o processo de mixagem.
O insight que esses engenheiros aplicavam é que o papel de um monitor não é soar bonito. É dizer a verdade sobre o mix. E "verdade" só importa se prevê como o mix soará em outro lugar.
É aqui que muitos produtores caseiros travam. A ansiedade é compreensível: você está trabalhando com fones de $80 ou monitores de médio porte em uma sala sem tratamento, e assume que o problema é o equipamento. Gaste $1.200 em monitores e os mixes finalmente vão traduzir.
Às vezes isso é verdade. Mas, na maioria das vezes, o problema é que você está monitorando apenas em uma coisa. Um mix que sobrevive a dez sistemas de reprodução diferentes foi verificado em dez sistemas de reprodução diferentes. Não há atalho para isso.
Tradução é o trabalho — e setups econômicos podem vencer aqui
Tradução é a palavra que os engenheiros usam para um mix que se sustenta em dispositivos diferentes. Um mix que soa como um disco finalizado em fones de $15, no carro, no alto-falante do celular e nos monitores de estúdio é um mix bem traduzido. Um mix que soa incrível nos monitores mas desmorona nos AirPods não é.
Para um produtor caseiro, tradução é na verdade o problema mais tratável. Você provavelmente não tem uma sala com tratamento, provavelmente não tem monitores de referência e provavelmente não pode comprá-los agora. Essas são limitações reais. Mas você quase certamente tem vários dispositivos de reprodução ao seu alcance. O iPhone. Os AirPods. O laptop. Talvez uma caixa Bluetooth na cozinha. Esses dispositivos são o seu equipamento de tradução — e já estão pagos.
O fluxo de trabalho tradicional para verificar tradução em dispositivos de consumo é assim: finalize uma seção, faça bounce de um rough mix, AirDrop para o celular, ouça, volte para o DAW, faça ajustes, bounce de novo. Repita. Cada iteração custa de dois a cinco minutos e quebra a concentração.
O Auxfeed elimina esse loop. Em vez de fazer bounce e transferir, você mantém o DAW rodando e transmite o barramento de mix ao vivo para todos os dispositivos que possui — simultaneamente, em tempo real, via Wi-Fi. O áudio saindo da interface é o mesmo áudio que toca no celular, no iPad ou no que estiver conectado. Você faz um ajuste de nível no barramento de mix e ouve no alto-falante do celular antes de a mão sair do fader.
Isso muda o que é realmente possível em um setup econômico. Você não está mais limitado pelos monitores — está limitado por quantos dispositivos você verifica e com que frequência os verifica. Com streaming ao vivo, a resposta para ambos é "quantos quiser" e "constantemente".
A hierarquia de monitoramento realista
Aqui está um detalhamento honesto das opções de monitoramento em vários preços, com uma imagem clara do que cada uma realmente oferece.
Monitores de estúdio ($200–$2.000+)
O padrão profissional por uma razão. Um monitor de estúdio bem projetado em uma sala com tratamento dá uma imagem plana e precisa do mix. Mas a sala não é opcional — é a metade maior da equação. Bass traps nos cantos e um painel na posição de primeira reflexão farão mais pela precisão do que dobrar o orçamento de caixas.
Fones de estúdio ($80–$400)
Fones removem a sala completamente. Fones fechados (Sony MDR-7506, Audio-Technica ATH-M50x) são ideais para gravação. Fones abertos (Sennheiser HD 600 series, Beyerdynamic DT 990) dão uma imagem estéreo mais ampla para referência de mixagem. A percepção de baixa frequência em fones é pouco confiável — use-os como uma referência, não como a única.
In-ears de consumo — AirPods, Samsung Galaxy Buds, fones com fio ($0–$250)
Onde aproximadamente 70% da escuta de música acontece, e a referência que a maioria dos produtores caseiros negligencia. AirPods aplicam processamento espacial que altera a largura estéreo e têm uma curva EQ pronunciada de consumo. Se o mix soa certo nos fones de estúdio mas fino e muito aberto nos AirPods, os ouvintes estão ouvindo a versão dos AirPods.
Alto-falante do celular — iPhone, Android ($0)
Mono. Com pouco grave. Onde mais de 20% da escuta casual acontece, especialmente para conteúdo curto no TikTok e Reels do Instagram. O kick e o grave vão comprimir ou desaparecer. Se a faixa não sobrevive ao alto-falante do celular, essa é uma verificação não negociável, e não custa nada.
Alto-falantes do laptop ($0)
Terríveis de um jeito tecnicamente útil. Quase sem grave, uma faixa média estreita e em caixa, sem separação estéreo. Representam uma grande fatia do comportamento de escuta em segundo plano. Se o mix soa sem vida aqui, isso é informação importante.
Som do carro e caixas Bluetooth portáteis ($0–$200)
Sistemas de carro tendem a ter médio-grave forte e frequentemente recebidos em mono. Caixas Bluetooth colapsam a largura estéreo. Se o mix se sustenta no caminho para o trabalho, ele se sustenta.
Por que o Auxfeed resolve isso em 30 segundos
Cada dispositivo listado acima já faz parte da sua vida. O problema de fluxo de trabalho era que verificar todos eles era lento demais para fazer habitualmente. Fazer bounce de um arquivo, transferi-lo, carregá-lo, ouvir, voltar, ajustar, repetir.
O Auxfeed substitui isso por um plugin de DAW e um app gratuito para iOS ou Android. Instale o plugin, abra-o no barramento de mix e ele começa a servir o áudio como stream. Abra o Auxfeed no celular e conecte. A partir daí, o celular é um monitor ao vivo — não um dispositivo de reprodução para arquivos exportados, mas um receptor em tempo real para o que o DAW está produzindo agora.
Você ajusta o nível dos vocais. O celular ouve antes de a mão sair do fader. O loop de feedback que costumava levar cinco minutos leva zero segundos.
O plugin funciona no Pro Tools, Logic Pro, Ableton, REAPER, Cubase, Studio One, FL Studio e Bitwig no Mac e Windows. AirPlay é suportado, então você pode rotear para um HomePod, Apple TV ou qualquer caixa AirPlay na mesma rede Wi-Fi. A latência em uma conexão Wi-Fi doméstica típica fica abaixo de 20 ms.
O teste de tradução em 4 dispositivos
Aqui está um fluxo de trabalho prático que você pode usar em qualquer sessão de mixagem, usando apenas dispositivos que você já possui e o Auxfeed rodando em segundo plano.
Comece no sistema de monitoramento principal. O que você tiver — monitores, fones de estúdio, o que for. Leve o mix a um ponto onde parece certo nesse sistema. Acerte os níveis, consiga o balanço.
Troque para o alto-falante do celular via Auxfeed. Ouça por trinta segundos. O kick drum ainda ancora a faixa ou sumiu? O vocal está claramente inteligível? Os alto-falantes de celular têm quase nenhum grave e exageram o médio-alto. Se o vocal desaparece, provavelmente estava sendo sustentado pela sala ou pelo vazamento dos fones. Se o grave soa desproporcionalmente presente, há sub-grave excessivo para tradução.
Troque para AirPods ou fones de consumo via Auxfeed. Esta é a verificação da imagem estéreo. Fones de consumo aplicam processamento que estreita ou altera a largura estéreo. Se elementos que soavam centralizados nos monitores agora estão difusos, há um problema de tradução. Também ouça os fins de reverb — reverb que parece controlado em um mix estéreo amplo pode ficar turvo em in-ears.
Troque para o laptop via AirPlay. Os alto-falantes do laptop revelam o esqueleto de médio do mix. O que sobra quando você remove todo o grave? Algo está áspero ou em caixa? Um mix que soa monótono nos alto-falantes do laptop soará monótono para a parcela significativa de ouvintes que tocam música no laptop em segundo plano.
Bônus: AirPlay para uma caixa Bluetooth, ou use o modo relay do Auxfeed Pro no CarPlay. Se o grave parece enorme no carro, há excesso de 100–200 Hz em relação às frequências sub. Se desaparece, você está dependendo de sub-grave que os sistemas de carro não reproduzem.
Trabalhe por essa hierarquia, faça ajustes e execute novamente. Uma vez que você tenha passado por todas as quatro verificações e o mix sobreviver a elas, você fez o trabalho de tradução. Isso é verdade independentemente do custo dos monitores principais.
Falhas de tradução comuns em home studios
Estes são os problemas que aparecem consistentemente quando produtores trabalham exclusivamente em um dispositivo. Não são problemas de talento — são problemas de perspectiva, e desaparecem assim que você começa a verificar múltiplos sistemas regularmente.
Sub-grave excessivo. É o mais comum. Fones e muitos monitores de estúdio reproduzem frequências sub de maneiras que alto-falantes de celular e de laptop simplesmente não reproduzem. Um mix que parece potente e profundo nos fones se traduz como um kick fraco sem corpo no celular. A solução é verificar o balanço dos graves no alto-falante do celular cedo e com frequência, não apenas no final.
Vocal alto demais nos fones, baixo demais nos monitores. O reverb de sala é enganoso. Em um espaço sem tratamento, reflexões iniciais se acumulam na posição de mixagem e adicionam ambiência artificial a tudo — incluindo o vocal. O que parece presente nos monitores pode desaparecer em uma sala seca ou ao ouvir pelos fones. Os fones têm o problema oposto: podem fazer um vocal parecer íntimo e próximo mesmo quando está relativamente baixo no mix. Verifique o nível do vocal nos alto-falantes do celular, onde não há sala e não há efeito de proximidade dos fones.
Fins de reverb destroem a clareza no alto-falante do celular. Reverb invisível nos monitores se torna lama em um driver de celular de três polegadas. Caudas longas e sons de ambiente densos consomem a clareza do mix em tamanhos pequenos de caixas. Se a verificação no alto-falante do celular parece que tudo está flutuando, reduza a profundidade do reverb e encurte as caudas.
Largura estéreo parece ampla nos monitores, estreita nos AirPods. Fones de consumo aplicam processamento de sinal que interage com a largura estéreo de formas imprevisíveis. Mixes que parecem expansivos e abertos no estúdio podem parecer apertados e estreitos em dispositivos de consumo. Alternativamente, mixes muito amplos podem colapsar para mono de forma que expõe problemas de fase. Verifique a largura em dispositivos de consumo reais, não apenas em um medidor de correlação.
Quando investir de fato em monitores bons
Mais tarde do que você pensa, e apenas depois de tratar a sala.
Um monitor de estúdio converte um sinal elétrico em ondas sonoras, e então a sala assume. Frequências de grave se acumulam nos cantos. Reflexões iniciais de superfícies sem tratamento borram a imagem estéreo. Um monitor de $2.000 em um quarto sem tratamento vai dar informações piores do que um monitor de $300 com tratamento básico.
A sequência: tratamento acústico primeiro, upgrade de monitor segundo. Bass traps nos cantos, um painel de absorção de banda larga nas primeiras reflexões em cada parede lateral e um painel atrás da posição de mixagem. Um tratamento significativo custa $200–$400 em materiais e transformará mesmo caixas modestas.
Quando estiver pronto para fazer upgrade, alguns pontos de partida confiáveis: as Yamaha HS5 e HS7 conquistaram seu lugar como referências confiáveis para salas pequenas. A Adam Audio T5V é bem considerada pelo preço. A Focal Alpha 50 Evo recompensa um tratamento adequado. Estas não são escolhas afiliadas — simplesmente aparecem consistentemente em estúdios em operação nessa faixa.
A sala é o monitor. Não faça upgrade nas caixas antes de tratar a sala.
FAQ
Dá mesmo para mixar nos AirPods?
Não como única referência, não — mas como um ponto em um fluxo de tradução, com certeza. AirPods têm uma curva EQ de consumo não plana e aplicam processamento de áudio espacial que altera a percepção da largura estéreo. Não são substitutos de um monitor plano, mas são uma excelente verificação de como o mix soará para a maioria dos ouvintes. O fluxo é: mixar no sistema principal, verificar tradução nos AirPods (e alto-falantes do celular, e alto-falantes do laptop). Use os AirPods como diagnóstico, não como superfície de mixagem.
Preciso de uma interface de áudio?
Para trabalho sério de mixagem, sim — uma interface de áudio dá saída analógica limpa, amplificação de fone adequada e monitoramento em níveis reais. No mínimo, uma interface de entrada como a Focusrite Scarlett Solo ($120) vale a pena. Dito isso, o Auxfeed também funciona com a saída de áudio integrada, então o fluxo de tradução não requer uma interface para ser útil.
Qual é o setup mais barato possível?
DAW em um laptop com saída de áudio integrada, plugin Auxfeed gratuito, app Auxfeed iOS ou Android gratuito em um celular que você já possui. É um setup de zero custo adicional que ainda dá o fluxo de tradução em múltiplos dispositivos. Você não está mixando em uma referência plana, mas está verificando a tradução em dispositivos de consumo reais em tempo real, o que é mais do que a maioria dos produtores em home studio faz.
O Auxfeed funciona em um laptop de 5 anos?
Na maioria dos casos, sim. O plugin do Auxfeed tem um pequeno consumo de CPU — está fazendo streaming de áudio, não processando. Um Mac ou PC Windows de 2020 ou posterior vai rodar o plugin sem problema. O principal requisito é que o laptop e o celular estejam na mesma rede Wi-Fi para streaming na rede local. Se quiser monitorar pela internet (ou via CarPlay), esse é um recurso do Auxfeed Pro.
Guias relacionados
- Mixando nos AirPods
- Por que o mix soa mal nos alto-falantes do celular
- Use o celular como monitor de estúdio
O Auxfeed é grátis. Instale e verifique o mix em todos os dispositivos que você possui em tempo real.