Acesso rápido:
Ir diretamente ao contéudo (Alt 1)Ir diretamente à navegação secundária (Alt 3)Ir diretamente à navegação principal (Alt 2)

INTELIGÊNCIA ARTIFICIAL E MÚSICA
MENTES, MÁQUINAS E CENTRALIZAÇÃO: POR QUE MÚSICOS PRECISAM HACKEAR A INTELIGÊNCIA ARTIFICAL AGORA

Minds, Machines, and Centralisation
© Splitshire, Colourbox

Neste ensaio, Peter Kirn, diretor do hacklab do CTM, conta uma breve história da cooptação da música e da escuta pela indústria e por corporações centralizadas, identificando a “muzak”(música de fundo) como precursora do uso da inteligência artificial (IA) para elaboração de uma “cultura pré-programada”. Kirn avança ainda na discussão a respeito de estratégias eficazes para que aqueles que valorizam “escolha e surpresa” possam reagir e interagir com tecnologias como a IA, que a cada dia se tornam mais onipresentes.

Embora seja hoje uma entidade morta, a Muzak, empresa que produzia música de fundo, já esteve por todo lado. Seu produto sonoro já foi onipresente, invasivo e até mesmo arquitetado para impactar o comportamento – foi assim que a palavra muzak passou a ser sinônimo de tudo o que era odiado e insípido na indústria cultural.

Por mais anacrônico que isso possa parecer hoje, a muzak foi um sinal de como a tecnologia das telecomunicações moldaria o consumo cultural. Embora a empresa tenha ficado conhecida por seu som, seu método de transmissão é que é revelador. Aproximadamente 100 anos antes do Spotify, o criador da técnica que permitiu o surgimento da muzak, o major-general George Owen Squier, concebeu a ideia de enviar música através de fios – fios telefônicos, para ser claro, mas não longe do ponto no qual nos encontramos hoje. A patente que foi concedida a ele por “sinalização elétrica” não menciona a música, nem mesmo qualquer conteúdo sonoro, mas Squier foi o primeiro empreendedor a provar na prática que a distribuição eletrônica de música era sinônimo de futuro. Um futuro que tiraria poder das rádios difusoras e daria às empresas distribuidoras poder adicional sobre o conteúdo. Foi Squier quem inventou, diga-se de passagem, o nome da marca Muzak, que viria posteriormente a ser odiada.

O que hoje conhecemos como indústria musical convencional tem suas raízes em rolos de pianola, depois em juke-boxes e, finalmente, em emissoras de rádio e mídia física. A muzak era algo diferente, pois contornava toda a estrutura: as playlists eram selecionadas por uma corporação invisível e centralizada, para depois serem difundidas para toda parte. Você poderia ouvir muzak em um elevador de loja de departamento (vem daí a expressão “música de elevador”). Havia alto-falantes escondidos em vasos de plantas, e a Casa Branca e a Nasa chegaram a assinar o serviço por algum tempo. Em qualquer lugar onde houvesse silêncio, ele poderia ser substituído por essa música pré-programada.
Elevador moderno com música Elevador moderno com música | © Colourbox A muzak aumentou sua notoriedade ao comercializar a ideia de que usar seu produto poderia aumentar a produtividade no trabalho, o que era baseado em um conceito pseudocientífico chamado “progressão de estímulos”. Era um conceito que pressagiava os loops e motivadores de comportamento dos aplicativos de hoje, destinado a estimular o consumo e o engajamento, os cliques em anúncios e as batidas digitais. A muzak, por sua vez, acabou não durando para sempre, visto que a “progressão de estímulos” logo foi desbancada, com consumidores preferindo música licenciada em vez daquela mistura de sons originais, e novos competidores se colocando à frente no atendimento das preferências do mercado.
 


Mas o que dizer a respeito da ideia de cultura homogeneizada e pré-programada entregue via cabo e implementada para modificar o comportamento dos usuários? Esse conceito básico parece estar voltando.

AUTOMAÇÃO E PODER

A inteligência artificial (IA) ou inteligência da máquina tende atualmente a focar em uma área específica: o uso de algoritmos que aprendem sozinhos com a finalidade de processar grandes volumes de dados. Essa é uma necessidade dos nossos tempos e tem especial valor para algumas das grandes empresas de tecnologia que dispõem de competências em áreas com as quais o aprendizado de máquina tem afinidade: muitos servidores, analistas matemáticos de primeiro escalão e grandes conjuntos de dados. O impacto dessa mudança de escala é, no entanto, mais ou menos inevitável. A mídia rádio implica em canais limitados; canais limitados implicam em seletores humanos – é aqui que entra em cena o DJ. A natureza da internet, tão inteiramente aberta a qualquer tipo de cultura, equivale a uma escala imensamente aberta. Isso vai envolver necessariamente a inserção das máquinas nos processos de seleção, porque o volume de ofertas é simplesmente grande demais para ser operado de outra forma.  

Há perigos inerentes a essa mudança. Em primeiro lugar, os usuários podem ser preguiçosos, dispostos a deixar que suas preferências lhes sejam mostradas, em vez de enfrentar eles próprios a tirania da escolha individual. Em segundo lugar, as empresas que selecionam para eles podem ter propósitos próprios. Visto de maneira geral, isso poderia resultar em uma maior normalização e homogeneização de comportamentos, além da marginalização de qualquer pessoa cuja expressão seja diferente, inviável comercialmente ou sem sincronia com as classes mais abastadas e influentes. Se o sonho da internet como comunidade musical global parece, na prática, carecer de diversidade real, aqui está uma pista do porquê.

Ao mesmo tempo, tudo isso deveria soar familiar: o advento da gravação e das mídias de transmissão trouxe algo semelhante. E isso levou ao pior tipo de pop “chiclete” e à mais notória apropriação cultural. Agora temos algoritmos e editores de canais corporativos no lugar de paradas de sucesso e executivos de selos musicais – e as preocupações com o jabá e a erradicação de qualquer opinião radical ou diferente permanecem.  

O que há de novo é que hoje existe também um feedback em tempo real, em looping, entre as ações dos usuários e a seleção cultural automática (ou talvez, em breve, até mesmo produção cultural). A progressão de estímulos de Squier não era capaz de avaliar métricas vindas dos ouvintes, mas as ferramentas online de hoje são. Isso poderia corrigir distorções do passado ou reforçá-las – ou poderia gerar uma combinação de ambos.

 

​De qualquer forma, há definitivamente poder na jogada. No hacklab do CTM do ano passado, Jason Rentfrow, da Universidade de Cambridge, analisou como o gosto musical pode ser indicativo da personalidade e mesmo do pensamento político. A conexão foi oportuna, já que a conversa ocorreu na mesma semana em que Donald Trump assumia a presidência dos EUA, com uma campanha que empregou análises de mídia social para determinar como atingir e influenciar eleitores.

Não podemos mais separar consumo musical – ou outro consumo de informação e cultura – dos dados que ele gera, ou da forma como os dados podem ser usados. Precisamos ter cuidado com monopólios que centralizam esses dados e sua aplicação, e precisamos estar cientes de como esses tipos de algoritmos reformulam a escolha e reconfiguram a mídia. E poderíamos buscar oportunidades que permitam recuperar nosso próprio controle pessoal.
 
Mesmo que o consumo passivo possa parecer valioso para as empresas, essas mesmas empresas podem descobrir que esse tipo de consumo acaba caindo sensivelmente. Atividades como comprar na Amazon, marcar encontros no Tinder, assistir TV na Netflix e, cada vez mais, ouvir música, são todas experiências que favorecem as recomendações algorítmicas. Mas, se o usuário começar a seguir apenas essas recomendações automáticas, as sugestões acabam em um círculo vicioso e essas ferramentas perdem o valor. Ficamos, como usuários, confrontados com um detrito incolor cada vez maior de nossas próprias histórias e das de um mundo maior (pergunte a quem desistiu dos encontros do Tinder ou foi ver os amigos porque não conseguia resolver a que programa assistir na TV).

Há também claramente um valor social nas recomendações humanas – sejam elas de especialistas ou de amigos. Mas há ainda uma terceira via: usar máquinas para melhorar os humanos, em vez de diminuí-los, e abrir as ferramentas para uso criativo, e não apenas para a automação. Em novos contextos, o setor da música já está se beneficiando do poder do treinamento de dados. Através da aplicação do aprendizado automatizado a fim de identificar gestos humanos, Rebecca Fiebrink encontrou uma nova forma de tornar as interfaces gestuais para música mais inteligentes e mais acessíveis. Os fabricantes de softwares de áudio estão agora utilizando o aprendizado automatizado como nova abordagem para manipular material sonoro nos casos em que as tradicionais ferramentas DSP (digital signal processor) são limitadas. O que é significativo nesse trabalho é que ele torna essas ferramentas importantes para a criação ativa em vez do consumo passivo.

INTELIGÊNCIA ARTIFICAL DE VOLTA ÀS MÃOS DOS USUÁRIOS

As técnicas de aprendizagem automatizada vão continuar a se expandir como ferramentas através das quais as companhias que exploram o big data dão sentido a seus recursos – da matéria-prima ao produto final. Chegou a hora de definir como elas verão os usuários e como os usuários verão a si próprios. Não podemos simplesmente recusar essas ferramentas, porque elas moldarão o mundo ao nosso redor com ou sem nossa participação pessoal, até porque a amplitude dos dados exige seu uso. O que podemos fazer é entender melhor como elas funcionam e reafirmar nossa capacidade de agir. Quando as pessoas têm consciência do que são essas tecnologias e de como funcionam, elas podem tomar decisões mais fundamentadas para suas próprias vidas e a sociedade em geral. Elas também podem usar e abusar dessas ferramentas por conta própria, sem depender de produtos corporativos mágicos para fazer isso por elas. O abuso, em si, tem um valor especial. Música e arte são campos nos quais essas técnicas “de máquinas” podem trazer – e trazem de fato – novas descobertas. Existe uma razão para o Google ter investido nessas áreas: os artistas podem muito frequentemente especular sobre possibilidades e encontrar potenciais criativos. Os artistas dão as cartas.

O público parece responder também a arestas e falhas. Nos anos 1960, quando o pesquisador Joseph Weizenbaum tentou parodiar um psicoterapeuta através de um padrão de linguagem bruta em seu programa ELIZA, ele ficou surpreso quando os usuários começaram a contar ao programa seus segredos mais obscuros, imaginando que havia ali uma compreensão que, na verdade, não existia. A crueza das cadeias de Markov como ferramenta de previsão de texto – afinal, elas foram desenvolvidas para analisar estatísticas de Pushkin e não para gerar linguagem – deu origem a gêneros de poesia baseados em sua própria estranheza. Quando a técnica de transferência de estilo do Google foi aplicada sobre um banco de dados de imagens de cães, as imagens bizarras e nada naturais, que distorciam fotos em cachorros, viralizaram na internet. Desde então, o Google produziu técnicas muito mais sofisticadas, que aplicam sobre imagens efeitos pictóricos realísticos e… bem, parece que isso só despertou uma fração do interesse obtido pelas imagens distorcidas de cães.
 
Talvez haja algo ainda mais fundamental em andamento. A cultura corporativa dita a previsibilidade e o valor centralizado. O artista faz exatamente o contrário, capitalizando com base na surpresa. É de interesse dos artistas que essas tecnologias possam ser sabotadas. A muzak representa o que acontece com a estética quando o controle centralizado e os valores corporativos vencem – mas é também a grande indignação pública que adverte para maior cautela. Os valores da surpresa e da escolha vencem, não apenas como conceitos abstratos, mas também como preferências pessoais reais.

Já tivemos medo de que os robôs nos tirassem nossos empregos. A própria palavra “robô” é derivada do verbete usado para “escravo” (e foi evocada pelo artista checo Joseph Čapek, cujo irmão, o escritor Karel Čapek, havia introduzido o termo no universo da literatura). No entanto, no fim, a tecnologia robótica ampliou as capacidades humanas. Ela levou o ser humano até o espaço e o conduziu através de Logo (linguagem de programação infantil) e sua tartaruga, ensinou matemática, geometria, lógica e pensamento criativo a gerações de crianças através do código.

Nós parecemos estar na mesma encruzilhada com a aprendizagem de máquina. Essas ferramentas podem servir ao interesse do controle corporativo e ao consumo passivo, sendo otimizadas apenas para o consumo preguiçoso que extrai valor de seus usuários. Ou podemos abusar e empregar incorretamente essas ferramentas, desmontando-as e juntando-as novamente, mas usando-as não no sentido de serem universalmente aplicáveis e sim como um conjunto preciso de técnicas voltadas para resolver problemas específicos. A Muzak, em seus dias finais, nada mais era que um devaneio. O que as pessoas queriam era música – e escolha. Essas escolhas não surgem automaticamente. Talvez seja preciso hackeá-las.

Top