Vivemos uma era de abundância extrema no entretenimento digital. São mais de 800 milhões de horas de vídeo disponíveis online — um verdadeiro oceano de opções. Mas essa fartura traz um desafio crítico: o tempo que o usuário leva para encontrar algo que realmente lhe interesse. Segundo Igor Macaubas, diretor de produto e engenharia da Globo e coordenador do painel “Além da recomendação: Como a IA generativa está criando universos personalizados no streaming” na SET Expo 2025, se um usuário demora mais de seis minutos para decidir o que assistir, a chance de ele abandonar a plataforma salta para 70% a 80%. Essa frustração representa uma quebra de engajamento que não pode ser ignorada.

A evolução dos algoritmos de recomendação foi um marco importante, mas já não basta. O próximo salto está em ir além da sugestão de conteúdo — é preciso criar experiências únicas e personalizadas para cada espectador. E a grande pergunta é: como apresentar um mesmo filme ou série de maneiras diferentes? Como gerar dinamicamente teasers, trailers ou artes promocionais que se conectem com o indivíduo, levando em conta seus gostos, humor e contexto?
É nesse cenário que a Inteligência Artificial Generativa surge não como uma melhoria, mas como revolução. Ela permite que a interface e a apresentação do conteúdo se moldem ao espectador, transformando a descoberta em uma experiência relevante e envolvente.

Soumonos Mukherjee, líder de engenharia da indiana Mediagenix, destaca como a IA está impulsionando os sistemas de recomendação. Muitos usuários enfrentam dificuldades para escolher o que assistir, mesmo diante de catálogos vastos. Com algoritmos mais sofisticados, não se trata apenas de sugerir conteúdos similares, mas de criar experiências sob medida. Para isso, sistemas avançados de compreensão de vídeo analisam imagens, falas, textos e até emoções, organizando e contextualizando o conteúdo de forma inteligente. “O uso da IA na legendagem e dublagem também facilita a globalização e localização de conteúdo, respeitando nuances culturais”, reforça Mukherjee.
Viabilizar a hiperpersonalização
Mas a IA, por si só, não resolve tudo. É preciso garantir que essas soluções funcionem para milhões de usuários simultaneamente. Manuel Martinez Serruys, diretor de vendas da MediaKind, aponta os modelos D2C (Direct-to-Consumer) como essenciais para transmissões ao vivo com confiabilidade, escalabilidade, qualidade e baixa latência. “A simplicidade operacional, a segurança do conteúdo e a integração via APIs são fundamentais para garantir agilidade e eficiência”, afirma.

“Essas aplicações abrem caminho para marketplaces segmentados. Os mecanismos de hiperpersonalização elevam o engajamento, oferecem experiências customizadas e fortalecem a conexão emocional com a marca”, explica. Assim, a IA não apenas facilita a distribuição de conteúdo — ela redefine como o público escolhe o que consumir, tornando a experiência rentável para os provedores.
Enquanto o streaming OTT (Over-the-Top) avança em transmissões ao vivo, baixa latência, escalabilidade e confiabilidade — algo fundamental para eventos esportivos, o engajamento dos torcedores cresce com produtos D2C que incorporam múltiplas câmeras e ferramentas de IA para personalização. Recursos como destaques sob demanda e câmera lenta hiperpersonalizada estão ganhando espaço, enquanto a IA também é usada para dublagem, transcrição e enriquecimento de metadados. “A conexão entre personalização e entrega de conteúdo está otimizando o envolvimento dos fãs, embora os custos ainda sejam um fator a considerar”, completa.

Gerar e hospedar toda esta oferta pode ser bem caro, por isso, Ion de Pinedo, diretor de vendas da Sensara, destacou a importância de soluções híbridas para o processamento de vídeo em larga escala. Segundo ele, embora a nuvem ofereça vantagens evidentes, o volume e o peso dos arquivos de vídeo muitas vezes exigem que parte do processamento ocorra localmente, em estruturas próprias ou em nuvens privadas. Essa abordagem permite acelerar a geração automatizada de metadados, legendas, emoções e elementos contextuais — tudo isso em tempo real, mesmo para conteúdos extensos. Além de prolongar a vida útil de vídeos já existentes por meio da criação de novas narrativas, a tecnologia também possibilita a contextualização inteligente de anúncios, conectando marcas ao momento exato e à imagem ideal. Para garantir segurança, previsibilidade de custos e escalabilidade, Pinedo defende sistemas resilientes e bem suportados, capazes de proteger dados sensíveis e atender às demandas de um público cada vez mais exigente e segmentado.
Conteúdos globais
Em sua participação na SET Expo, André Rodrigues, arquiteto de soluções do Google Cloud, explicou como os avanços da IA estão tornando os conteúdos mais acessíveis globalmente, por meio de dublagem e legendagem automatizadas. “A IA do Google utiliza machine learning para analisar não apenas o texto, mas também o contexto e as emoções por trás das falas. O objetivo é criar vozes naturais, sem a artificialidade das dublagens automatizadas”, afirma. Um dos maiores desafios é a sincronização labial (lip sync). Para superá-lo, a tecnologia analisa o timbre e a frequência da voz original, além de estudar fonemas e movimentos faciais. O resultado é uma dublagem tão precisa que o espectador dificilmente percebe que foi gerada por IA.

O arquiteto de soluções do Google Cloud promete que a dublagem por IA estará disponível para vídeos sob demanda e transmissões ao vivo até o fim do ano, enquanto as ferramentas de closed caption e legendagem automática já estão acessíveis na plataforma.