
Projeto envolveu matemáticos de ponta.
Pesquisadores do prestigiado Instituto de Matemática Pura e Aplicada criaram algoritmos de machine learning que devem permitir à Globo indexar melhor seu conteúdo.
Os números envolvidos são superlativos: foram analisados 1,5 milhão de obras audiovisuais do acervo da Globo (incluindo Globoplay), catalogadas com 100 milhões de palavras-chave.
Os dados incluem informações como elenco, diretor, gênero, país, sinopse e outras. A informação foi extraída de maneira automática a partir de múltiplas bases de metadados, tanto da emissora como de fora dela.
Um dos objetivos é melhorar a qualidade das sugestões de novos conteúdos com base no que os usuários já assistiram, a chave para qualquer serviço de streaming.
“Ter uma base ampla de metadados de conteúdos é fundamental para nosso negócio e poder incrementar esta base através da extração automática é um grande avanço”, afirma Carlos Octávio Queiroz, Diretor de Estratégia Corporativa e Arquitetura da Globo.
Para os interessados em questões técnicas, o trabalho do IMPA envolve novas abordagens para a chamada “record linkage”, um problema clássico da ciência de dados que busca formas rápidas e precisas para agregar bases de dados sobre os mesmos objetos, mas com informações diferentes em cada uma delas.
Ao todo, trabalharam na pesquisa três pesquisadores, auxiliados por seis bolsistas do IMPA.
O Instituto de Matemática Pura e Aplicada não é bolinho. Fundado em 1952, o centro sediado no Rio de Janeiro é uma referência mundial na área de matemática.
O matemático brasileiro Artur Avila, pesquisador e doutor egresso do IMPA, ganhou, em 2014, com a Medalha Fields, a mais prestigiosa distinção da matemática mundial, equivalente a um prêmio Nobel.
Vale lembrar que em abril do ano ado a Globo fechou um grande contrato com o Google, envolvendo a migração de dados para o Google Cloud e também o uso de tecnologias de machine learning.
Na época, a Globo falou que o contrato abria portas para uma “estratégia baseada em dados”, o que abriria a possibilidade de “otimizar as recomendações personalizadas em tempo real ao público”.
A Globo tem falado em se converter em uma “mediatech”, o que significa na prática ar a concorrer com os grandes players do mercado de streaming, deixando de lado o posicionamento tradicional de ser apenas uma emissora de TV.