UFF REITORIA

Arquiteturas NewSQL para Data Warehousing Aplicadas à Gestão de Crises Reputacionais

Será defendida no dia 11 de agosto de 2025, às 14h, por videoconferência, a Proposta de Tese de Doutorado intitulada “Arquiteturas NewSQL para Data Warehousing Aplicadas à Gestão de Crises Reputacionais”, do candidato ao título de Doutor em Computação – Paulo Roberto Siqueira da Costa Júnior.

Link para defesa: https://meet.google.com/etu-akih-hnj

Arquiteturas NewSQL para Data Warehousing Aplicadas à Gestão de Crises Reputacionais

Resumo:

A reputação de uma marca é um ativo intangível cuja percepção impacta diretamente seu valor. O setor de Relações Públicas (PR) enfrenta a responsabilidade de preservar ou elevar essa valoração dinâmica por meio de decisões orientadas tanto por dados quanto pela experiência dos profissionais. Em particular, para evitar crises que possam comprometer a reputação, sistemas de PR monitoram continuamente a “saúde” da marca e ativam planos de ação em resposta a oscilações identificadas. Esses sistemas lidam com grandes volumes de dados heterogêneos (como menções em notícias e postagens em redes sociais) para identificar tendências. O monitoramento é supervisionado por profissionais que frequentemente ajustam focos, pesos e rótulos. Esta proposta de tese propõe uma nova arquitetura que combina o uso de Data Warehousing em bancos de dados relacionais NewSQL e estratégias de Inteligência Artificial, acopladas nos estágios de (i) transformação das menções, por meio de modelos de linguagem de grande escala (LLMs), e (ii) geração de relatórios, por meio de sistemas multiagentes. Ao contrário de trabalhos relacionados, essa abordagem oferece uma alternativa escalável, de consistência forte e com interoperabilidade de schemas multidimensionais. Além do projeto lógico do modelo de DW, dois desafios em pesquisa relevantes mapeados são: (i) a inserção de dados, na qual as transformações via LLM devem ser realizadas de forma assíncrona e eficiente; e (ii) a consulta de dados, em que os relatórios dinâmicos devem ser moldados pelo domínio de negócios de cada marca monitorada. Para atacar o primeiro desafio, esta proposta de tese investiga uma estratégia de prompt multitarefa, em que se realiza apenas uma passada sobre os dados, associando-os a múltiplas categorias, e.g., sentimento, tema e papel da marca na menção. A premissa é que essa abordagem pode ser executada de forma assíncrona, com o dicionário de dados derivado das tabelas de dimensão, o que permite escalabilidade horizontal e independência de dados. Quanto ao segundo desafio, propõe-se estudar e viabilizar uma estratégia multiagente capaz de construir relatórios a partir de perguntas formuladas por profissionais de PR, utilizando tanto o encadeamento de prompts para tradução de texto em SQL, quanto a geração baseada em recuperação aumentada, para poder se beneficiar de relatórios anteriores já validados por especialistas. 

Abstract:

Brand reputation is an intangible asset whose public perception directly influences its value. The Public Relations (PR) sector must maintain or enhance this valuation through decisions informed by curated data and expert judgment. PR systems monitor brands’ “health” continuously to avert potential crises, enabling timely responses to changes in reputational indicators. These systems process large volumes of heterogeneous data (e.g., brand mentions in news articles and social media) to detect emerging trends. Monitoring is supervised by professionals who routinely adjust focus areas, weightings, and labeling criteria. This study introduces a novel architecture that integrates relational, NewSQL Data Warehousing (DW) with Artificial Intelligence methods, applied in two core stages: (i) mention transformation, utilizing Large Language Models (LLMs); and (ii) dynamic report generation, using multi-agent systems. In contrast to existing approaches, this architecture delivers scalability, strong consistency, and interoperability across multidimensional schemas. Additionally, the study highlights two unresolved challenges beyond the DW logical design: (i) data ingestion, requiring LLM-based transformations to operate asynchronously and efficiently; and (ii) data querying, necessitating dynamic reports aligned with the specific business domain of each brand. To address the first challenge, a multitask prompting strategy that processes the records in a single pass and assigns multiple labels simultaneously is explored – e.g., sentiment, topic, and brand role per mention. The core assumption is that this strategy supports asynchronous execution and relies on a resilient data dictionary derived from dimensional tables, allowing horizontal scalability and data independence. Finally, a multi-agent approach is discussed for report generation in response to queries from PR professionals. This strategy combines prompt chaining for text-to-SQL translation with retrieval-augmented generation, both of which leverage prior validated reports.

Banca  examinadora:

Prof. Marcos Vinícius Naves Bêdo, UFF – Presidente

Prof. Daniel Cardoso Moraes de Oliveira, UFF

Profa. Mirela Teixeira Cazzolato, USP

Prof. Rodrigo Salvador Monteiro, UFF

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *