GT-RLProviDe-MI

feRramenta inteLigente, ágil e escalável para Provisionamento de recursos em reDes com Múltiplos Inquilinos

Coordenadora: Dianne Scherly Varela de Medeiros
MídiaCom | LabGen – TET / PPGEET / UFF
2020 – 2022

Sobre o Projeto 

A alocação eficiente de largura de banda em provedores de infraestrutura é desafiadora devido ao compartilhamento dos recursos entre múltiplos inquilinos. Isso pode provocar ociosidade de recursos caso muitos inquilinos não utilizem a totalidade da banda contratada. A alocação dinâmica de recursos sob demanda permite otimizar o uso da infraestrutura, beneficiando clientes e provedores. Nesse contexto, ferramentas baseadas em aprendizado de máquina que promovam respostas adaptáveis a ambientes variantes no tempo permitem otimizar o uso dos recursos.

Objetivo Geral

O objetivo geral é promover a melhoria de desempenho de uma infraestrutura de rede compartilhada por múltiplos inquilinos ao mesmo tempo em que melhora a receita do provedor de infraestrutura. Para isso, o projeto propõe uma ferramenta baseada em aprendizado por reforço e lógica difusa, capaz de gerenciar automaticamente o acesso dos inquilinos aos recursos de rede do provedor de forma ágil e escalável.

Objetivos Específicos

A ideia principal da ferramenta proposta é garantir o aprendizado automático da política que maximiza o lucro do provedor, garantindo simultaneamente o desempenho mínimo requerido por cada inquilino. Para tanto, os seguintes objetivos específicos são almejados:

  • Desenvolver agentes de aprendizado por reforço, responsáveis por repassar as ações tomadas para um controlador
  • Utilizar lógica difusa para aprimorar o desempenho do algoritmo de aprendizado dos agentes
  • Desenvolver um controlador, vuja função é determinar a banda disponível para cada inquilino de acordo com as ações dos agentes individuais
  • Otimizar a receita do provedor IaaS sem provocar não conformidade com o nível de serviço contratado

Produto Mínimo Viável (MVP)

O MVP identificado é uma ferramenta para alocação de recursos em um ambiente altamente dinâmico. Há preocupação em garantir as seguintes propriedades:

  • Priorização
    Garantia determinística de que o tráfego mínimo contratado por um inquilino será sempre atendido, mesmo na presença de outros inquilinos que utilizem mais recursos do que o contratado
  • Praticabilidade
    Simplicidade e baixo consumo de memória e processamento, implicando escalabilidade
  • Justiça
    Distribuição da banda ociosa proporcionalmente à prioridade dos inquilinos que disputam o uso da banda
  • Utilização
    Garantia da alta utilização da banda da infraestrutura de rede para atender o máximo de solicitações por banda possível

Diferencial

A proposta inova ao combinar aprendizado por reforço e lógica difusa para maximizar a receita de um provedor de infraestrutura, garantindo ainda os níveis mínimos de serviço contratados, sendo aplicada à alocação de recursos de rede nos provedores. Os principais destaques são:

  • Múltiplas políticas para garantir o cumprimento dos níveis de serviço contratados
  • Chaveamento automático entre as políticas com base no conhecimento adquirido ao longo do tempo
  • Otimização do desempenho de cada agente para melhorar o desempenho geral do método
  • Utilização apenas de informações sobre consumo de processamento e banda
  • Implementação de controle baseado em lógica difusa e aprendizado por reforço para encontrar as melhores políticas

Abordagem

A ferramenta utiliza uma abordagem de múltiplos agentes, em que cada agente é responsável por aprender as melhores políticas de alocação de banda para o inquilino. Para isso, cada agente utiliza informações de uso de largura de banda de todos os inquilinos e da capacidade ociosa da infraestrutura de rede a cada momento. O aprendizado tem como base o algoritmo Q-Learning e a inferência difusa. Assume-se que o problema segue um processo de decisão markoviano (Markov Decision Process – MDP), no qual os agentes são independentes, já que a decisão dos outros agentes não tem influência na ação tomada, havendo somente a restrição de que o tráfego total direcionado à infraestrutura não pode ultrapassar um limiar previamente estabelecido.

O desenvolvimento dos agentes leva em consideração os seguintes requisitos:

  • Múltiplos agentes, cada agente está ligado a um inquilino
  • Limitação da taxa de transmissão de cada inquilino
  • Independência dos agentes
  • Garantia de conformidade com os níveis de serviço contratados
  • Compartilhamento de informações e estados entre agentes
  • Garantia de que o tráfego agregado não ultrapassa um limiar de uso da infraestrutura
  • Limitação do tráfego é decidida de acordo com a capacidade atual da infraestrutura e os interesses do inquilino daquele agente

Equipe

Dianne Medeiros

Diogo Mattos

Pedro Pisa

Guilherme Barbosa

Nicollas Oliveira

Reiner Santos

Ricardo Firmino

Yago Rezende

Financiamento