Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud
Parallel CPU performance scaling is dependent of many factors such applications behavior, cache available, efficiency of cache use. Computer simulators are used to predict or benchmark the performance of multi-core processors; they are categorized as cycle accurate or high-level models. The cycle ac...
Autor principal: | Jorge, Hudson |
---|---|
Formato: | Dissertação |
Idioma: | Inglês |
Publicado em: |
Universidade Tecnológica Federal do Paraná
2019
|
Assuntos: | |
Acesso em linha: |
http://repositorio.utfpr.edu.br/jspui/handle/1/4313 |
Tags: |
Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
|
id |
riut-1-4313 |
---|---|
recordtype |
dspace |
spelling |
riut-1-43132021-12-10T21:49:26Z Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud Extensions to cloudsim simulator based on a first order parasitic coupling overhead model to study the CPU scalation in clouds systems Jorge, Hudson Wille, Emílio Carlos Gomes http://lattes.cnpq.br/7042348032717400 Wille, Emílio Carlos Gomes Bona, Luis Carlos Erpen Duarte, Elias Procópio Processamento paralelo (Computadores) Processamento paralelo (Computadores) - Simulação por computador Redes de computadores Simulação (Computadores) Processamento paralelo (Computadores) - Desempenho Arquitetura de computador Engenharia elétrica Parallel processing (Electronic computer) Parallel processing (Electronic computer) Parallel processing (Electronic computer) - Computer simulation Computer networks Computer simulation Parallel processing (Electronic computer) - Performance Computer architecture Electric engineering CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Engenharia Elétrica Parallel CPU performance scaling is dependent of many factors such applications behavior, cache available, efficiency of cache use. Computer simulators are used to predict or benchmark the performance of multi-core processors; they are categorized as cycle accurate or high-level models. The cycle accurate models are based on queue theory to step-by-step conduct the simulation to perform the operations needed to consume a model that represents the application size. The high-level models are used to collect, usually via additional hardware, not accessible information that represents the behavior of the running system. In those two cases, they are complex because a very long sequence of queues (cycle accurate) controls the process, making the simulation very time consuming. And in the case of high-level, sometimes it needs a complete different hardware from the actual system to read the needed states. In addition, sometimes programmable logic systems are used to implement the cache controls, queues and communication protocols what enlarges the running time, to accommodate the clock restrictions of the additional hardware. Based on a simple model proposed by Kandalintsev and Lo Cigno, the Behavioral First Order Performance Model (BFO), all the complexity of the internals of the architecture is studied as parasitic interference of one CPU/core fighting for shared resources. They introduced a coupling factor, which incorporates the essence of the observed performance behavior in a system. In this work, we used the BFO model to implement a fast cycle-accurate simulator capable of handling even large systems. To do it the CloudSim simulator was extended to behave as a cycle-accurate simulator. Basically we implemented CPU and application models that can handle the complexity of the different types of scenarios (distinct CPU behavior when running different kinds of applications). Using off line measurements we trained the model to extract the coupling factor needed to feed the simulator. We tested the pairwise behavior to make sure that the implementation could reproduce the measured tests. Our simulations consider up to 14 cores (in case of Xeon E5-2880v4) and to improve the results quality we introduced a correction factor to minimize the (seemly exponential) error observed, with good results. O aumento de performance em CPUs paralelas é dependente de muitos fatores como comportamento das aplicações, cache disponível, eficiência do uso do cache. Simuladores em computadores são usados para prever ou comparar a performance de processadores multi-core; eles são categorizados como modelos ciclo-precisos ou de alto nível. Os modelos cliclo-precisos são baseados na teoria de filas para passo-a-passo conduzir a simulação a executar as operações necessárias para consumir um modelo que representa o tamanho da aplicação. Os modelos de alto nível são usados para coletar, usualmente através de hardware adicional, informações não acessíveis que representam o comportamento do sistema em operação. Nos dois casos, eles são complexos porque uma longa sequência de filas (ciclo-preciso) controlam o processo, fazendo com que a simulação sejam muito demoradas. No caso de alto nível, muitas vezes é necessário um hardware completamente diferente do sistema real a fim de ler os estados necessários. Além disso, às vezes sistemas com lógica programável são usados para implementar o controle de cache, filas e protocolos de comunicação o que aumenta o tempo de execução, por causa as restrições de clock desse hardware adicional. Baseado em um modelo simples proposto por Kandalintsev e Lo Cigno, o Modelo BFO (First Order Performance), toda a complexidade da arquitetura interna é estudada como interferência parasítica de uma CPU/core lutando por recursos comuns. Eles introduziram um fator de acoplamento, que incorpora a essencia do comportamento de performance observado em um sistema. Neste trabalho, usamos o modelo BFO para implementar um simulador ciclo-preciso rápido capaz de manusear grandes sistemas. Para tanto o simulador CloudSim foi extendido para se comportar como um simulador ciclo-preciso. Basicamente implementamos modelos de CPU e modelos de aplicação que poder dar conta da complexidade de diferentes tipos de cenários (comportamento de CPU distintos quando rodando diferentes tipos de aplicação). Usando medidas off line nós treinamos o modelo para extrair os fatores de acoplamento necessários para alimentar o simulador. Testamos o comportamento em pares para estar seguros de que a implementação poderia reproduzir os testes medidos. Nossas simulações consideram até 14 cores (no caso de m Xeon E5-2880v4) e para melhorar a qualidade dos resultados introduzimos um fator de correção para minimizar o erro observado (que parece ser exponencial), com bons resultados. 2019-08-02T19:40:31Z 2019-08-02T19:40:31Z 2019-04-01 masterThesis JORGE, Hudson. Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud. 2018. 74 f. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2019. http://repositorio.utfpr.edu.br/jspui/handle/1/4313 eng openAccess application/pdf Universidade Tecnológica Federal do Paraná Curitiba Brasil Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial UTFPR |
institution |
Universidade Tecnológica Federal do Paraná |
collection |
RIUT |
language |
Inglês |
topic |
Processamento paralelo (Computadores) Processamento paralelo (Computadores) - Simulação por computador Redes de computadores Simulação (Computadores) Processamento paralelo (Computadores) - Desempenho Arquitetura de computador Engenharia elétrica Parallel processing (Electronic computer) Parallel processing (Electronic computer) Parallel processing (Electronic computer) - Computer simulation Computer networks Computer simulation Parallel processing (Electronic computer) - Performance Computer architecture Electric engineering CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Engenharia Elétrica |
spellingShingle |
Processamento paralelo (Computadores) Processamento paralelo (Computadores) - Simulação por computador Redes de computadores Simulação (Computadores) Processamento paralelo (Computadores) - Desempenho Arquitetura de computador Engenharia elétrica Parallel processing (Electronic computer) Parallel processing (Electronic computer) Parallel processing (Electronic computer) - Computer simulation Computer networks Computer simulation Parallel processing (Electronic computer) - Performance Computer architecture Electric engineering CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Engenharia Elétrica Jorge, Hudson Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud |
description |
Parallel CPU performance scaling is dependent of many factors such applications behavior, cache available, efficiency of cache use. Computer simulators are used to predict or benchmark the performance of multi-core processors; they are categorized as cycle accurate or high-level models. The cycle accurate models are based on queue theory to step-by-step conduct the simulation to perform the operations needed to consume a model that represents the application size. The high-level models are used to collect, usually via additional hardware, not accessible information that represents the behavior of the running system. In those two cases, they are complex because a very long sequence of queues (cycle accurate) controls the process, making the simulation very time consuming. And in the case of high-level, sometimes it needs a complete different hardware from the actual system to read the needed states. In addition, sometimes programmable logic systems are used to implement the cache controls, queues and communication protocols what enlarges the running time, to accommodate the clock restrictions of the additional hardware. Based on a simple model proposed by Kandalintsev and Lo Cigno, the Behavioral First Order Performance Model (BFO), all the complexity of the internals of the architecture is studied as parasitic interference of one CPU/core fighting for shared resources. They introduced a coupling factor, which incorporates the essence of the observed performance behavior in a system. In this work, we used the BFO model to implement a fast cycle-accurate simulator capable of handling even large systems. To do it the CloudSim simulator was extended to behave as a cycle-accurate simulator. Basically we implemented CPU and application models that can handle the complexity of the different types of scenarios (distinct CPU behavior when running different kinds of applications). Using off line measurements we trained the model to extract the coupling factor needed to feed the simulator. We tested the pairwise behavior to make sure that the implementation could reproduce the measured tests. Our simulations consider up to 14 cores (in case of Xeon E5-2880v4) and to improve the results quality we introduced a correction factor to minimize the (seemly exponential) error observed, with good results. |
format |
Dissertação |
author |
Jorge, Hudson |
author_sort |
Jorge, Hudson |
title |
Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud |
title_short |
Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud |
title_full |
Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud |
title_fullStr |
Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud |
title_full_unstemmed |
Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud |
title_sort |
extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de cpu em sistemas cloud |
publisher |
Universidade Tecnológica Federal do Paraná |
publishDate |
2019 |
citation |
JORGE, Hudson. Extensões ao simulador cloudsim baseado no modelo de sobrecarga por acoplamento parasítico de primeira ordem para estudar o escalonamento de CPU em sistemas cloud. 2018. 74 f. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2019. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/4313 |
_version_ |
1805318328139382784 |
score |
10,814766 |