Reserved vs On-Demand AWS: Economize 60% com Estratégia Certa

Fernanda Siewerdt

2 meses atrás

Você está pagando 100% On-Demand na AWS enquanto 75% de sua infraestrutura roda 24×7? A escolha entre Reserved Instances e On-Demand não é binária — e essa percepção equivocada custa às empresas brasileiras milhões anualmente. Organizações maduras em FinOps não escolhem um modelo único, mas orquestram portfolios híbridos onde cada workload usa o pricing model que maximiza economia sem sacrificar agilidade. Este artigo detalha a metodologia de otimização que líderes de infraestrutura utilizam para reduzir custos AWS entre 45-65%, com análise comparativa de cenários reais, cálculos práticos e decision trees para diferentes perfis de uso.

A escolha entre modelos de billing AWS representa uma das decisões mais impactantes na otimização de custos cloud, com potencial de economia entre 40-75% comparado ao modelo On-Demand puro.

Reserved Instances (RIs) oferecem descontos significativos em troca de compromisso de uso, enquanto On-Demand proporciona máxima flexibilidade sem contratos.

A estratégia ideal raramente é binária – ambientes de produção maduros adotam abordagens híbridas que balanceiam previsibilidade de custo com agilidade operacional. Segundo análises da Infomach, clientes que implementam estratégias FinOps estruturadas alcançam redução média de 28% nos custos AWS nos primeiros 3 meses, com otimização contínua elevando esse número para 45-60% após 12 meses.

Comparação Estruturada dos Modelos

TABELA COMPARATIVA DETALHADA

DIMENSÃO	ON-DEMAND	RESERVED INSTANCES (1Y)	RESERVED INSTANCES (3Y)	SAVINGS PLANS	SPOT INSTANCES
Desconto vs OD	Baseline (0%)	~30-40%	~50-65%	~30-66% (flexível)	~60-90%
Compromisso	Zero	1 ano	3 anos	1 ou 3 anos	Zero
Flexibilidade	Total (start/stop sob demanda)	Limitada (tipo/região/SO fixo)*	Limitada	Alta (família de instâncias)	Limitada (interrupções)
Pagamento	Por hora consumida	All/Partial/No Upfront	All/Partial/No Upfront	Por hora, compromisso $/h	Por hora (leilão)
Melhor para	Dev/Test, cargas imprevisíveis	Produção estável (>75% uptime)	Infraestrutura crítica 24×7	Workloads dinâmicos (containers)	Batch, Big Data, CI/CD
Break-even	–	~8-10 meses de uso contínuo	~14-18 meses	~6-9 meses	Imediato
Risco de Desperdício	Baixo (paga só o que usa)	Médio (paga se não usar)	Alto	Médio	Baixo
Marketplace	N/A	Sim (revenda de RIs não usados)	Sim	Não	Não
Tipos Disponíveis	Todos	Standard / Convertible	Standard / Convertible	Compute / EC2 Instance	Tipos variáveis

Notas Importantes:

Convertible RIs permitem mudança de família de instância com pequena redução de desconto (~5%)
Valores variam por região e tipo de instância (ex: m5.large vs c5.xlarge)

Cenários de Otimização Financeira

CASO 1: Startup em Crescimento

Cenário:

10x m5.large (8vCPU, 32GB RAM)
Uso 24×7 em produção
Região: us-east-1

Cálculo de Custos (mensais):

ON-DEMAND:
10 instâncias × $0.096/hora × 730 horas = $700.80/mês

RESERVED 1Y (No Upfront):
10 instâncias × $0.063/hora × 730 horas = $459.90/mês
ECONOMIA: $240.90/mês (34%) ou $2,890/ano

RESERVED 3Y (All Upfront):
10 instâncias × $0.054/hora × 730 horas = $394.20/mês
Pagamento único: $14,185 (equivalente a ~36 meses)
ECONOMIA: $306.60/mês (44%) ou $11,037 em 3 anos

SAVINGS PLAN (Compute, 1Y):
Compromisso: $450/mês ($0.0616/hora normalizado)
Flexibilidade: pode migrar para m5a.xlarge, c5.large, Fargate
ECONOMIA: ~$250/mês (36%) + agilidade arquitetural

Recomendação: Savings Plan 1Y – melhor balanço entre economia e flexibilidade para startup que ainda ajusta arquitetura.

CASO 2: Empresa Enterprise com Workload Híbrido

Profile de Uso:

Baseline constante: 50 instâncias (produção crítica)
Camada variável: 10-40 instâncias (picos diurnos)
Batch processing noturno: 20-100 instâncias (3h/dia)

Estratégia Híbrida Otimizada:

CAMADA 1 - BASELINE (50 instâncias):
→ Reserved 3Y All-Upfront
→ Economia: 65% vs On-Demand
→ ROI garantido (uptime >95%)

CAMADA 2 - VARIÁVEL (média 25 instâncias):
→ Savings Plan 1Y Compute
→ Cobre picos com flexibilidade de tipo
→ Economia: 40% vs On-Demand

CAMADA 3 - BATCH (média equivalente a 12.5 instâncias full-time):
→ Spot Instances com Spot Fleet
→ Economia: 70% vs On-Demand
→ Configurar instance diversification (5+ tipos)
→ Implementar checkpointing para tolerar interrupções

CAMADA 4 - SPIKES INESPERADOS:
→ On-Demand (auto-scaling)
→ Representa <5% do compute total
→ Custo aceitável pela garantia de elasticidade

Resultado Consolidado:

ANTES (100% On-Demand): $18,500/mês

DEPOIS (Estratégia Híbrida):
- RIs (Baseline): $3,250/mês
- Savings Plan: $3,000/mês
- Spot (Batch): $450/mês
- On-Demand (Spikes): $600/mês
TOTAL: $7,300/mês

ECONOMIA TOTAL: $11,200/mês (60.5%) ou $134,400/ano

Decision Tree para Escolha de Modelo

┌─────────────────────────────────────────┐
│ Workload tem uso >75% 24x7?             │
└────┬────────────────────────────┬───────┘
     │ SIM                        │ NÃO
     │                            │
     ▼                            ▼
┌────────────────────┐    ┌──────────────────────┐
│ Arquitetura estável│    │ Workload tolerante   │
│ por >1 ano?        │    │ a interrupções?      │
└─┬──────────────┬───┘    └──┬──────────────┬────┘
  │ SIM          │ NÃO       │ SIM          │ NÃO
  │              │           │              │
  ▼              ▼           ▼              ▼
┌──────────┐ ┌────────┐ ┌────────────┐ ┌──────────┐
│ RI 3Y    │ │ RI 1Y  │ │ Spot       │ │On-Demand │
│ Standard │ │Convert.│ │ Instances  │ │+ Savings │
│          │ │        │ │            │ │ Plan     │
└──────────┘ └────────┘ └────────────┘ └──────────┘
  Max. Economia  Economia   Max. Economia  Flexibilidade
  (65%)         +Flex(40%)  +Risco(70-90%) Total

Critérios de Decisão Detalhados:

Reserved Instances 3Y Standard:
- Uso comprovado >85% por 6+ meses
- Infraestrutura crítica de longo prazo (DB primário, AD controllers)
- Budget aprovado para upfront payment
Reserved Instances 1Y Convertible:
- Workload estável mas arquitetura pode evoluir
- Primeira compra de RIs (testar estratégia)
- Possível mudança de região/tipo em 12 meses
Savings Plans:
- Ambientes containerizados (ECS/EKS) com variação de tipos
- Microserviços com scaling horizontal frequente
- Multi-região com shifting de carga
Spot Instances:
- EMR, Spark, batch ETL, rendering
- Testes de carga, CI/CD runners
- Dev/staging de componentes stateless
- Requisito: aplicação com checkpointing ou idempotência
On-Demand:
- Novos projetos em fase de sizing
- Picos sazonais curtos (<1 semana)
- Ambientes de desenvolvimento ocasionais

Estratégias Avançadas de Otimização

1. RI Portfolio Management

python# Análise de Coverage e Utilization
import boto3
ce= boto3.client('ce')

# Coverage: % de horas cobertas por RIs
response= ce.get_reservation_coverage(
    TimePeriod={'Start':'2024-01-01','End':'2024-01-31'},
    Granularity='MONTHLY'
)
# Target: >80% para workloads estáveis

# Utilization: % de RIs efetivamente utilizadas
response= ce.get_reservation_utilization(
    TimePeriod={'Start':'2024-01-01','End':'2024-01-31'},
    Granularity='MONTHLY'
)
# Target: >95% (ou revender no Marketplace)

2. Right-Sizing Antes de Comprar RIs

bash# AWS Compute Optimizer - identifica over-provisioning
aws compute-optimizer get-ec2-instance-recommendations \\
  --instance-arns arn:aws:ec2:us-east-1:123456789:instance/i-xxxxx

# Exemplo de output:
# i-xxxxx: m5.2xlarge → m5.large (50% economia mantendo performance)

Regra de Ouro: Nunca compre RIs antes de 30+ dias de análise de CloudWatch metrics (CPU, Memory, Network) – pode economizar 20-40% adicional via right-sizing prévio.

3. Auto-Scaling com Priorização de RIs

yaml# Launch Template com mixed instances policy
mixed_instances_policy:
launch_template:
launch_template_specification:
launch_template_name: prod-app-template
instances_distribution:
on_demand_base_capacity:2# Mínimo On-Demand
on_demand_percentage_above_base:0# Resto usa Spot
spot_allocation_strategy: capacity-optimized
spot_instance_pools:5
spot_max_price:"0.05"# Limite de preço

4. Tag-Based Cost Allocation

bash# Tagueamento obrigatório para análise de ROI
Environment: Production/Staging/Development
CostCenter: Engineering/Marketing/Finance
RIEligible: true/false
Owner: team-name

# CloudWatch Dashboard personalizado por tag
aws cloudwatch put-dashboard \\
  --dashboard-name RI-Efficiency \\
  --dashboard-body file://ri-dashboard.json

Considerações para Savings Plans

Compute Savings Plans vs EC2 Instance Savings Plans:

TIPO	DESCONTO	FLEXIBILIDADE	USE CASE
Compute Savings Plans	Até 66%	EC2, Fargate, Lambda (qualquer região)	Arquiteturas cloud-native modernas
EC2 Instance Savings Plans	Até 72%	Família de instâncias específica	Workloads estáveis com tipo definido

Cálculo de Compromisso Savings Plans:

PASSO 1: Analise últimos 30-60 dias de uso
- Use AWS Cost Explorer → Savings Plans Recommendations

PASSO 2: Identifique baseline consistente
- Piso de uso diário (exemplo: $50/dia = $1,500/mês compromisso)

PASSO 3: Comece conservador (70-80% do baseline)
- Primeiro Savings Plan: $1,200/mês
- Monitore cobertura por 30 dias

PASSO 4: Ajuste trimestralmente
- Adicione novos Savings Plans conforme crescimento
- Cancele apenas por não-renovação (não há cancelamento early)

ERRO COMUM: Comprar Savings Plans baseado em projeções de crescimento futuro → resulta em underspending e perda de desconto. MELHOR PRÁTICA: Base em dados históricos, adicione incrementalmente.

Melhores Práticas FinOps

Visibilidade Completa: Implemente AWS Cost Anomaly Detection + alertas automáticos via SNS/Slack para desvios >15% vs baseline.
Revisão Mensal de RI Portfolio: Analise utilization (<80% = candidato a venda no Marketplace) e coverage (<70% = oportunidade de compra).
Reserved Capacity para RDS/ElastiCache: Bancos de dados produção geralmente têm 90%+ uptime → RIs com 50-70% economia são no-brainer.
Automatize Scheduling: Use AWS Instance Scheduler para desligar dev/test environments fora do horário comercial → 65% economia adicional.
Establish Showback/Chargeback: Dashboards por equipe/projeto criam accountability e incentivam otimização orgânica.

Da Teoria à Economia Mensurada

A otimização financeira cloud não é projeto único, mas disciplina contínua:

Análise de baseline histórico (30+ dias de CloudWatch) antes de qualquer compra de RIs evita over-commitment e permite right-sizing prévio • Estratégias híbridas (RIs para baseline + Savings Plans para variável + Spot para batch) entregam 60%+ de economia vs On-Demand puro • Governança via tags e dashboards por centro de custo cria accountability que sustenta otimização orgânica

A Infomach implementa práticas FinOps estruturadas em migrações cloud e ambientes existentes, com análise de workloads, recomendações personalizadas de purchasing strategy e dashboards de monitoramento contínuo. Nossos clientes AWS alcançam ROI médio de 28% de redução de custos nos primeiros 90 dias, com otimização progressiva chegando a 55% em 12 meses através de revisões trimestrais de RI portfolio e automação de scheduling.

Quanto sua empresa está deixando na mesa por falta de estratégia FinOps? Uma análise de 30 dias de sua infraestrutura AWS pode revelar oportunidades de economia equivalentes a meses de budget desperdiçado.

[Solicite Análise Gratuita de Otimização AWS] → https://lp.infomach.com.br/contato