Tecnologia Intel® Active Management Caso de Uso #5: Diagnóstico Remoto, Reparo Local

A Intel® Active Management Technology (Intel® AMT) pode te ajudar a reduzir a sobrecarga no suporte associada à reparação de problemas de boot, mesmo quando as causas destes problemas não podem ser reparadas remotamente. Permitindo o diagnóstico dos problemas através da rede, plataformas com a Intel® AMT pode reduzir a necessidade de visitas técnicas que tomam tempo para diagnosticar problemas, aumentando o downtime e consumindo recursos de TI.

Neste exemplo de caso de uso, o computador de um usuário não consegue iniciar devido a problemas de hardware, como um disco rígido corrompido e erros de memória.

Limitações convencionais do Diagnóstico Remoto e Reparo Local

Em um cenário típico onde o sistema de um usuário não inicializa, o usuário entra em contato com o help desk para assistência, e o técnico do help desk tenta diagnosticar o problema. Como o sistema não inicializa, o help desk normalmente não consegue resolver o problema. Depois que o chamado foi escalonado para um técnico de suporte que vai até o local onde o usuário e o sistema se encontram, o técnico diagnostica o hardware como causa do problema e identifica o componente de hardware (um FRU - field-replaceable unit) que precisa ser trocado para que o problema seja resolvido. O técnico precisa então ir até um depósito para retirar o componente a ser substituído e voltar ao local onde o usuário e o sistema estão para poder reparar o computador.

Neste cenário convencional, duas ou mais visitas são necessárias para que o sistema seja reparado. Isto irá impactar na produtividade do usuário e consumir recursos de TI.

Usando a Intel® AMT para contornar estas limitações

Em um cenário equivalente ao descrito acima, onde a Intel® AMT está em uso, um evento gerado pela máquina do usuário pode ser recebido por uma console de gerenciamento operada por uma organização de suporte para indicar hardware inoperante ou com mau funcionamento. As políticas configuradas na console podem tratar este evento para determinar quando o envio de um alerta ao help desk é necessário. Além disso, o usuário pode contatar o help desk diretamente.

O help desk diagnostica o problema através da rede usando o Serial-over-LAN (SoL) ou KVM junto com a capacidade de boot remoto do IDE-R da Intel® AMT's, e ferramentas de diagnósticos de terceiros. Mesmo que o help desk não seja capaz de reparar o sistema remotamente, ele pode identificar a unidade de hardware com falha (FRU), para que o técnico de campo possa levar o componente quando for enviado pela primeira vez para atender o chamado no local onde o usuário se encontra, fazendo com que ele possa resolver o problema nesta primeira visita.

Neste cenário reforçado pela Intel® AMT, somente uma visita técnica foi necessária para reparar o sistema.

Principal funcionalidade habilitada pela Intel® AMT em que se baseia este caso de uso

A tabela a seguir resume os recursos e funcionalidades utilizados neste caso de uso, que são fornecidos pela Intel AMT ou habilitados pela Intel AMT em software de terceiros:

Característica Funcionalidade
Acesso Out-of band (OOB) A plataforma é diagnosticada e reparada em um estado de crash através de acesso OOB à Intel® AMT, KVM or SoL/IDE-R, e diagnóstios de terceiros.
Inventário remoto de FRU (field-replaceable unit ) A lista de inventário FRU existente no firmware é utilizada para identificar os fabricantes e modelos de FRUs existentes na máquina.
Troubleshooting e recuperação remotos Aplicativos de gerenciamento de terceiros são usados remotamente através da rede para diagnosticar remotamente uma plataforma inoperante (em estado de crash).
Alertas Dependendo da implementação do OEM, eventos podem ser gerados pela Intel® AMT e enviados à console de gerenciamento de terceiros para notificar o help desk.†
Intel® AMT flash Permite que a BIOS armazene e atualize uma lista de hardware na memória flash; os técnicos podem acessar esta lista remotamente para identificar marca/modelo dos componentes deste computador, para tê-los em mãos em uma visita técnica.
Agente inviolável Permite o acesso à plataforma e suas informações de inventário, com pequeno risco de violação do agente pelo usuário.


† O evento é armazenado em um log no formato padrão na NVStore e disponibilizado para uso por uma aplicação de gerenciamento de terceiros, que irá determinar quando o evento deve gerar um alarme para a sua console.

A vantagem da Intel® AMT

A Intel® AMT possibilita que as organizações de suporte reduzam o número de visitas de seus técnicos através do diagnóstico remoto dos problemas, determinando qual componente de hardware (FRU) falhou. Além disso, o tempo de troubleshooting do problema e o downtime do usuário são reduzidos.

Valor de Negócios da Solução Intel® AMT

Este caso de uso permite que as organizações de TI economizem em suporte e custos de produtividade:

  • Economia com a redução de visitas: A Intel® AMT reduz a necessidade de visitas ao local onde o equipamento está instalado no atendimento a chamados gerados por falhas de componentes de hardware. Estes chamados requerem tipicamente duas visitas técnicas utilizando os meios convencionais de solução de problemas e a Intel® AMT elimina potencialmente uma destas visitas.
  • Economia na produtividade do usuário: Melhorando o tempo médio de reparo, as organizações podem economizar em com a redução do downtime de usuário.

Fluxo da solução sem o KVM

AMT_UC5_1.gif

Fluxo da solução com o KVM

AMT_UC5_2.gif

Implementação do Caso de Uso de Diagnóstico Remoto, Reparo Local

Um cenário típico de diagnóstico remoto, reparo local pode consistir da utilização de IDE-R (IDE Redirect) para inicializar um client com um sistema operacional corrompido ou falha de hardware. A implementação deste caso de uso depende das seguintes pré-condições:

  1. Os clients AMT clients estão provisionados.
  2. Todos os clients estão conectados à rede.
  3. Clientes habilitados com a AMT estão alimentados eletricamente e em um dos seguintes estados: S5, S4, S3, S1, S0.
  4. Uma Console de Gerenciamento habilitada com a AMT está presente na rede.
  5. Todos os sistemas foram encontrados no Discovery (ver o Caso de Uso #1)
  6. Para o KVM, o client AMT possui a versão 6.x e o sistema está utilizando gráfico integrado.
Para se implementar o caso de uso de Diagnóstico Remoto, Reparo Local, as seguintes ações deveriam ser tomadas:

Passo Workflow (Roteiro básico de eventos para substituir/remover componentes de hardware)
1 Usuário tenta inicializar seu sistema.
2 Durante o POST, a BIOS interrompe a inicialização e alerta que não pode encontrar um componente de hardware específico (ex. Memória, CD-ROM, HDD, etc).
3 Usuário contata a TI e relata o problema com seu sistema.
4 O profissional de TI tenta obter algum contexto sobre o problema e informações sobre o usuário.
5 O profissional de TI utiliza SOL ou KVM e IDE-R para inicializar remotamente o sistema para um SO de diagnóstico.
6 O profissional de TI utiliza ferramentas de diagnóstico remotamente para identificar a causa do problema.
7 O profissional de TI identifica qual é o componente de hardware (FRU) que falhou e envia um técnico para uma visita, já com o componente substituto em mãos.
8 O sistema é capaz de inicializar no SO do usuário e o usuário pode utilizar o sistema tal como fazia antes do problema surgir.
Caminho Alternativo 1 – SO inicializa com hardware em falha:
2 Com o Sistema Operacional carregado, o usuário nota que não tem mais acesso a um componente de hardware (som, CD-ROM, etc). Continue com os passos 3-8 do Roteiro de Eventos acima.
Caminho Alternativo 2 – Um agente detecta a ausência de um componente de hardware:
2 Com o Sistema Operacional carregado, um agente de software detecta que um componente de hardware específico não está mais presente no computador e envia um alerta à console de TI. Continue com os passos 3-8 do Roteiro de Eventos acima.
Caminho Alternativo 3 – O equipamento relata uma falha impeditiva:
2 Durante o POST um componente de hardware S.M.A.R.T. detecta que o componente possui um problema e que esta falha é impeditiva.
3 Um alerta é enviado para a console de TI.
4 Um profissional de TI recebe o alerta e contacta o usuário para informa-lo sobre o problema e para agendar um horário para que o diagnóstico e solução do problema sejam realizados. Continue com os passos 5-8 do Roteiro de Eventos acima.

A tabela abaixo apresenta os Fluxos de Desenvolvimento de Software e Domínios que poderiam ser aplicados no caso de uso de Diagnóstico Remoto, Reparo Local. Note que este caso de uso é primariamente baseado na implementação de uma sessão SOL/IDER, que usa um protocolo diferente de SOAP e WSMan. Implementando uma sessão SOL/IDER inclui não apenas as chamadas às APIs referenciadas na Redirection Design Library Guide, mas também a configuração da interface Remote Power para direcionar o caminho de boot de forma adequada.

Fluxos de Desenvolvimento de Software Relevantes Domínio da Interface WSMan
1 Fluxo de Redirection Administration (AMT 3.0, 3.2, 4.0, 5.0, 5.1) Domínio Redirection Administration
2 Fluxo de Controle Remoto de Energia Remote Control

As seguintes premissas baseiam a análise neste caso de uso:

  1. A ferramenta de suporte remoto de terceiros utilizada neste caso de uso suporta a Intel® AMT.
  2. O Alert Standard Format (ASF) para plataformas cliente não está implementado, por não ter suporte na aplicação.
  3. A falha de hardware é uma falha em um componente da plataforma e não uma falha no chipset ou na placa mãe.
  4. Todos os dados de pesquisa foram retirados de organizações de TI globais, baseadas nos Estados Unidos.
  5. As plataformas que estão sendo gerenciadas pela Intel® AMT estão conectadas a uma fonte de energia (Modo Desktop) ou estão conectadas a uma fonte de energia AC ou DC (Modo Móvel), mas a plataforma não precisa estar ligada. Notebooks com a Intel® AMT 2.6 ou anterior devem estar no estado S0 (ligados).
  6. As plataformas estão conectadas através de uma conexão Ethernet (Modo Desktop) ou através de conexão sem fios (Modo Remoto) e não VPN à rede corporativa para acesso out-of-band (OOB).
  7. Para a Intel® AMT 2.6 e anteriores, esta análise assume um ambiente majoritariamente conectado, ou um ambiente onde os laptos estão frequentemente conectados. Notebooks que possuma a AMT 4.0 e posteriores possuem acesso OOB em estados Sx.
Os seguintes recursos do Intel® AMT SDK proveem exemplos dos componentes envolvidos com a implementação do caso de uso de Diagnóstico Remoto, Reparo Local.

  • KVM (Código fonte de exemplo)
  • AMTRedirection (Código fonte de exemplo)
  • RemoteControl (Código fonte de exemplo )
  • IMRGUI (Utilitário)
Informações adicionais sobre as funcionalidades associadas a este Caso de Uso podem ser encontradas na documentação html do Intel® AMT SDK. Faça o download e instale o SDK; abra o arquivo default.htm encontrado em ...\ DOCS\Implementation and Reference Guide\. Na aba "Contents" selecione "Intel® AMT Features".
Para obtener más información sobre las optimizaciones del compilador, consulte el aviso sobre la optimización.