«Временный сбой в разрешении имен» на только что созданном экземпляре AWS EC2

#amazon-web-services #amazon-ec2 #localhost #sudo #ubuntu-20.04

#amazon-web-services #amazon-ec2 #localhost #sudo #ubuntu-20.04

Вопрос:

Я новичок в AWS.

У меня была еще одна проблема с экземпляром, поэтому я решил удалить его и повторить шаги для создания нового:

  1. Определите пару ключей;
  2. Создайте стек из шаблона;
  3. Доступ к экземпляру с помощью ssh;
  4. Установите приложения, которые я хочу использовать.

Вот шаблон, который я использую

 Resources:
  AppNode:
    Type: AWS::EC2::Instance
    Properties:
      InstanceType: t2.nano
      ImageId: ami-06a719e5f8e22c33b
      KeyName: influxdb_example_3
      SecurityGroups:
        - !Ref AppNodeSG
      UserData: !Base64 |
        #!/bin/bash
        apt-get update -qq
        apt-get install -y apt-transport-https ca-certificates
        apt-key adv apt-key adv --keyserver hkp://p80.pool.sks-keyservers.net:80 --recv-keys 58118E89F3A912897C070ADBF76221572C52609D
        apt-get update -qq apt-get purge lxc-docker || true
        curl -fsSL https://download.docker.com/linux/ubuntu/gpg | apt-key add -
        add-apt-repository "deb [arch=amd65] https://download.docker.com/linux/ubuntu bionic stable"
        apt-get -y install linux-image-extra-$(uname -r) linux-image-extra-virtual
        apt-get -y install docker-ce
        usermod -aG docker unbuntu
        docker image pull quay.io/influxdb/influxdb:v2.0.2
        docker container run -p 80:9999 quay.io/influxdb/influxdb:v2.0.2
  AppNodeSG:
    Type: AWS::EC2::SecurityGroup
    Properties:
      GroupDescription: for the app nodes that allow ssh
      SecurityGroupIngress:
        - IpProtocol: tcp
          FromPort: "80"
          ToPort: "80"
          CidrIp: 0.0.0.0/0
        - IpProtocol: tcp
          FromPort: "22"
          ToPort: "22"
          CidrIp: 0.0.0.0/0
 

Вот как я создаю стек

 aws cloudformation create-stack 
  --stack-name influxdb-trial-stack-2 
  --region eu-central-1 
  --template-body file://$PWD/stack.yaml
 

И вот как я получаю к нему доступ:

 ssh -i influxdb_example_3.pem 
    ubuntu@ec2-18-159-XXX-XX.eu-central-1.compute.amazonaws.com
 

Мне удается создать стек / экземпляр и получить к нему доступ. Однако со второй попытки всякий раз, когда я пытаюсь что-либо сделать с sudo ним, он реагирует очень медленно, и я получил unable to resolve host ip-172-31-xx-xxx: Temporary failure in name resolution сообщение. Я уже трижды проделал эти шаги, но все всегда сводится к этому.

Ближайшая вещь, которую я нашел, была здесь: https://forums.aws.amazon.com/thread.jspa?threadID=132414 .

Исходя из этого, я вставил частный ip / dns etc/hosts , но это не помогло (хотя в нем говорится о «перезапуске сети». Это то же самое, что перезагрузка экземпляра?)

Я понимаю, что существуют различные ручные способы устранения этой проблемы, но, как и в первый раз, это сработало для меня, и, поскольку я предполагаю, что процесс создания стека происходит автоматически, я подозреваю, что есть какая-то конфигурация / кэш /??? проблема, о которой я не знаю.

Любые предложения приветствуются.

Комментарии:

1. Пока вы используете t2.nano (512 МБ 1vCPU), мне интересно, есть ли какие-либо проблемы с ресурсами? Я имею в виду, сколько оперативной памяти свободно и какова загрузка процессора? (или эта ошибка возникает только при вводе команды с использованием sudo ) Примечание: — Никогда не показывайте свой общедоступный DNS в вопросах StackOverflow (вы должны его замаскировать)

2. Спасибо за отзыв! Я перепробовал много вещей (в том числе с использованием более крупного экземпляра), но, похоже, что, возможно, AMI, на основе которого я создал экземпляр, имел некоторые внутренние проблемы. Я использовал канонический экземпляр Ubuntu, и это решило эту проблему.

Ответ №1:

Оказалось, что использование другого AMI решило проблему.

В моих вторых и последующих настройках использовался AMI, отличный от первого, просто я забыл об этом и даже не думал, что AMI может быть проблемой.

Комментарии:

1. Да, я видел, что вы не использовали Ubuntu AMI по умолчанию (предоставленный в quick start of eu-central-1), но этот AMI также является общедоступным имиджем.

Ответ №2:

Для тех, у кого возникли подобные проблемы с Ubuntu AMI или экземпляром, к которому ранее не удавалось подключиться, это может быть аппаратной проблемой.

У меня была такая же ошибка с экземпляром (и исключен предел поиска DNS). Через некоторое время я наткнулся на поток поддержки AWS, указывающий, что это может быть аппаратная проблема.

Похоже, что на физическом базовом хосте вашего экземпляра (i-3d124c6d) периодически возникали проблемы, некоторые из которых определенно привели бы к прерыванию обслуживания.

Не могли бы вы попробовать остановить и запустить этот экземпляр? Это приведет к тому, что он будет запущен на новом базовом оборудовании, а затем мы сможем использовать ваш сервис pingdom для проверки, если возникнут дополнительные проблемы.

от: https://forums.aws.amazon.com/thread.jspa?threadID=171805 .

Остановка и перезапуск экземпляра решили проблему для меня.