Пропустить навигацию.
Главная страница
Мы всегда на стороне КЛИЕНТА!

ESX3i и 3Com 996-SX aka Broadcom BCM5701

|

Разобрался наконец с трудноуловимым багом в ESX3i.

Имеем сервер HP ML150 G2 с двумя сетевыми адаптерами:

  • Broadcom BCM 5721, на motherboard, имеющий интерфейс 1000BaseT, подключенный к 100BaseT порту,
  • отдельный 3Com 996-SX на чипе Broadcom BCM 5701, имеющий интерфейс 1000BaseSX, по нему же и подключенный.

Изначально первый адаптер использовался для подключения сервера к управляющей сети, а второй в режиме VST с пробросом через него нескольких VLAN, для основного подключения к сетевой инфраструктуре.

Баг был в следующем – достаточно часто клиенты жаловались на потери соединений с виртуальными машинами. Особенно это досаждало при работе с терминальным сервером. В журналах как гостевых OS, так и самого ESX никаких следов не обнаруживалось.

Замечена была корреляция по нагрузке на сервер и частотой ошибок. При переводе всего трафика виртуальных машин на первый интерфейс потери соединений пропали. Так удалось локализовать ошибку.

Попытки гуглить на тему 3Com 996 и ESX ни к чему не привели. Битых пакетов esx-info –n тоже видно не было. Попытки поменять настройки порта физического коммутатора на типа Flow Control, STP и других также не увенчались успехом.

Зато гугление по Broadcom 5701 и ESX3 привело к искомому результату - VMware KB. По всем внешним признакам выглядело, как описано в VMware KB.

To address this issue, choose another type of network adapter. In general, do not use the Broadcom 5700 Rev 14 and 5701 Rev 15 because they do not sustain heavy traffic well.

В двух словах содержание workaroud - выбросите ваш адаптер, ну или как минимум не используйте вместе с ESX 3.x

В результате, приходится следовать рекомендациям VMware. От себя добавлю, что ранее на этом же серврере стояла комбинация Centos 4.3 + VMware Server 1.0.3, сетевой интерфейс работал без нареканий. Около двух лет.

UPD.

Пока я готовил заметку – KB лег. В качестве альтернативы можно посмотреть здесь.

UPD.

Поиск продалжается - здесь написано, что этот адаптер поддерживается. Правда список неофициальный. Может быть имеет значение Revision?

UPD.

Не у меня одного такая проблема. Подтверждение - здесь. Но ответа так и нет. Для простоты будем считать, что не контроллер работает.