Upload
cisco-russia
View
1.079
Download
1
Embed Size (px)
DESCRIPTION
Citation preview
Новейшие разработки в области технологий L2VPN
Алексей Митроничев Системный инженер-консультант
Содержание
• Flow Aware Transport Pseudowire • Отказоустойчивость L2VPN с применением MC-LAG • Отказоустойчивость L2VPN с технологией nV • Pseudowire Headend
FAT PW
Описание проблемы
• MPLS трафик проходит по одному пути • P узлы выполняют балансировку по сервисным PW меткам
• невозможно распределить трафик одного псевдопровода по разным путям
PE2 PE1 CE1 CE2
P1 P2
P3 P4
Решение
Payload Flow Label VC Label Tunnel Label L2
PE2 PE1 CE1 CE2
P1 P2
P3 P4
• Добавление специальной потоковой метки до сервисной метки PW
• Позволяет разбалансировать трафик одного псевдопровода по нескольким путям
http://datatracker.ietf.org/doc/draft-ietf-pwe3-fat-pw/
Сигнализация
• AToM/LDP сигнализирует возможности устройства по работе с потоковой меткой
• И PE вычисляет и вставляет потоковую метку • Egress PE удаляет потоковую метку • Формат Flow label sub-TLV
0 7 15 16 17 31
Flow Label ID Length T R Reserved
T=1,R=1 –> PE добавляет и удаляет flow label T=0,R=1 –> PE только удаляет flow label T=1,R=0 –> PE только добавляет flow label T=0,R=0 –> функция не включена Отсутствие sub-TLV в label mapping сообщении означает, что функция не поддерживается PE
Статическая конфигурация
1. T и R биты статически задаются на PE 2. Работающие комбинации
PE1 PE2
T = 1, R = 1 T = 1, R = 1 T = 1, R = 0 T = 0, R = 1 T = 0, R = 1 T = 1, R = 0 T = 0, R = 0 T = 0, R = 0
Реализация FAT-PW
1. 7600 (ES+ карты в ядро, SRE)
platform vfi load-balance-label vlan [vlan|vlan-vlan]
2. CRS1 (4.2.0) и ASR9000 (4.2.1)
L2vpn pw-class <class> encapsulation mpls load-balancing flow-label {dynamic|static} {both|dispose|impose} l2vpn bridge group <group> bridge-domain <domain> load-balancing flow-label {dynamic|static} {both|dispose|impose}
MC-LAG
Dual-home Access Node (DHD) подключается к двум NPE посредством протокола LACP (link aggregation control protocol)
– Режим работы Active/Standby в первой фазе внедрения
– Клиент (DHD) использует стандартный 802.3ad LAG и LACP и «думает» что подключен к одному устройству
ICCP – протокол по которому осуществляется согласование параметров LACP и приоритетов линков между NPE
LAG with LACP
ICCP
Virtual LACP Peer
DHD
Backup NPE
Primary NPE
Multi-chassis Link Aggregation ASR 9000 (4.0.0) Cisco 7600 (SRE)
Link Aggregation Control Protocol
• Системные параметры: – System MAC address: MAC адрес, уникально идентифицирующий коммутатор – System priority: определяет, на какой системе будет выбираться приоритет порта
• Параметры LAG: – Aggregator key: идентифицирует LAG внутри коммутатора – Maximum links per bundle: максимальное количество активных интерфейсов в LAG – для отказоустойчивых конфигураций – Minimum links per bundle: количество активных интерфейсов в LAG, при уменьшении которых LAG становится неактивным
Agg1
Agg2
Agg3
Agg4
Port #: 1, Priority: 10 Port #: 2, Priority: 11
Port #: 3, Priority: 5 Port #: 4, Priority: 6
Key: 10
Key: 20
Key: 10
Key: 35
System Priority: 5 System MAC: M1
System Priority: 3 System MAC: M2
Link Aggregation Control Protocol
• Параметры порта: – Port key: определяет, какие порты могут быть агргегированы в один интерфейс (локальное значение) – Port priority: определяет, какие порты будут в бандле, если общее кол-во работающих портов в LAG больше максимального для данного LAG – Port number: идентификатор порта в коммутаторе (локальное значение)
Agg1
Agg2
Agg3
Agg4
Port #: 1, Priority: 10 Port #: 2, Priority: 11
Port #: 3, Priority: 5 Port #: 4, Priority: 6
Key: 10
Key: 20
Key: 10
Key: 35
System Priority: 5 System MAC: M1
System Priority: 3 System MAC: M2
Расширение LACP: mLACP • mLACP использует ICCP для синхронизации LACP конфигурации и состояний между двумя коммутаторами PoA, для того чтобы DHD устройство воспринимало их как обычного LACP соседа
• Оба PoA используют один и тот же System MAC Address и System Priority при взаимодействии с DHD
• Для каждого PoA настраивается уникальный Node ID (значение от 0 до 7). Node ID + 8 формирует старшие разряды Port Number
• Для каждого LAG на всех интерфейсах конкретного POA Port Priority должен быть одинаковым
ICCP
DHD
PoA1
LACP PoA2
Node ID: 1
Node ID: 2
Port #: 0x9001, Port Priority 1
Port #:0xA001, Port Priority 2
System MAC: aaaa.bbbb.cccc
System Priority: 1
Компоненты mLAG
ICCP
Redundancy Group
DHD
Standby POA
Active POA
LACP
Virtual LACP Peer
Coupled or De-coupled L2 and L3 service
1
3 2
LACP (между DHD и парой PE) DHD и POA договариваются, какие линки будут активны, а какие – standby. Хотя бы один линк к active POA должен быть активным. Все линки к standby POA должны быть standby ICCP (между двумя POA) à обмен информацией и синхронизация состояния L2 & L3 сервис à LAG (саб-)интерфейс является точкой терминации сервиса. Состояние порта в группе LAG (active/standby) может определять статус сервиса (например, состояние PW – active/standby)
4 Механизм обнаружения неисправностей и переключения
Inter Chassis Communication Protocol
RG1
ICCP over Dedicated Link or shared Network
RG1
ICCP over Shared Network
RG2 ICCP работает между парой устройств формируя “redundancy group”. Допускается несколько таких групп на устройство
ICCP обеспечивает синхронизацию конфигурации и статуса LACP в группе
Все устройства в группе используют один и тот-же System MAC Address & System Priority в LACP
Драфт стандарта IETF[2] : draft-ietf-pwe3-iccp-02.txt
ICCP работает поверх T-LDP поверх TCP. Достаточно просто IP соединения.
Настройки MC-LAG
• System priority маршутизатора – настраивать выше(значение меньше) чем у DHD. Тогда именно маршрутизатор будет определять какие линки должны быть активными а какие standby
• Настраивается Non-revertive или revertive поведение для группы – Non-revertive означает что после восстановления основного активным остается резервный маршрутизатор
– Revertive - означает что после восстановления бандла на основном маршрутизаторе он и станет активным.
– Можно настроить таймер для задержки переключения • MC-LAC интерфейс обеспечивает EoMPLS, VPLS, L3 сервисы
Отработка отказов
Шаг 1 – активный PoA оценивает количество живый интерфейсов в LAG:
Если > M, ничего не делается If < M, переключение на второй PoA
Шаг 2A – активный PoA сообщает об отказе резервному PoA по ICCP
Шаг 2B – На DHD переключение происходи благодаря одному из механизмов
Dynamic Port Priority Mechanism: автоматическое изменение LACP Port Priority на активном PoA чтобы интерфейсы на резервном PoA были более приоритетными Brute-force Mechanism: изменение состояния интерфейсов на активном PoA в admin down
Шаг 3 – Резервный PoA и DHD поднимают резервные интерфейсы как в обычном LACP
Отказы портов/каналов ICCP DHD
Standby PoA
Active PoA
• Max Links в LAG: L • Min Links в LAG: M
L = 2
A B
C 1. Evaluate # of links
2A. Сигнализация отказа по ICCP
2B. Dynamic Port Priority или Brute-force failover
3. LACP Exchanges
Отработка отказов
Шаг 1A – Резервный PoA обнаруживает отказ основного PoA благодаря:
– IP Route-watch: потеря роутинговой информации о доступности – BFD: потеря BFD keepalive
Шаг 1B – DHD обнаруживает отказ на всех интерфейсах к основному PoA Шаг 2 – Резервный PoA и DHD активируют резервные интерфейсы как в обычно LACP
Отказ узла ICCP DHD
Standby PoA
Active PoA
1A. IP Route-Watch or BFD timeout
D 1B. Links Down
2. LACP Exchanges
Отработка отказов
Шаг 1 – Основной PoA обнаруживает отказ магистральных интерфейсов Шаг 2A – Основной PoA сигнализирует резервному PoA по ICCP о переключении Шаг 2B – Основной PoA использует либо Dynamic Port Priority или Brute-force Mechanism для сигнализации DHD о переключении Шаг 3 – Резервный PoA и DHD поднимают резервные интерфейсы как в обычном LACP
Изоляци PoA ICCP DHD
Standby PoA
Active PoA
E
1. Detect core isolation
2A. Signal failover over ICCP
2B. Dynamic Port Priority or Brute-force failover
3. LACP Exchanges
Интеграция mLACP с VPWS на магистрали
Прокладываются main/backup Pseudowires между парами NPE.
LDP пути выстраиваются для всех 4-х PW но 3 из них объявляются standby с той или с другой стороны и не используются для форвардинга
Состояние PW определяется attachment circuit “Active/Standby” (Coupled mode)
Используется только тот PW который объявлен Active с обоих сторон
В случае переключения – новый NPE сигнализирует новые состояния PW
S S
A A
LACP LACP ICCP ICCP
Standby POA-2
Active POA-3 Active POA-1
Standby POA-4
Active PW
Standby PW
Интеграция mLACP и VPLS
VPLS PW всегда UP и не связан с состоянием AC (Decoupled mode)
Форвардинг трафика осуществляется по MAC learning
В случае переключения новый NPE генерирует MAC withdrawal для VPLS домена
A
A
LACP ICCP
Standby POA
Active POA
L2 access
Link blocked by L2 redundancy protocol
VFI VFI
VFI VFI
Интеграция mLACP и H-VPLS
A
LACP ICCP
Standby POA
Active POA
Active PW
Standby PW
MPLS
A
VFI
VFI
BD
BD
VPLS PW всегда UP и не связан с состоянием AC (Decoupled mode)
Образуются два активных Pseudowire
В случае переключения новый NPE генерирует MAC withdrawal для VPLS домена
Active PW
Переключение на резервный NPE
• При потере связи с главным NPE: – ICC Heartbeat – IP Route watch – BFD
• При потере связи с магистралью – Мониторятся магистральные интерфейсы. Сбой сигнализируется по ICCP
• При потере AC (access circuit) – Если количество линков < Min-link cигнализируется сбой по ICCP – LACP fast-switchover ускоряет работу протокола
• При переключении отсылается MAC withdrawal – Re-learning in HW – millisecond time
Резервирование с помощью технологии nV
ASR 9000 nV Edge
Использование наработок IOS-XR CRS multi-chassis инфраструктуры
ASR 9000 nV Edge CRS Multi-Chassis
Fabric chassis
Единая плоскость управления, полностью распределенная плоскость передачи данных между двумя шасси ASR9000 единая виртуальная nV система Удвоение емкости устройства и упрощение механизмов отказоустойчивости
Обзор nV Edge Расширение канала управления EOBC (L1 или L2 соединение) Один или два 10G/1G с каждого RSP
Control plane EOBC extension is through special 1G or 10G EOBC ports on the RSP. External EOBC could be over dedicated L1 link, or over port-mode L2 connection
Data plane extension is through regular LC ports (it can even mix regular data ports and inter-chassis data plane ports on the same LC)
Doesn’t require dedicated fabric chassis flexible co-located or different location deployment, lower cost
Расширение EOBC 1G/10G ports на RSP
Active RSP Secondary
RSP
LC LC LC LC
0 Standby
RSP Secondary
RSP
LC LC LC LC
1
Каналы передачи данных между шасси (L1 соединение) 10G или 100 G бандлы (до 32 портов)
Обычные 10G или 100G порты
Внутренний EOBC
Отказоустойчивость плоскости управления
• Only one Active RSP, Only one standby RSP at a given time, which are located on two different chassis
– SSO/NSF/NSR works exactly the same way as two RSPs on the same chassis – Reliable out of band control channel between two chassis – IOS-XR control plan can tolerant hundreds of msec latency*, although the latency
can impact overall service convergence time • Virtual Chassis is always on as long as there is one chassis and one RSP alive
Active RSP Secondary
RSP
LC LC LC LC
0 Standby
RSP Secondary
RSP
LC LC LC LC
1
DSC Chassis Non DSC Chassis
Active control plane
Standby control plane
Standby RSP
Active RSP
Standby RSP
* Practically, recommend maximum 10msec latency between two chassis
Передача данных
• Inter-chassis data links simulate the switch fabric , which provide the data connection between two chassis. It has similar features as switch fabric, for example, fabric qos. Packet load balancing over inter-chassis links is same as regular link bundle: per-flow based
• Keep the existing IOS-XR two-stage forwarding model no forwarding architecture change for single chassis vs. nV Edge system
• In case of ECMP or link bundle paths cross two chassis, it prefer local port instead of load balancing packet to the other chassis. This is to reduce the inter-chassis link usage as much as possible. However, this feature (local rack preference) could be turn off by user CLI
• Only single Multicast copy is sent over inter-chassis link. Multicast replication is done on egress line cards and fabric on the local chassis
Active RSP Secondary
RSP
LC LC LC LC
0 Standby
RSP Secondary
RSP
LC LC LC LC
1
Эмуляция матрицы коммутации
Передача данных Двухстадийная коммутация IOS XR
Ingress LC
P2
P1
Data Plane
Look
up
1
Load
Bal
ance
Inter-
Chassis LC
P2
P1
Data Plane
Enc
apsu
latio
n
Egress LC
Data Plane
LOO
KU
P
Inter-Chassis LC
P2
P1
Data Plane
Enc
apsu
latio
n
Inter-Chassis LC
Data Plane
Dec
apsu
latio
n
P2
P1
Inter-Chassis LC
Data Plane
Dec
apsu
latio
n
P2
P1
P2
P1
2
3
3
4
4
5
Inte
r-C
hass
is L
ink
bund
le
Chassis 0 Chassis 1
Ingress Forwarding Lookup L2/L3/Mcast regular lookup Inter-Chassis Load Balance Load balance across multiple inter-chassis links
Inter-Chassis Encapsulation
Egress Forwarding Lookup L2/L3/Mcast regular lookup
1
2
3
4
5
Inter-Chassis Decapsulation
L3 ECMP
Active/active link bundle
Локальная коммутация более предпочтительна
Пакет будет передан через другое шасси, только если не обеспечен dual-homing
unicast multicast
Отказоустойчивость L2VPN
S S
A A
LACP
Standby
Active
Active PW
Standby PW
Standby
Active
LACP
Решение 1: MC-LAG + 2-way PW redundancy
Решение 2: ASR 9000 nV Edge
Active/standby MC-LAG bandwidth inefficiency 4 PWs with 3 standby control plane overhead PW failover time depends on the number of PWs slow convergence Require additional state sync (for example, IGMP Snooping table) to speed up service convergence complex
Active/active regular LAG Single PW Link/Node failure is protected by LAG, PW is even not aware super fast convergence State sync naturally Simple, fast: 50msec convergence independent of PW scale
Pseudowire Headend
• Задача: обеспечить L3 взаимодействие между CE и сервисным PE • Сеть доступа/агрегации обеспечивает проброс L2 фреймов до сервисного PE
Обзор решения
Интерфейс PW headend
• PW headend – обычный L3 интерфейс
• Поддержка фич, стандартных для L3 интерфейсов: Qos, ACL, статистика
• Поддержка протоколов маршрутизации
• Если PW перестает работать, то PW-HE интерфейс ему соответствующий переходит в состояние down
Physical In,
PW L3
S-PE
Physical In,
Конфигурация PW headend
• Терминация псевдопровода в VRF interface pw-ether 1 vrf foo
ipv4 address 100.10.10.1 255.255.255.0
service-policy input PW_in
service-policy output PW_out
Спасибо! Просим Вас заполнить анкеты. Ваше мнение очень важно для вас.