Akamai Diversity

Akamai 블로그

인터넷 트래픽의 큰 물결

신종 코로나바이러스와 그로 인한 바이러스 호흡기 질환(COVID-19)이 세상을 바꾸고 있습니다. 전 세계 사람들이 최대한 사회적 거리를 유지하고 있습니다. 많은 사람들이 대부분 태어나서 처음으로 원격 근무를 하고 있습니다. Akamai의 관점에서 살펴봤을 때 이런 새로운 현상으로 인해 3월 인터넷 트래픽이 30% 증가했습니다. 많은 사람들은 웹(Web)이 붕괴하는 것은 아닌지 궁금해합니다. 답은 "아니요"입니다. 

Akamai CEO 톰 레이튼 박사(Dr. Tom Leighton)는 다음과 같이 말했습니다.

Akamai는 전 세계적으로 분산된 인텔리전트 엣지 플랫폼을 운영하며 137여 국가의 4천개 지역에서 27만여 대의 서버를 보유하고 있습니다. Akamai는 지난 한 달 동안 글로벌 인터넷 트래픽이 약 30% 증가한 것으로 보고 있습니다. 이는 평균적인 수준의 약 10배입니다. 1년 동안의 인터넷 트래픽 증가분이 단 몇 주 만에 증가한 것입니다. 이는 COVID-19가 발생하기 전에 지속적으로 신기록을 수립했던 라이브 스포츠 스트리밍을 포함하지 않은 수치입니다. 

우리는 인터넷을 하나의 독립된 '개체(entity)'라고 생각하지만 실제로는 그렇지 않습니다. 처음부터 인터넷은 수많은 작은 네트워크로 구성되었습니다. 특정 종류의 트래픽이 증가하거나 하나의 네트워크에서 발생하는 트래픽이 증가한 것이 아니라 거의 모든 측면에서 Akamai가 1년 동안 관측하는 트래픽이 한 달 사이에 발생했습니다. 여러 분야에서 트래픽이 증가하면서 하나의 거대한 트래픽 물결을 만들었고 이 중 대부분의 트래픽은 소프트웨어 다운로드로부터 발생했습니다.

국가 단위의 트래픽 검사를 통해 COVID-19에 대한 우려와 격리 조치 실행이 트래픽 증가에 상당한 영향을 미쳤다는 것을 알 수 있었습니다. 여러가지 종류의 트래픽이 증가하면서 글로벌 트래픽 규모에 영향을 끼친 것과 마찬가지로 국가 단위의 변화는 해당 국가와 지역의 트래픽에 영향을 끼칠 수 있습니다.

3월의 폭발적인 트래픽 증가는 인상적이었습니다. 앞으로도 비슷한 증가세가 계속될 것인지는 지켜봐야 합니다. 미디어 기업들은 트래픽을 줄이기 위한 조치를 취하고 있으며 SD(standard definition) 스트리밍을 디폴트로 설정합니다. Akamai는 트래픽이 적은 시간대를 활용해 다운로드를 진행하고 게임 및 기타 소프트웨어 다운로드를 패치할 때 받는 영향을 제한하기 위해 Sony 및 Microsoft와 같은 파트너와 협력하고 있습니다. 트래픽이 급증하면서 발생하는 어려움들이 있지만 Akamai는 변화에 잘 대응해 나가고 있습니다.

앞으로 몇 주 동안 Akamai 데이터에서 관측한 내용을 중심으로 몇 차례 게시물을 올릴 계획입니다. 이번 게시물에서는 격리 조치와 가정에서의 주문이 인터넷 소비에 미치는 영향을 국가 단위로 설명합니다.


이탈리아 

이탈리아는 유럽 연합 중 처음으로 격리 조치를 실시한 나라인데 다른 국가들과 비교했을 때 상대적으로 트래픽이 크게 증가하지 않았습니다. 그림 1에서 보는 것처럼 시간당 트래픽 규모가 표시되고 선은 해당 국가의 일별 평균 트래픽 규모를 말해줍니다. 그래프 이면의 데이터 과학에 대한 자세한 정보는 이 게시물의 끝에 있는 Behind the Scenes을 확인하시기 바랍니다.

이탈리아의 일일 트래픽은 1주일 동안 급격히 증가했습니다. 2월 평균 트래픽 수준에 비해 75% 증가했고 3월 14일 최고치를 기록했습니다. 이후 서서히 감소하기 시작해 4월 3일에 2월 평균 대비 트래픽 증가률이 10% 미만으로 하락합니다. Akamai가 조사한 대부분의 국가에서 초기에 트래픽이 급증하다가 이 후 몇 주 동안 트래픽이 서서히 감소하는 현상이 나타났습니다. 이탈리아가 약간 다른 이유는 격리 조치가 발효되기 전에는 트래픽이 증가하기 시작하지 않았다는 것인데 이는 주말 트래픽 패턴 때문일 수도 있습니다.


그림 1: 이탈리아 인터넷 트래픽이 초기에 증가하다 주말에 감소하는 모습

팬데믹으로 인한 트래픽 절감 요인 중 하나는 스트리밍 미디어 이벤트나 게임 출시와는 달리 특정 시간대 또는 서비스에 트래픽이 집중되지 않았다는 점입니다. 여러 지역에서 동시에 동일한 콘텐츠를 다운로드하려는 경우 속도 저하의 영향이 증폭되는 것을 볼 수 있습니다. 반면 이번에는 트래픽이 여러 시간대와 콘텐츠에 걸쳐 균일하게 분산되었기 때문에 인터넷 트래픽 변화에 보다 유연하게 대처할 수 있었습니다. 트래픽이 동시에 급증하는 것이 아니라 파도처럼 오기 때문에 인터넷이 계속 작동할 것이라는 확신을 주고 있습니다. 

 

폴란드

폴란드는 2020 3 13 격리 조치를 실시했고 다른 유럽 지역과 유사한 트래픽 패턴을 보였습니다. 폴란드가 격리 조치를 시행하기 3 전에 Akamai 폴란드로 들어오는 데이터 사용량이 가파르게 증가하다가 점차 감소하는 모습을 있었습니다. 그림 2 표시된 바와 같이, 폴란드에서 Akamai 처리한 인터넷 트래픽은 2020 2 대비 75% 넘게 증가하며 최고치를 기록했고 이후 4 초에는 2 평균 대비 증가률이 15% 미만으로 하락했습니다.


그림 2: 격리가 시작된 후 며칠 동안의 정착 과정에서 나타나는 트래픽 급증

분석을 복잡하게 만든 요인 중 하나는 특정 지역이 아니라 글로벌하게 몇 차례 트래픽이 폭증했다는 것입니다. 2020년 3월 3일 한 인기 있는 게임의 소프트웨어 업데이트로 인해 Akamai 트래픽은 최고점을 찍었습니다. 3월 10일에는 유럽 축구를 스트리밍하고 다수의 패치를 진행하면서 167Tbps라는 신기록을 수립했습니다. 격리 조치가 실시되기 전에 며칠 전에 트래픽이 급증하기 시작했는데 이런 이벤트와 관련이 있는지는 확실치 않습니다.

스페인

격리가 실시된 기간을 중심으로 스페인의 트래픽을 살펴보면 격리 조치와 대역폭 사용량 사이의 상관 관계가 분명히 드러납니다. 스페인에서 격리 조치가 실시된 3월 14일 무렵에는 이렇다 할 글로벌 이벤트가 없었습니다. 이는 거의 120%의 트래픽 증가가 분명히 격리 명령과 관련이 있다는 것을 의미합니다. 주말에는 대부분 트래픽이 크게 감소하기 때문에 그림 3에서 보는 것처럼 증가세가 더욱 두드러집니다.


그림 3: 폴란드 및 유럽의 다른 지역과 유사한 스페인의 트래픽 패턴


다행히 게임 패치를 트래픽 규모가 적은 시간대에 진행하고 스트리밍 서비스가 기본적으로 SD 화질로 설정되면서 초기의 트래픽 수요가 점차 감소하고 있는 모습입니다. 2월 평균보다 20~30% 높은 수준을 상회하는 것이 새로운 현실이 되었는데 이는 스페인 트래픽이 크게 증가한 것입니다.


결론

인터넷의 핵심 인프라는 스트레스를 받고 있습니다. 특히 전 세계적으로 격리 조치가 실시된 이후 며칠 동안 이런 현상이 뚜렷하게 나타났습니다. 국가 또는 지역별로 대응하는 방법에 차이가 있고 이런 엇갈린 반응이 완벽한 해결책은 아닙니다. 하지만 이로 인해 전 세계적으로 전례 없는 변화에 대응할 수 있는 기회를 갖게 되었습니다.

국가 단위에서 트래픽 급증이 조정되기는 했지만 총 트래픽은 같은 날 릴리스된 소프트웨어 패치와 인기 있는 스트리밍 이벤트보다 높지 않았습니다.

또한, 초기 트래픽이 급증한 후 점차 감소하는 모습을 보면서 우리가 예상하는 것보다 최소 15~30% 더 높은 트래픽에 맞춰 준비해야 한다는 것도 알게 되었습니다. 1년 간 증가하는 트래픽이 1달 동안 증가하면서 어려움도 커졌습니다. 하지만 적어도 인터넷에서는 치명적인 사건은 아닙니다. 인터넷의 물결은 항상 상승하지만 거대한 파도가 지나가고 난 지금은 적어도 잠깐의 휴식을 취할 수 있습니다.

다음에는 COVID-19가 미국 전체와 각 주에 어떤 영향을 끼쳤는지 분석할 계획입니다.
다시 뵙도록 하겠습니다.


Behind the scenes

이 섹션은 주로 데이터 과학 및 시각화의 세부 정보에 관심 있는 사람들을 대상으로 합니다.

위의 플롯(plot)은 네트워크 아키텍처(Network Architecture)의 약어인 Netarch라는 Akamai 내부 툴의 데이터를 사용하여 개발되었습니다. 이는 Akamai 내에서 가장 권위 있는 데이터 소스로 간주되지만 속도를 중요하게 생각하면 정확도를 놓치게 됩니다. 따라서 저희는 가능한 빨리 블로그 게시물을 올리는 것이 아니라 보다 장기적인 트렌트를 조사하기로 결정했습니다.

이 플롯은 웹페이지를 구축하는 데 필요한 비교적 작은 코드에서부터 스트리밍 및 소프트웨어 다운로드를 위한 매우 까다로운 트래픽에 이르기까지 Akamai가 모든 종류의 트래픽을 전송하기 위해 사용하는 솔루션 전반에 걸쳐 트래픽을 살펴봅니다. 플롯의 복잡성과 플롯을 생성하는 코드를 줄이기 위해 트래픽 종류에 따라 차별화하지 않기로 결정했습니다. 모든 코드는 R로 작성되었으며 gggplot의 역량에 따라 크게 달라집니다.

입력 데이터에는 국가별 시간당 평균 트래픽 수준이 기본 데이터 포인트로 포함되어 있습니다. 이를 통해 각 국가의 일일 평균을 추정할 수 있었습니다. 각 국가의 2월 한 달 동안 평균 일일 트래픽을 오버/언더 플롯의 기준선으로 사용했습니다. 절대 트래픽 수와 규모는 외부에 공개할 수 없으며 지역 플롯에 대한 Y축은 비워놔야 합니다.

마지막으로 정시에 기록합니다. 일관성을 유지하기 위해 모든 플롯에서 매주 월요일에 시작하여 일요일에 종료하는 것을 디폴트로 설정했습니다. 이를 통해 'Week 13'(3월 24일~29일)을 일관되게 비교할 수 있습니다. 이는 SQL 로직에 따라 해당 연도의 첫 번째 주가 12월 30일에 시작된다는 것을 의미합니다. 모든 시간은 UTC로 유럽 지도에는 거의 영향을 주지 않지만 제대로 고려하지 않을 경우 미주 및 아시아 지도를 왜곡되는 것으로 보입니다. 시간대를 적절하게 매핑하는 데 필요한 계산을 수행하는 것은 이 프로젝트의 범위를 훨씬 넘어서는 것이었습니다.