آیا فیسبوک هم از کار می‌افتد؟

در 4 اکتبر 2021، ناگهان دسترسی تمام کاربران از سراسر دنیا به فیسبوک، اینستاگرام و واتس‌اپ قطع شد. این مشکل سبب از کار افتادن اپلیکیشن‌های این سه شبکه اجتماعی معروف شد. اما برای همه سوال بود که چه اتفاقی افتاده است؟

 کاربران مدام اینترنت گوشی خود را بررسی می‌کردند و با  سر زدن به سایر شبکه‌های اجتماعی مثل توئیتر به دنبال خبری در مورد این مشکل می‌گشتند. البته احتمالا تعدادی از کاربران اطلاع ندارند که هر سه شبکه فیسبوک، اینستاگرام و واتس‌اپ، متعلق به شرکت فیسبوک هستند. 

در بررسی‌های اولیه مشخص شد که جستجوی DNS فیسبوک، SERVFAIL را باز می‌گرداند و IPهای شرکت نیز از دسترس خارج شده بودند.

گویی شخصی کابل‌ها را از مراکز داده بیرون کشیده و اتصال آنها به اینترنت را  قطع کرده بود. ابتدا به نظر می‌رسید که این قطع دسترسی ناشی از مشکل DNS  و BGP باشد، اما بعد مشخص شد که مشکل پیش آمده، ناشی از یک به‌روزرسانی و در نتیجه تغییر تنظیمات بود که روی تمام backbone اینترنت اثر گذاشت. به همین دلیل امکان ارسال IPهای فیسبوک برای سایر BGPها نبود و حتی مهندسان خود فیسبوک هم امکان دسترسی از راه دور برای حل این مشکل را نداشتند. 

ظاهرا دسترسی‌های کارمندان برای ورود به محل مرکز داده هم با مشکل مواجه شده بود و کارمندان محدود حاضر در مرکز داده هم، دسترسی لازم برای اصلاح این مشکل را نداشتند. به همین دلایل، حل این مسئله زمان‌بر شد.

معرفی BGP

بد نیست از این فرصت استفاده کرده و BGP را بهتر بشناسیم. پروتکل دروازه مرزی یا BGP مخفف Border Gateway Protocol، مکانیزمی برای تبادل اطلاعات مسیریابی بین سیستم‌های مستقل در اینترنت است.

اینترنت به‌معنای واقعی کلمه؛ شبکه‌ای از شبکه‌هاست که توسط BGP به هم متصل می‌شوند. BGP به یک شبکه (مانند فیسبوک) اجازه می‌دهد که حضور خود را در شبکه‌های دیگر -که باعث شکل دادن اینترنت می‌شود-، اعلام کنند. هنگامی که فیسبوک حضور خود را اعلام نکند، ISPها و سایر شبکه‌ها نمی‌توانند آنرا پیدا کنند و در نتیجه از دسترس خارج خواهد شد.

هریک از شبکه‌های شخصی دارای یک ASN (شماره سیستم مستقل یا خودگردان) هستند. یک سیستم خودگردان(AS) یک شبکه خصوصی با یک سیاست مسیریابی داخلی یکپارچه است. AS می‌تواند پیشوندهایی را برای کنترل آدرس‌های IP و همچنین پیشوندهای انتقال (ترانزیت) برای دسترسی به گروه‌ مشخصی از IPها ایجاد کند.

هر ASN باید مسیرهای پیشوند خود را از طریق BGP به اینترنت اعلام کند. 

برای انتخاب سرویس مناسب راهنمایی لازم دارید؟

تیم پشتیبانی ما این توانایی را دارند که در تمامی مراحل انتخاب محصول، طراحی راهکار و مهاجرت، شما را همراهی کنند.

اگر در انتخاب راهکار یا نحوه مهاجرت به اپیک سوالی دارید با مشاوران ما مطرح کنید.

مقایسه قابلیت‌های سرویس ایمیل ابری و ایمیل نصب در محل

در حال حاضر هر دو محصول اپیک و توکا در حال ارائه خدمات ایمیل سازمانی به مشتریان معتبر و بزرگ کشور هستند. مقایسه تفاوت‌ها و امتیازات هر دو محصول اپیک و توکا، به شما کمک می‌کند راهکاری متناسب با نیاز خود انتخاب کنید.
برای مقایسه این دو محصول؛ تفاوت‌های کلیدی سرویس ایمیل نصب در محل یا On-Premise توکا در مقابل سرویس ابری یا Cloud اپیک از جنبه‌های مختلف ارائه شده است.

مروری بر BGP و ASN و نحوه کارکرد آنها:

در این نمودار شش سیستم خودگردان در اینترنت و دو مسیر موجود برای دسترسی و ارسال پکت بین نقطه شروع و پایان را مشاهده می‌کنید.

 AS1 → AS2 → AS3 سریع‌ترین و AS1 → AS6 → AS5 → AS4 → AS3 کندترین مسیر هستند اما در صورت عدم موفقیت اولی می‌توان از دومی استفاده کرد.

انتقال اطلاعات در اینترنت از دو مسیر مختلف

اتفاقی که در فیسبوک افتاد این بود که در ساعت 16:58 UTC (ساعت هماهنگ جهانی) سرورهای DNS فیسبوک در دسترس نبودند و درخواست‌های جستجوی IP، سایت facebook.com یا instagram.com با شکست مواجه می‌شد.

لاگ از کار افتادن فیسبوک

در همین‌حال سایر آدرس‌های IP فیسبوک مسیریابی (هدایت) می‌شدند اما کاربرد چندانی نداشت زیرا بدون DNS عملا فیسبوک و خدمات مرتبط در دسترس نبودند.

لاگ از کار افتادن سرورهای فیسبوک

یک پیام بروزرسانی BGP، روتر را از هرگونه تغییری که در پیشوند ایجاد شده یا پیشوند را بطور کلی حذف کرده باشد، مطلع می‌کند. در نمودار زیر که مربوط به سرویس DNS کلاودفلر است، تعداد بروزرسانی‌هایی که از فیسبوک ارسال شده است دیده می‌شود. 

همانطور که مشاهده می‌کنید، این نمودار نسبتا آرام است زیرا فیسبوک دقیقه به دقیقه تغییرات زیادی در شبکه خود ایجاد نمی‌کند. ولی در حوالی ساعت 15:40 UTC تغییراتی در این نمودار ظاهر شده است و عملا از همان موقع، مشکل دسترسی به فیسبوک شروع شد.

گزارش وضعیت شبکه در زمان از کار افتادن فیسبوک

تحت تاثیر قرارگرفتن DNS

پس از این تغییر در تنظیمات، ریزالورهای DNS، در سراسر جهان تفکیک نام دامنه خود را متوقف کردند.

لاگ از کار افتادن فیسبوک

DNS مانند بسیاری از سیستم‌های دیگر در اینترنت، مکانیزم مسیریابی مختص به خودش را دارد. 

وقتی شخصی آدرس https://facebook.com را در مرورگر خود تایپ می‌کند، ریزالور DNS که مسئول ترجمه نام دامنه به آدرس‌ واقعی IP است، ابتدا بررسی می‌کند که آیا چیزی در حافظه پنهان خود دارد که از آن استفاده کند، در غیراینصورت سعی می‌کند پاسخ را از سرورهای DNS بگیرد. اگر سرورهای نام غیرقابل دسترسی باشند یا بدلایلی پاسخ ندهند، SERVFAIL بازگردانده می‌شود و مرورگر خطایی را به کاربر ارسال می‌کند.

فیسبوک اطلاع‌رسانی مسیرهای پیشوند DNS خود از طریق BGP را متوقف کرد و ریزالورهای DNS هیچ راهی برای اتصال به سرورهای نام خود نداشتند. در نتیجه  ریزالورهای DNS شروع به انتشار و ذخیره‌سازی پاسخ‌های SERVFAIL کردند.

اما این همه ماجرا نبود و این خطای دسترسی سبب ایجاد یک سونامی از ترافیک DNS اضافه شد. زیرا برنامه‌ها و اپ‌ها، زمانی که با خطای دسترسی روبرو می‌شوند، متوقف نمی‌شوند و بصورت مکرر درخواست دسترسی می‌فرستند. در نتیجه بصورت بالقوه باعث ایجاد بار  ترافیکی روی سرورهای DNS و در نتیجه تاخیر در پاسخ به سایر درخواست‌ها می‌شوند.

تحت‌تاثیر قرارگرفتن سایر شبکه‌های اجتماعی از ماجرای ناپدید شدن فیسبوک

کاربران پس از این اتفاق؛ سراغ سایر شبکه‌های اجتماعی آمدند و آمارهای بدست آمده نشان دهنده افزایش درخواست‌های DNS در توئیتر، سیگنال و سایر پیام‌رسان‌ها و شبکه‌های اجتماعی است.

افزایش مراجعه با توییتر در زمان قطعی فیسبوک

رویدادی که اتفاق افتاد یادآور این نکته است که اینترنت یک سیستم پیچیده و وابسته به میلیون‌ها سیستم و پروتکل دیگر است که با یکدیگر کار می‌کنند. این اعتماد، استاندارد سازی و همکاری بین نهادها برای تقریبا پنج میلیارد کاربر فعال در سراسر جهان برقرار است.

بروزرسانی

حدود ساعت 21 بوقت UTC شاهد فعالیت مجدد BGP از شبکه فیسبوک بودیم که در ساعت 21:17 UTC به اوج خود رسید.

فعال شدن مجدد فیسبوک

این نمودار در دسترس بودن نام DNS سایت  facebook.com را در کلودفلر DNS ریزالور 1.1.1.1 نشان می‌دهد. ساعت 15:50 UTC از دسترس خارج شد و ساعت 21:20بوقت UTC در دسترس قرار گرفت.

بازگشت دوباره فیسبوک به اینترنت

اینستاگرام و پیام‌رسان واتساپ به زمان بیشتری نیاز داشتند تا در دسترس قرار بگیرند اما در ساعت 21:28بوقت UTC فیسبوک به اینترنت جهانی متصل شد و DNS مجدد کار می‌کند.