به گزارش خبرگزاری آنا؛ سرویسهای آنلاین و وبسایتهای پربازدید در سراسر جهان روز سهشنبه ۲۷ آبان ۱۴۰۴ با اختلال گستردهای مواجه شدند که ناشی از یک اشتباه فنی در شرکت زیرساختی کلادفلیر بود و برخلاف شایعات اولیه ارتباطی با حملات سایبری نداشت. متئو پرینس، مدیرعامل این شرکت، با بیان این موضوع که «این بار ما اینترنت را ناامید کردیم!»، ضمن پذیرش مسئولیت رویداد اعلام کرد که تغییر نادرست در سطوح دسترسی یک پایگاه داده، باعث تولید فایلهای سیستمی حجیم و توقف فعالیت سرورهایی شد که وظیفه مسیریابی ترافیک اینترنت را بر عهده دارند.
کاربران اینترنت در نقاط مختلف دنیا ساعت ۱۴:۵۰ به وقت ایران هنگام مراجعه به بسیاری از وبسایتها با پیامهای خطایی روبهرو شدند که نشان میداد سرور قادر به پاسخگویی نیست. کلودفلر که به عنوان یک واسط میان کاربران و وبسایتها عمل میکند، در این ساعت با مشکل پردازش اطلاعات روبهرو شد.
تیم فنی این شرکت ابتدا تصور میکرد که یک حمله سایبری سنگین از نوع DDoS در جریان است، اما گزارشهای بعدی مدعی بودند که مشکل از داخل سیستم نشات میگیرد. ریشه ماجرا تغییری بود که مهندسان کلودفلر روی سیستم مدیریت باتها یعنی همان نرمافزاری که تشخیص میدهد بازدیدکننده انسان است یا ربات، اعمال کرده بودند.
سیستمهای امنیتی کلودفلر برای تشخیص رباتهای مخرب به فایلی نیاز دارند که حاوی ویژگیها و مشخصات رفتاری رباتهاست. تغییر در تنظیمات پایگاه داده باعث شد اطلاعات تکراری وارد این فایل شود و حجم آن ناگهان به ۲ برابر حد معمول برسد. زمانی که این فایل سنگین به هزاران سرور کلودفلر در سراسر جهان ارسال شد، سرورها توانایی خواندن آن را نداشتند. حافظه سیستمها پر شد و نرمافزارهای اصلی با خطا مواجه شدند. این وضعیت شبیه به زمانی است که سعی کنید فایلی بسیار بزرگتر از ظرفیت رایانه خود را باز کنید؛ نتیجه آن قفل شدن سیستم و توقف عملکرد بود.
تیم مهندسی با شناسایی فایل معیوب، جلوی انتشار آن را گرفت و نسخه قدیمی و سالم فایل را جایگزین کرد. ترافیک اینترنت تا ساعت ۱۸:۰۰ به وقت ایران به حالت نیمهپایدار بازگشت و تمامی سرویسها تا ساعت ۲۰:۳۶ به طور کامل تعمیر شدند.
چگونه یک تغییر کوچک اینترنت را خاموش کرد؟
زیرساخت فنی کلودفلر بر اساس شبکهای از دیتابیسها به نام ClickHouse بنا شده است. مهندسان قصد داشتند امنیت و دسترسیها را در این دیتابیس بهبود ببخشند. آنها دستوری را اجرا کردند که به کاربران اجازه میداد جزئیات بیشتری از جداول اطلاعاتی را ببینند. مشکل اینجا بود که سیستم تولیدکننده فایلهای امنیتی، برای چنین تغییری آماده نبود.
دستور اجرا شده باعث شد سیستم به اشتباه اطلاعات زیرساختی را دو بار بخواند. در نتیجه، لیستی که باید به سرورها ارسال میشد، حاوی هزاران ردیف تکراری شد. هر سرور کلودفلر یک محدودیت مشخص برای حجم اطلاعاتی دارد که میتواند مشابه ظرفیت رم در گوشیهای موبایل در لحظه پردازش کند. وقتی فایل جدید که از حد مجاز سنگینتر بود به سرور رسید، نرمافزار مدیریت ترافیک نتوانست آن را در حافظه خود جای دهد و دچار فروپاشی شد.
نمودارهای منتشر شده نشان میدهد که دقیقاً در لحظه انتشار این فایل، میزان خطاهای سرور (Error ۵xx) به شدت افزایش یافت. از آنجایی که این فایل هر ۵ دقیقه یکبار بهروزرسانی میشد، شبکه دچار نوسان شد؛ گاهی فایل سالم میرسید و سایتها باز میشدند و گاهی فایل معیوب میرسید و دسترسی قطع میشد. این نوسان باعث شد تشخیص مشکل برای تیم فنی در دقایق اولیه دشوار شود.
اثر دومینو بر سرویسهای محبوب و ابزارهای داخلی
اختلال در کلودفلر فقط به معنای باز نشدن چند صفحه وب نبود. سرویسهای بزرگی که زیرساخت خود را به این شرکت سپردهاند، از دسترس خارج شدند. پلتفرمهای گفتگوی آنلاین مثل دیسکورد، ابزارهای هوش مصنوعی مانند چتجیپیتی و صرافیهای ارز دیجیتال مثل کوینبیس قادر به سرویسدهی نبودند.
مشکلات حتی دامنگیر ابزارهای داخلی خود کلودفلر شد. کارمندان و مشتریان این شرکت نمیتوانستند وارد پنلهای مدیریتی شوند، زیرا سیستم تشخیص هویت که جایگزین کپچا است، از کار افتاده بود. این موضوع باعث شد حتی صفحه وضعیت شبکه کلودفلر که باید خرابیها را گزارش دهد، خود با خطا مواجه شود و اطلاعات نادرست نمایش دهد.
چرا اینترنت مدرن تا این حد شکننده است؟
حادثه اخیر بار دیگر بحث تمرکزگرایی در اینترنت را داغ کرده است. سرویسهایی مانند کلودفلر که شبکه تحویل محتوا (CDN) نامیده میشوند، وظیفه دارند سرعت لود شدن سایتها را بالا ببرند و از آنها در برابر حملات محافظت کنند. اما وقتی بخش بزرگی از وبسایتهای جهان از یک سرویسدهنده واحد استفاده میکنند، یک خطای کوچک میتواند بخش عظیمی از اینترنت را فلج کند.
دادههای آماری وبسایت W۳Techs نشان میدهد که کلودفلر توسط درصد بسیار بالایی از وبسایتهای جهان استفاده میشود. این حجم از وابستگی باعث میشود که پایداری این شرکت برای اقتصاد دیجیتال حیاتی باشد. برای درک بهتر ضریب نفوذ این شرکت، میتوانید به آمار رسمی استفاده از فناوریهای وب در لینک زیر مراجعه کنید:
هزینههای سنگین خاموشی دیجیتال
خسارات ناشی از قطع دسترسی به اینترنت تنها به اعداد و ارقام لحظهای محدود نمیشود، بلکه میتواند سرنوشت یک کسبوکار را تغییر دهد. نگاهی به تاریخچه حوادث مشابه عمق فاجعه را نشان میدهد؛ به عنوان مثال شرکت اپل در یک قطعی ۱۲ ساعته ۲۵ میلیون دلار، فیسبوک در حادثهای ۱۴ ساعته حدود ۹۰ میلیون دلار و خطوط هوایی دلتا تنها در ۵ ساعت نزدیک به ۱۵۰ میلیون دلار زیان دیدند.
طبق گزارش موسسه گارتنر، میانگین هزینه هر دقیقه قطعی سرویس ۵۶۰۰ دلار برآورد شده بود که تحقیقات جدیدتر این رقم را تا ۹۰۰۰ دلار در دقیقه برای شرکتهای متوسط و بزرگ افزایش داده است. اما خطر اصلی در کمین کسبوکارهای نوپاست؛ در حالی که غولهای فناوری با حاشیههای سود کلان میتوانند طوفانهای مالی را پشت سر بگذارند، آمارهای نگرانکننده نشان میدهد که ۲۹ درصد از استارتاپها به دلیل تمام شدن نقدینگی شکست میخورند و یک حادثه سایبری بزرگ میتواند تیر خلاصی برای آنها باشد.
تحقیقات موسسه Ponemon ثابت کرده است که برخلاف تصور عموم، بیشترین هزینه تحمیل شده مربوط به از دست رفتن درآمد آنی نیست، بلکه اختلال در کسبوکار شامل خدشهدار شدن اعتبار برند، از دست رفتن اعتماد مشتریان و کاهش بهرهوری کارکنان، پرهزینهترین و مخربترین بخش ماجراست.
درسی برای آینده
مدیرعامل کلودفلر در بیانیه خود مدعی شد که این شرکت اقداماتی فوری برای جلوگیری از تکرار چنین حادثهای انجام داده است. مهمترین اقدام، سختگیری بیشتر در بررسی فایلهای تنظیمات است. از این پس، فایلهایی که توسط سیستمهای داخلی تولید میشوند، با همان دقتی بررسی خواهند شد که ورودیهای کاربران خارجی کنترل میشوند.
کلودفلر همچنین میگوید که قصد دارد مکانیزمهای قطع اضطراری را توسعه دهد تا در صورت بروز خطا در یک بخش خاص، بتوان آن بخش را بدون اینکه کل شبکه از کار بیفتد، غیرفعال کرد.
این حادثه یادآور شد که در دنیای پیچیده فناوری، حتی پیشرفتهترین سیستمها نیز ممکن است با یک خطای انسانی ساده دچار اختلال شوند. فراتر از یک چالش فنی، این رویداد زنگ خطری جدی درباره پدیده تمرکزگرایی در زیرساختهای شبکه جهانی بود. امروزه بخش عظیمی از ترافیک اینترنت از کانال تعداد انگشتشماری از شرکتهای واسط مانند کلودفلر یا AWS عبور میکند که نقش دروازهبانان دنیای دیجیتال را ایفا میکنند. وقتی یکی از این مجموعههای بزرگ با چالش جدی روبرو میشوند، اثر آن علاوه بر سرورهای خود شرکت، روی میلیونها کسبوکار، سرویسهای بانکی و سکوهای خدماتی که به زیرساخت آن تکیه کردهاند، منتقل میشود.
تصویری ترند در ردیت که شکنندگی اینترنت مدرن را به رخ میکشد: دنیایی عظیم که تعادلش تنها روی شانههای چند شرکت زیرساختی حفظ شده است.
این وابستگی شدید نشان میدهد که چگونه سقوط یک مجموعه بزرگ میتواند اثری دومینووار داشته باشد و مفهوم اینترنت را برای ساعاتی از معنا تهی کند. در چنین شرایطی، فقط دسترسی به یک وبسایت قطع نمیشود، بلکه زنجیرهای از تبادلات داده، تراکنشهای مالی و ارتباطات زیرساختی که همگی از یک نقطه واحد عبور میکنند، متوقف میشوند. این واقعیت اثبات میکند که در معماری مدرن وب، سلامت کل زیستبوم دیجیتال به طرز خطرناکی به پایداری چند شرکت محدود گره خورده است و یک اشتباه در پیکربندی آنها میتواند عملاً به مثابه کشیدن دوشاخه اینترنت جهانی عمل کند.
انتهای پیام/