شناسهٔ خبر: 75916875 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: آنا | لینک خبر

آناتک دلیل این اتفاق را بررسی می‌کند

خطای انسانی در تنظیمات کلودفلر دسترسی جهانی به اینترنت را مسدود کرد

متئو پرینس، مدیرعامل کلودفلر، ضمن رد احتمال حمله سایبری در خصوص اختلال روز ۲۷ آبان، مدعی شد که خطای انسانی در پیکربندی سیستم مدیریت بات‌ها باعث مختل شدن دسترسی به سرویس‌های مهم جهانی شده است. این اشتباه فنی که با تغییر نادرست مجوزهای پایگاه داده منجر به تولید فایل‌های سیستمی فراتر از ظرفیت حافظه سرورها شد، زیرساخت‌های ابری این شرکت را از کار انداخت و دسترسی کاربران به هزاران وب‌سایت و سرویس آنلاین را برای چندین ساعت مسدود کرد.

صاحب‌خبر -

به گزارش خبرگزاری آنا؛ سرویس‌های آنلاین و وب‌سایت‌های پربازدید در سراسر جهان روز سه‌شنبه ۲۷ آبان ۱۴۰۴ با اختلال گسترده‌ای مواجه شدند که ناشی از یک اشتباه فنی در شرکت زیرساختی کلادفلیر بود و برخلاف شایعات اولیه ارتباطی با حملات سایبری نداشت. متئو پرینس، مدیرعامل این شرکت، با بیان این موضوع که «این بار ما اینترنت را ناامید کردیم!»، ضمن پذیرش مسئولیت رویداد اعلام کرد که تغییر نادرست در سطوح دسترسی یک پایگاه داده، باعث تولید فایل‌های سیستمی حجیم و توقف فعالیت سرورهایی شد که وظیفه مسیریابی ترافیک اینترنت را بر عهده دارند.

کاربران اینترنت در نقاط مختلف دنیا ساعت ۱۴:۵۰ به وقت ایران هنگام مراجعه به بسیاری از وب‌سایت‌ها با پیام‌های خطایی رو‌به‌رو شدند که نشان می‌داد سرور قادر به پاسخگویی نیست. کلودفلر که به عنوان یک واسط میان کاربران و وب‌سایت‌ها عمل می‌کند، در این ساعت با مشکل پردازش اطلاعات رو‌به‌رو شد.

تیم فنی این شرکت ابتدا تصور می‌کرد که یک حمله سایبری سنگین از نوع DDoS در جریان است، اما گزارش‌های بعدی مدعی بودند که مشکل از داخل سیستم نشات می‌گیرد. ریشه ماجرا تغییری بود که مهندسان کلودفلر روی سیستم مدیریت بات‌ها یعنی همان نرم‌افزاری که تشخیص می‌دهد بازدیدکننده انسان است یا ربات، اعمال کرده بودند.

سیستم‌های امنیتی کلودفلر برای تشخیص ربات‌های مخرب به فایلی نیاز دارند که حاوی ویژگی‌ها و مشخصات رفتاری ربات‌هاست. تغییر در تنظیمات پایگاه داده باعث شد اطلاعات تکراری وارد این فایل شود و حجم آن ناگهان به ۲ برابر حد معمول برسد. زمانی که این فایل سنگین به هزاران سرور کلودفلر در سراسر جهان ارسال شد، سرور‌ها توانایی خواندن آن را نداشتند. حافظه سیستم‌ها پر شد و نرم‌افزار‌های اصلی با خطا مواجه شدند. این وضعیت شبیه به زمانی است که سعی کنید فایلی بسیار بزرگتر از ظرفیت رایانه خود را باز کنید؛ نتیجه آن قفل شدن سیستم و توقف عملکرد بود.

تیم مهندسی با شناسایی فایل معیوب، جلوی انتشار آن را گرفت و نسخه قدیمی و سالم فایل را جایگزین کرد. ترافیک اینترنت تا ساعت ۱۸:۰۰ به وقت ایران به حالت نیمه‌پایدار بازگشت و تمامی سرویس‌ها تا ساعت ۲۰:۳۶ به طور کامل تعمیر شدند.

چگونه یک تغییر کوچک اینترنت را خاموش کرد؟

زیرساخت فنی کلودفلر بر اساس شبکه‌ای از دیتابیس‌ها به نام ClickHouse بنا شده است. مهندسان قصد داشتند امنیت و دسترسی‌ها را در این دیتابیس بهبود ببخشند. آن‌ها دستوری را اجرا کردند که به کاربران اجازه می‌داد جزئیات بیشتری از جداول اطلاعاتی را ببینند. مشکل اینجا بود که سیستم تولیدکننده فایل‌های امنیتی، برای چنین تغییری آماده نبود.

دستور اجرا شده باعث شد سیستم به اشتباه اطلاعات زیرساختی را دو بار بخواند. در نتیجه، لیستی که باید به سرور‌ها ارسال می‌شد، حاوی هزاران ردیف تکراری شد. هر سرور کلودفلر یک محدودیت مشخص برای حجم اطلاعاتی دارد که می‌تواند مشابه ظرفیت رم در گوشی‌های موبایل در لحظه پردازش کند. وقتی فایل جدید که از حد مجاز سنگین‌تر بود به سرور رسید، نرم‌افزار مدیریت ترافیک نتوانست آن را در حافظه خود جای دهد و دچار فروپاشی شد.

نمودار‌های منتشر شده نشان می‌دهد که دقیقاً در لحظه انتشار این فایل، میزان خطا‌های سرور (Error ۵xx) به شدت افزایش یافت. از آنجایی که این فایل هر ۵ دقیقه یک‌بار به‌روزرسانی می‌شد، شبکه دچار نوسان شد؛ گاهی فایل سالم می‌رسید و سایت‌ها باز می‌شدند و گاهی فایل معیوب می‌رسید و دسترسی قطع می‌شد. این نوسان باعث شد تشخیص مشکل برای تیم فنی در دقایق اولیه دشوار شود.

اثر دومینو بر سرویس‌های محبوب و ابزار‌های داخلی

اختلال در کلودفلر فقط به معنای باز نشدن چند صفحه وب نبود. سرویس‌های بزرگی که زیرساخت خود را به این شرکت سپرده‌اند، از دسترس خارج شدند. پلتفرم‌های گفتگوی آنلاین مثل دیسکورد، ابزار‌های هوش مصنوعی مانند چت‌جی‌پی‌تی و صرافی‌های ارز دیجیتال مثل کوین‌بیس قادر به سرویس‌دهی نبودند.

مشکلات حتی دامن‌گیر ابزار‌های داخلی خود کلودفلر شد. کارمندان و مشتریان این شرکت نمی‌توانستند وارد پنل‌های مدیریتی شوند، زیرا سیستم تشخیص هویت که جایگزین کپچا است، از کار افتاده بود. این موضوع باعث شد حتی صفحه وضعیت شبکه کلودفلر که باید خرابی‌ها را گزارش دهد، خود با خطا مواجه شود و اطلاعات نادرست نمایش دهد.

چرا اینترنت مدرن تا این حد شکننده است؟

حادثه اخیر بار دیگر بحث تمرکزگرایی در اینترنت را داغ کرده است. سرویس‌هایی مانند کلودفلر که شبکه تحویل محتوا (CDN) نامیده می‌شوند، وظیفه دارند سرعت لود شدن سایت‌ها را بالا ببرند و از آن‌ها در برابر حملات محافظت کنند. اما وقتی بخش بزرگی از وب‌سایت‌های جهان از یک سرویس‌دهنده واحد استفاده می‌کنند، یک خطای کوچک می‌تواند بخش عظیمی از اینترنت را فلج کند.

داده‌های آماری وب‌سایت W۳Techs نشان می‌دهد که کلودفلر توسط درصد بسیار بالایی از وب‌سایت‌های جهان استفاده می‌شود. این حجم از وابستگی باعث می‌شود که پایداری این شرکت برای اقتصاد دیجیتال حیاتی باشد. برای درک بهتر ضریب نفوذ این شرکت، می‌توانید به آمار رسمی استفاده از فناوری‌های وب در لینک زیر مراجعه کنید:

هزینه‌های سنگین خاموشی دیجیتال

خسارات ناشی از قطع دسترسی به اینترنت تنها به اعداد و ارقام لحظه‌ای محدود نمی‌شود، بلکه می‌تواند سرنوشت یک کسب‌وکار را تغییر دهد. نگاهی به تاریخچه حوادث مشابه عمق فاجعه را نشان می‌دهد؛ به عنوان مثال شرکت اپل در یک قطعی ۱۲ ساعته ۲۵ میلیون دلار، فیس‌بوک در حادثه‌ای ۱۴ ساعته حدود ۹۰ میلیون دلار و خطوط هوایی دلتا تنها در ۵ ساعت نزدیک به ۱۵۰ میلیون دلار زیان دیدند.

طبق گزارش موسسه گارتنر، میانگین هزینه هر دقیقه قطعی سرویس ۵۶۰۰ دلار برآورد شده بود که تحقیقات جدیدتر این رقم را تا ۹۰۰۰ دلار در دقیقه برای شرکت‌های متوسط و بزرگ افزایش داده است. اما خطر اصلی در کمین کسب‌وکارهای نوپاست؛ در حالی که غول‌های فناوری با حاشیه‌های سود کلان می‌توانند طوفان‌های مالی را پشت سر بگذارند، آمارهای نگران‌کننده نشان می‌دهد که ۲۹ درصد از استارتاپ‌ها به دلیل تمام شدن نقدینگی شکست می‌خورند و یک حادثه سایبری بزرگ می‌تواند تیر خلاصی برای آن‌ها باشد.

تحقیقات موسسه Ponemon ثابت کرده است که برخلاف تصور عموم، بیشترین هزینه تحمیل شده مربوط به از دست رفتن درآمد آنی نیست، بلکه اختلال در کسب‌وکار شامل خدشه‌دار شدن اعتبار برند، از دست رفتن اعتماد مشتریان و کاهش بهره‌وری کارکنان، پرهزینه‌ترین و مخرب‌ترین بخش ماجراست.

درسی برای آینده

مدیرعامل کلودفلر در بیانیه خود مدعی شد که این شرکت اقداماتی فوری برای جلوگیری از تکرار چنین حادثه‌ای انجام داده است. مهم‌ترین اقدام، سخت‌گیری بیشتر در بررسی فایل‌های تنظیمات است. از این پس، فایل‌هایی که توسط سیستم‌های داخلی تولید می‌شوند، با همان دقتی بررسی خواهند شد که ورودی‌های کاربران خارجی کنترل می‌شوند.

کلودفلر همچنین می‌گوید که قصد دارد مکانیزم‌های قطع اضطراری را توسعه دهد تا در صورت بروز خطا در یک بخش خاص، بتوان آن بخش را بدون اینکه کل شبکه از کار بیفتد، غیرفعال کرد.

این حادثه یادآور شد که در دنیای پیچیده فناوری، حتی پیشرفته‌ترین سیستم‌ها نیز ممکن است با یک خطای انسانی ساده دچار اختلال شوند. فراتر از یک چالش فنی، این رویداد زنگ خطری جدی درباره پدیده تمرکزگرایی در زیرساخت‌های شبکه جهانی بود. امروزه بخش عظیمی از ترافیک اینترنت از کانال تعداد انگشت‌شماری از شرکت‌های واسط مانند کلودفلر یا AWS عبور می‌کند که نقش دروازه‌بانان  دنیای دیجیتال را ایفا می‌کنند. وقتی یکی از این مجموعه‌های بزرگ با چالش جدی روبرو می‌شوند، اثر آن علاوه بر  سرور‌های خود شرکت، روی میلیون‌ها کسب‌وکار، سرویس‌های بانکی و سکوهای خدماتی که به زیرساخت آن تکیه کرده‌اند، منتقل می‌شود.

تصویری ترند در ردیت که شکنندگی اینترنت مدرن را به رخ می‌کشد: دنیایی عظیم که تعادلش تنها روی شانه‌های چند شرکت زیرساختی حفظ شده است.

این وابستگی شدید نشان می‌دهد که چگونه سقوط یک مجموعه بزرگ می‌تواند اثری دومینووار داشته باشد و مفهوم اینترنت را برای ساعاتی از معنا تهی کند. در چنین شرایطی، فقط دسترسی به یک وب‌سایت قطع نمی‌شود، بلکه زنجیره‌ای از تبادلات داده، تراکنش‌های مالی و ارتباطات زیرساختی که همگی از یک نقطه واحد عبور می‌کنند، متوقف می‌شوند. این واقعیت اثبات می‌کند که در معماری مدرن وب، سلامت کل زیست‌بوم دیجیتال به طرز خطرناکی به پایداری چند شرکت محدود گره خورده است و یک اشتباه در پیکربندی آن‌ها می‌تواند عملاً به مثابه کشیدن دوشاخه اینترنت جهانی عمل کند.

انتهای پیام/