إدارة التوافر العالي في الاتصال الداخلي

نشرت: 2022-05-06

Intercom هي شركة يقودها المنتج ، وتركز على تعظيم ابتكار المنتجات وسرعة التطوير.

وهذا يعني أيضًا أننا نلزم أنفسنا بمعايير تشغيلية عالية: تقليل التكاليف ، ومعالجة مشكلات الجودة التي تنشأ داخل المنتجات الحالية بسرعة ، وتخفيف مخاطر الأمان.

أساس صحتنا التشغيلية هو التوافر. بدون توفر قوي للغاية ، لا شيء آخر مهم. لتحقيق مهمتنا المتمثلة في جعل الأعمال التجارية عبر الإنترنت شخصية وتوسيع نطاقها لدعم العملاء الأكبر والأكبر ، فإننا نستثمر بشكل مستمر ومدروس وحذر في موظفينا وأنظمتنا وعملياتنا للحفاظ على معايير التوفر العالية في Intercom.

"سر نجاح Intercom في هذا المجال بسيط: سنوات من العمل الثقافي والتنظيمي والهندسي المتسق والحذر والمتعدد الأوجه"

سر نجاح Intercom في هذا المجال بسيط: سنوات من العمل الثقافي والتنظيمي والنظم والبرمجيات المتسق والحذر ومتعدد الأوجه. هذا هو السبب في أن عملائنا - من الشركات الناشئة الصغيرة إلى الشركات الضخمة المعقدة - يضعون ثقتهم فينا.

هنا كيف نفعل ذلك.

التوفر جزء لا يتجزأ من ثقافتنا

الدور الذي يلعبه كل موظف في الاتصال الداخلي في دعم التوفر جزء لا يتجزأ من ثقافتنا. بالنسبة للفرق الهندسية ، يتيح لنا الحصول على التعليمات البرمجية للإنتاج بأسرع ما يمكن على دفعات صغيرة التعلم والتكرار.

بدلاً من إبطاء مهندسينا ، نستثمر في الأنظمة ونبني ثقافة حول معنى البناء السريع والآمن. نقوم بتعليم مهندسينا في هذه السياسات والعمليات طوال حياتهم المهنية في الاتصال الداخلي ، من إعداد الموظفين إلى مراجعات الأداء. لا يتم شحن تغييرات الكود المعزولة بأمان فحسب ، بل تهدف عملية تسليم البرامج بأكملها إلى ضمان أننا ، في كل مرحلة ، نبني منتجات موثوقة وقابلة للتطوير بشكل افتراضي.

"مجموعة أدوات المراقبة لدينا من الطراز العالمي وتمكّن كل مهندس في الشركة من فهم كيفية تصرف الكود الذي يشحنونه في بيئة الإنتاج ، بأدق مستوى من التفاصيل"

مجموعة أدوات المراقبة لدينا من الطراز العالمي وتمكّن كل مهندس في الشركة من فهم كيفية تصرف الكود الذي يشحنونه في بيئة الإنتاج ، بأدق مستوى من التفاصيل. على الرغم من جميع نوايانا الطيبة ، إلا أن بعض التغييرات في التعليمات البرمجية ستؤدي حتمًا إلى حدوث مشكلات. لهذا السبب نستثمر أيضًا في الآليات التي تسمح لنا بالتعافي من المشكلات بشكل أسرع مما ننشره.

نبني أسس تقنية قوية

نحن نبني حصريًا باستخدام عدد صغير جدًا من التقنيات كجزء من مجموعتنا ، مدعومًا بفريق تمكين محدد من "التقنيات الأساسية". لقد طورنا خبرة عميقة في هذه التقنيات بمرور الوقت ، وخياراتنا المعمارية وأنماط التنفيذ بسيطة ومثبتة. هذا يعني أننا نعرف ما يعنيه التصميم والبناء من أجل الموثوقية ، مع حلول مثبتة على نطاق واسع.

"نستثمر في بناء وصيانة الأنظمة والأدوات المشتركة التي تدعم قدرتنا على شحن الكود بأمان ، والتعافي بسرعة في حالة حدوث أي خطأ"

باستخدام هذه التقنيات الأساسية ، نستثمر في بناء وصيانة الأنظمة والأدوات المشتركة التي تدعم قدرتنا على شحن الكود بأمان ، والتعافي بسرعة في حالة حدوث أي خطأ.

يمنحنا هذا النوع من الأتمتة القدرة على نشر التغييرات على نسبة صغيرة من حركة مرور العملاء ، أو لمجموعة محددة من العملاء ، من أجل فهم تأثيرها. يمكننا بسهولة تبديل وصول أي عميل إلى ميزة أو إيقاف تشغيلها ، وهي قدرة مفيدة في حالة وقوع حادث. يمكننا أيضًا التعافي ببساطة عن طريق اختيار الضغط على الزر "للعودة" إلى إصدار عمل آمن من الكود - في أقل من خمس دقائق.

نحافظ على علاقات وثيقة للغاية مع مورِّد البنية التحتية السحابية الأساسي لدينا ، Amazon Web Services (AWS) ، من أجل التقييم المشترك المستمر لقوة نظام البنية الأساسية لدينا وفهم ما إذا كانت هناك فرص للتطور وتعزيز موثوقيتنا.

نحن ندير المخاطر ونستجيب على الفور عندما تسوء الأمور

يهدف جزء من إستراتيجية البرنامج إلى تحديد وترتيب أولويات وتخفيف المخاطر التي قد تهدد توافرنا. داخل المؤسسة الهندسية ، لدينا مدير برنامج تقني مخصص للتوافر (TPM) يقود برنامج الاتصال الداخلي عبر الاتصال الداخلي المخصص لتعزيز وحماية توفرنا باستمرار.

"يعمل فريق البرنامج مع المديرين عبر الهندسة لفهم أي مخاطر نواجهها بعمق"

يعمل فريق البرنامج مع المديرين عبر الهندسة لفهم أي مخاطر نواجهها بشكل كامل. يتم بعد ذلك ترتيب أولويات هذه العناصر كمدخلات في خرائط الطريق الهندسية ، مع مساعدة TPM في ضمان تنفيذ العمل وفقًا للجدول الزمني.

عندما نواجه حادثًا يؤثر على عملائنا ، فإن منصات المراقبة والإنذار المكثفة لدينا تلتقطها على الفور تقريبًا ، وتبدأ عملية الاستجابة للحوادث لدينا. عملاؤنا عالميون حقًا ، وهذا يعني أننا ندعمهم من خلال الدعم الهندسي المستمر على مدار الساعة طوال أيام الأسبوع وإدارة الحوادث.

مستجيبو الطوارئ لدينا متصلون بالإنترنت ويستجيبون في غضون دقائق من الاتصال بهم ، وانضم إليهم قائد الحادث. ينصب تركيز القائد الفوري على تقليل التأثير على العملاء ، ويقومون بتنسيق الجهد بأكمله ، بما في ذلك تحديد المشكلة ، والفرز ، والاتصالات ، والحل. هذه عملية شديدة الانضباط والتنظيم ، مدعومة بأدوار ومبادئ تشغيل محددة جيدًا.

"عادةً ما نعالج مثل هذه الحوادث في غضون دقائق ، وننشر التحديثات على صفحة الحالة الخاصة بنا بينما نعمل في الوقت نفسه على إعادة الخدمة إلى وضعها الطبيعي"

عادةً ما نحل مثل هذه الحوادث في غضون دقائق ، وننشر التحديثات على صفحة الحالة الخاصة بنا بينما نعمل في نفس الوقت على استعادة الخدمة. ومع ذلك ، فإن استئناف الخدمة العادية ليس بالتأكيد نقطة النهاية بالنسبة لنا. تعد مراجعة الحوادث جزءًا رئيسيًا من عملية إدارة الحوادث لدينا ، حيث نتعمق في الأسباب والعوامل المساهمة في الحادث ونبحث عن الدروس المستفادة.

في منتدى داخلي مفتوح ، سنفكر في المكان الذي كان من الممكن أن نفعل فيه بشكل أفضل ، ونقترح عناصر عمل قصيرة المدى بالإضافة إلى تغييرات إستراتيجية طويلة المدى. هذا الاجتماع هو أحد أكثر الاجتماعات فائدة لنا: تذكير بأن كونك عظيمًا حقًا يتطلب التفاني في التحسين المستمر.

ماذا يعني تركيزنا على التوافر لعملائنا

إن التزامنا بنجاح عملائنا يعني أن التوافر الراسخ أمر لا بد منه. لقد سمح لنا نهجنا الشامل بتجاوز وقت التشغيل المستهدف بنسبة 99.8٪ لعدد من السنوات ، مما يوفر منصة للنمو يمكن لجميع عملائنا الوثوق بها.

هذه هي الحلقة الثانية في سلسلة المحتوى التي تغوص في استثمارات Intercom في دعم المؤسسات. استكشف مقالات أخرى في السلسلة.