سائيٽ جي قابل اعتماد انجنيئرنگ، انٽرنيشنل سافٽ ويئر لاء ٺهيل
جديد سسٽم لاءِ SRE-گريڊ جي اعتبار جي تصديق. پيداوار کان اڳ مسلسل سسٽم جي رويي، اعتبار، ۽ ناڪامي طريقن جي تصديق ڪريو.
- صارفين کي تجربو ڪرڻ کان اڳ بند ٿيڻ کي روڪيو
- مسلسل اعتبار جي تصديق ڪريو، پوسٽ مارٽم نه
- انٽرپرائز پيماني تي آپريشنل خطري کي گھٽايو
جديد SRE جي حقيقت
توھان ٺاھيو آھي ڊيش بورڊ، سيٽ اپ الرٽ، ۽ لکيل رن بڪ. اڃان تائين توهان جي ٽيم اڃا تائين رد عمل واري موڊ ۾ آهي، انهن کي روڪڻ بدران واقعن جو جواب ڏيڻ. روايتي مانيٽرنگ توهان کي ٻڌائي ٿو ته ڪجهه ٿيڻ کان پوء غلط آهي. ايس آر ايز کي ضرورت آهي ته ڀروسي جي تصديق ڪرڻ کان اڳ، حقيقت کان پوء ان جي تحقيق نه ڪريو.
مانيٽرنگ ڊزائن طرفان رد عمل آهي
ڊيش بورڊ ۽ الارٽس توهان کي ٻڌائين ٿا جڏهن ڪجهه ڀڃي ٿو. اهي ٽوڪ کي پهرين جڳهه ۾ ٿيڻ کان روڪي نٿا سگهن.
ايس ايل اوز جي باوجود حادثا ٿين ٿا
غلطي جي بجيٽ رفتار جي حفاظت ڪري ٿي، پر هڪ خراب ترتيب توهان جي سڄي بجيٽ کي ساڙي سگهي ٿو ۽ آزاديء کي آزاد ڪري سگهي ٿو.
رفتار کي تبديل ڪري اعتماد کي ٽوڙي ٿو
هر تعیناتي هڪ قابل اعتماد خطرو آهي. تيز ترسيل جو مطلب آهي ريگريشنز لاءِ وڌيڪ موقعو پيداوار تائين پهچڻ لاءِ.
پوسٽ مارٽم تمام دير سان ٿي چڪو آهي
واقعن مان سکڻ قيمتي آهي، پر نقصان اڳ ۾ ئي ٿي چڪو آهي. صارفين کي متاثر ڪيو ويو، اعتماد ختم ٿي ويو.
اعتبار هڪ SRE ذميواري آهي، نه ميٽرڪ
قابل اعتماد ڊيش بورڊ تي هڪ نمبر نه آهي. اهو ڪيئن آهي توهان جو سسٽم تبديليءَ هيٺ، لوڊ هيٺ، ۽ ناڪاميءَ هيٺ. SREs reliability کي يقيني بڻائڻ جا ذميوار آهن، پر توهان پڪ نه ٿا ڪري سگهو جيڪي توهان تصديق نٿا ڪريو.
Reliability تبديلي جي تحت رويي آهي
هڪ 99.9٪ اپ ٽائم نمبر بي معنيٰ آهي جيڪڏهن توهان جي ايندڙ تعیناتي نازڪ ورڪ فلوز کي ٽوڙي ٿي. قابل اعتماد مسلسل تصديق ٿيڻ گهرجي.
SREs کي تصديق جي ضرورت آهي، نه رڳو مشاهدو
مشاهدو توهان کي ٻڌائي ٿو ته ڇا ٿيو. تصديق توهان کي ٻڌائي ٿو ته ڇا ٿيندو. رد عمل مانيٽرنگ کان فعال ٽيسٽنگ ڏانھن.
اعتماد کي جانچڻ گهرجي، فرض نه ڪيو وڃي
توهان شپنگ کان پهريان خاصيتن جي جانچ ڪريو. ڇو نه reliability؟ هر تبديلي کي ناڪامي حالتن جي خلاف تصديق ٿيڻ گهرجي.
عملي ۾ اعتبار جي تصديق جو مطلب ڇا آهي
اعتبار جي تصديق ڪنڪريٽ آهي، نه خلاصي. ان جو مطلب اهو آهي ته انهن جي پيداوار تائين پهچڻ کان اڳ مخصوص رويي کي جانچڻ.
ڪم فلو جي خرابي جي نشاندهي
تصديق ڪريو ته نازڪ صارف ورڪ فلوز هر تبديلي کان پوء صحيح طريقي سان ڪم ڪن ٿا. ٽوٽل چيڪ آئوٽ وهڪري کي پڪڙيو، ناڪامي جي تصديق، ۽ استعمال ڪندڙن کان اڳ خراب ٿيل ڳولا.
ناڪامي موڊ جي تصديق
سسٽماتي طور تي جانچ ڪريو ته توهان جو سسٽم ناڪامي کي ڪيئن سنڀاليندو آهي. سرڪٽ برڪرز جي تصديق ڪريو، منطق جي ٻيهر ڪوشش ڪريو، شاندار تباهي، ۽ وقت ختم ٿيڻ واري رويي.
تبديلي-اثر جي تصديق
هر تعیناتي جي ڌماڪي واري ريڊيس کي سمجھو. نقشو انحصار، متاثر ٿيل خدمتن کي سڃاڻڻ، ۽ هيٺئين پاسي واري رويي جي تصديق ڪريو.
ريليز جي وچ ۾ رجعت جي سڃاڻپ
ريگريشن کي پيداوار تائين پهچڻ کان روڪيو. ڪارڪردگي جي خرابي، ٽوٽل ڪارڪردگي، ۽ API معاهدي جي ڀڃڪڙي کي پڪڙڻ لاء رليز جي وچ ۾ رويي جو مقابلو ڪريو.
واقعن کان اڳ سگنل نسل
حادثا ٿيڻ کان اڳ قابل عمل سگنل حاصل ڪريو. ڄاڻو ته ڪهڙيون تبديليون خطرناڪ آهن، ڪهڙيون خدمتون خراب ڪندڙ آهن، ۽ ڪهڙيون نوڪريون ڌيان ڏيڻ جي ضرورت آهي.
گنجائش ۽ اسڪيلنگ جي تصديق
پروجيڪٽ ٿيل لوڊ سطح تي رويي جي تصديق ڪريو ان کان اڳ توھان انھن کي پيداوار ۾ ھٽايو. ساڄي سائيز جي انفراسٽرڪچر ۽ گنجائش سان لاڳاپيل واقعن کان بچڻ.
ڪيئن زوف SRE ٽيمن کي سپورٽ ڪري ٿو
زوف هڪ معتبر تصديق واري پرت آهي جيڪا توهان جي موجوده اسٽيڪ سان گڏ ڪم ڪري ٿي. هڪ مانيٽرنگ متبادل ناهي، پر هڪ فعال جاچ واري پرت جيڪا واقعن کي ٿيڻ کان اڳ روڪي ٿي.
CI/CD پائپ لائنن ۾ ٺھي ٿو
اعتبار جي تصديق خودڪار طريقي سان هلندي آهي هر پي آر، هر انضمام، هر مقرري تي. ڪابه دستي مداخلت جي ضرورت ناهي. گيٽس جيڪي پيداوار تائين پهچڻ کان اڳ خطرناڪ تبديلين کي روڪيندا آهن.
GitHub عملن سان ضم ٿي، GitLab CI، جينڪنز، CircleCIنگراني سان گڏ ڪم ڪري ٿو
زوف Datadog، Prometheus، يا توهان جي مشاهدي واري اسٽيڪ کي تبديل نٿو ڪري. اهو انهن کي مڪمل ڪري ٿو ڀروسو ڪرڻ کان اڳ اعتبار جي تصديق ڪندي، تنهن ڪري توهان جي مانيٽرز کي خبردار ڪرڻ لاء گهٽ واقعا آهن.
Datadog، Prometheus، Grafana، New Relic، PagerDuty سان ڪم ڪري ٿوقابل عمل سگنل پيدا ڪري ٿو، شور نه
هر تصديق جو نتيجو قابل عمل آهي. صاف پاس / ناڪامي جي صورتحال، مخصوص ناڪامي تفصيل، ۽ متاثر ٿيل ڪوڊ ڏانهن سڌو لنڪ. ڪابه خبرداري ٿڪ، ڪو غلط مثبت، ڪو اندازو لڳائڻ.
قابل اعتماد سکور، خطري جي تشخيص، رجحان تجزيومدد ڪري ٿو SREs کي قابل اعتماد کاٻي پاسي ڦيرائڻ
اعتماد جي تصديق کي پيداوار کان اڳ جي پيداوار ڏانهن منتقل ڪريو. پوسٽ مارٽم بدران پي آرز ۾ مسئلن کي پڪڙيو. ڊولپرز کي بااختيار بڻائڻ لاءِ قابل اعتماد طور تي SRE رڪاوٽن کان سواءِ.
CI ۾ ذيلي 10 منٽ فيڊبڪ لوپSRE ۽ پليٽ فارم ٽيمن جا نتيجا
SRE ٽيمن مان حقيقي نتيجا قابل اعتماد جي تصديق استعمال ڪندي.
نازڪ مسئلن کي پڪڙيو ان کان اڳ جو اهي توهان جي آن-ڪال ٽيم جو صفحو ڪن
اعتماد سان ٻيڙيءَ کي ڄاڻڻ جي اعتبار سان تصديق ٿيل آهي
هڪ نظر ۾ هر خدمت جي قابل اعتماد صورتحال ڄاڻو
گهٽ صفحا، گهٽ واقعا، خوش انجنيئر
"اسان هر مهيني 12 واقعن جي اوسط کان 1 تي ويا آهيون. اسان جي آن ڪال گردش هاڻي بورنگ آهي، ۽ اهو ئي آهي جيڪو اسان چاهيون ٿا."
انٽرپرائز تيار
انٽرپرائز SRE ٽيمن جي سيڪيورٽي، تعميل، ۽ پيماني جي ضرورتن لاء ٺهيل.
سيڪيورٽي - پهريون فن تعمير
- SOC 2 قسم II تصديق ٿيل
- صفر ڊيٽا برقرار رکڻ جا اختيار
- پرائيويٽ بادل جي جوڙجڪ
- SSO/SAML انضمام
تعميل تيار
- GDPR مطابق
- HIPAA تيار
- SOX آڊٽ لاءِ تيار
- ISO 27001 ترتيب ڏنل
انٽرپرائز اسڪيل
- گھڻن علائقي جي تعیناتي
- اعلي دستيابي
- وقف حمايت
- ڪسٽم SLAs
قابل اعتماد توهان تصديق ڪري سگهو ٿا، نه رڳو مشاهدو
ڏسو ڪيئن زوف مدد ڪري ٿو SRE ٽيمن کي رد عمل واري فائر فائائينگ کان پراڪٽيڪل اعتبار جي تصديق ڏانهن.
30-منٽ ڊيمو · SRE ٽيمن لاءِ حسب ضرورت · عمل ۾ قابل اعتماد اسڪورنگ ڏسو