מה זה SRE? המקצוע ששומר על האינטרנט
יכול להיות שיצא לכם לשמוע על תפקיד ה-SRE, ואולי אתם אפילו מכירים מישהו שממלא אותו, אבל האם אתם יודעים במה בדיוק מדובר? על מה אחראי ה-SRE, למה הביקוש לתפקיד הזה נמצא בעלייה, ומה צריך ללמוד כדי להתברג בו?
בתחילת שנות ה-2000, כשגוגל כבר לא הייתה רק מנוע חיפוש אלא מערכת גלובלית עצומה שמשרתת מיליוני משתמשים בכל רגע, עלתה שאלה קריטית: איך שומרים על שירותים מורכבים זמינים, מהירים ויציבים בקנה מידה כזה? ניהול ידני של שרתים ותקלות כבר לא הספיק. מערכות גדלו במהירות, משתמשים ציפו לזמינות מוחלטת, וכל תקלה קטנה יכלה להשפיע על העולם כולו. מתוך הצורך הזה נולד המושג Site Reliability Engineering - או בקיצורSRE , גישה חדשנית שיצרה גוגל שמטרתה להפוך את ניהול התשתיות והאמינות לבעיה הנדסית שניתן לפתור באמצעות קוד.
עידו אייזנברג, מרצה בפקולטה למדעי המחשב של המכללה למינהל, בעצמו בוגר של המכללה, ועובד בתעשיית ההייטק, מסביר כי מדובר בתחום הנדסי שמשלב בין פיתוח תוכנה לבין תפעול IT. במקום להסתמך רק על אנשי סיסטם שמבצעים משימות ידניות, מהנדסי SRE כותבים תוכנה שמנהלת מערכות, מנטרת תקלות, משפרת ביצועים ומונעת קריסות. "מכיוון שיש יותר ויותר הגירה של ארגונים לעבוד בענן, יש צורך הולך וגדל באנשי מקצוע שיוכלו להבטיח זמינות, אמינות, סקיילביליות ואוטומציות מקצה לקצה של מערכות תוכנה מורכבות - 24 שעות ביממה, 7 ימים בשבוע", הוא מסביר.
מהם תחומי האחריות של מהנדס SRE?
תפקיד ה-SRE אחראי על כמה תחומים מרכזיים. הראשון הוא אוטומציה. אחד העקרונות החשובים ביותר ב-SRE הוא שאם משימה חוזרת על עצמה - כדאי לכתוב קוד שיבצע אותה. מהנדסי SRE משתמשים בשפות כמו פייתון ו-Go כדי להפוך תהליכים ידניים לאוטומטיים: פריסת שרתים, ניהול קונפיגורציות, התאוששות מתקלות ועוד.
התחום השני הוא ניטור וניהול תקלותIncident Management) ). תקלות בסביבת הפיתוח עלולות לעלות הון לחברה, לכן אנשיSRE אחראים לבנות מערכי Monitoring חכמים, לזהות תקלות בזמן אמת, להגיב במהירות ולוודא שהבעיה לא תחזור.
תחום נוסף הוא ניהול עומסים וסקיילביליות. בעולם שבו אפליקציה יכולה לעבור מאלפי משתמשים למיליונים תוך זמן קצר, יש צורך בתכנון קיבולת מדויק. מהנדסי SRE עובדים עם פלטפורמות ענן שונות כדי לתכנן תשתיות גמישות.
לבסוף, יש את נושא המדידה והיעדים. כאן נכנסים מושגים כמו SLA (Service Level Agreement) - התחייבות לרמת שירות, ו-SLOs (Service Level Objectives) - היעדים ההנדסיים שנקבעים כדי לעמוד בהתחייבות הזו.
SRE מול DevOps – מהם ההבדלים?
פעמים רבות יש בלבול בין תפקיד ה-DevOps לתפקיד ה-SRE. אייזנברג מגדיר את ההבדל בצורה מתומצתת: "DevOps הוא האידיאולוגיה, SRE הוא הביטוי ההנדסי שלה".
DevOps הוא בראש ובראשונה פילוסופיה ארגונית: גישה שמטרתה לחבר בין צוותי הפיתוח (Development) לצוותי התפעול (Operations), לשבור "חומות" ארגוניות ולעודד שיתוף פעולה. SRE, לעומת זאת, הוא המימוש המעשי, ההנדסי והמדיד של רבים מעקרונות DevOps. לכן SRE נפוץ במיוחד בחברות טכנולוגיה ענקיות כמו גוגל, Meta או אמזון, שבהן נדרשת רמת מורכבות עצומה. DevOps, לעומת זאת, הוא תפקיד שקיים יותר בסטארט-אפים, חברות טכנולוגיה בינוניות וגם חברות בתעשייה המסורתית.
האם צריך תואר כדי להצליח כ-SRE?
איך ניתן להשתלב בתפקיד SRE? קודם כל, חשוב לזכור, שזה לא תפקיד שנכנסים אליו ישר אחרי לימודי תואר ראשון, אלא נבנים לתוכו לאחר כמה שנות ניסיון בתעשייה.
אפשר להיכנס לתחום גם דרך ניסיון מעשי, הסמכות או מעבר מתפקידים אחרים, אך בפועל חברות מובילות כמו Netflix, Airbnb וחברות פינטק גדולות מחפשות הרבה מעבר להכרת Kubernetes אוDocker , הן מחפשות אנשי מקצוע עם הבנה עמוקה של מערכות הפעלה, רשתות, אלגוריתמיקה, ארכיטקטורת תוכנה ויכולת פתרון בעיות מורכבות.
כאן נכנסים היתרונות של תואר ראשון במדעי המחשב. אייזנברג מציין כי המקצוע כולל עקרונות פיתוח רבים, שבכולם נוגעים במהלך התואר עצמו. "במסגרת הלימודים לתואר ראשון במדעי המחשב במכללה למינהל [EB2.1]יש המון קורסים שעוסקים ברשתות תקשורת, מערכות הפעלה ועוד. בנוסף, ללימודים במכללה יש יתרון משמעותי והוא האוריינטציה לתעשייה - בתואר שמים דגש על תחומים מבוקשים בתעשייה, והלימודים עצמם מאוד פרקטיים וכוללים התנסויות מעשיות".
ארגז הכלים של ה-SRE: מה תצטרכו ללמוד?
כדי לעבוד כ-SRE יש חשיבות להיכרות מעמיקה עם שפות כמו פייתון ו-Go, משום שהן מאפשרות אוטומציה, בניית כלים פנימיים וניהול מערכות בקנה מידה גדול. בנוסף, חשוב להכיר לעומק Docker, Kubernetes ו-Terraform - הכלים שמעצבים כיום את עולם התשתיות המודרני.
לא פחות חשובים הם הכישורים הרכים: פתרון בעיות תחת לחץ, תקשורת בין-אישית גבוהה, ויכולת לעבוד מול צוותי פיתוח, אבטחה ומנהלים עסקיים, מכיוון ש-SRE טוב הוא לא רק מהנדס - הוא גם מתאם, מתכנן ומוביל.
הביקוש בשוק העבודה
SRE נחשב כיום לאחד התפקידים המתגמלים ביותר בהייטק, ולעיתים אף מציע שכר גבוה יותר ממפתחי Backend רגילים, בעיקר בזכות האחריות הרחבה וההשפעה הישירה על פעילות החברה. בישראל יש ביקוש גובר במיוחד לאנשי מקצוע בתחום בחברות פינטק, סייבר,Saas וגם בגופים ביטחוניים שזקוקים למערכות יציבות ועמידות. מתפקיד SRE אפשר להתקדם לתפקידים בתחום ארכיטקטורת ענן, הובלת Reliability בארגון, ניהול צוותים או תפקידי Infrastructure Leadership ועוד.