Untitled design 8

האתגר: חיבור הדדי בין משאבי ביג דאטה

כלי ניתוח נתונים יכולים לספק לארגון את הידע הדרוש כדי לקבל החלטות אסטרטגיות לגבי מוצרים או שירותים חדשים, הזדמנויות להרחבת העסק, אבטחה משופרת ועוד. ואולם כיצד ניתן לשפר את העלות והנגישות של ניהול מסדי נתונים גדולים מאוד? אחרי הכל, ייתכן שהענן הציבורי אינו ידידותי לתקציב כפי שהתרגלנו להאמין.

סוג הנתונים המתאפיין בקצב הגידול הגבוה ביותר הוא  נתונים בלתי מובְנים (Unstructured data). מומחי IT יכולים לנצל את Scality כפתרון למיטוב (אופטימיזציה) נתונים אלה בסביבה מקומית מאובטחת, המציעה חוויית שימוש של ענן. התובנות שהושגו מכמויות עצומות של נתונים המנוהלים באמצעות Scality מסייעות בקבלת החלטות עסקיות מושכלות.

היתרון: אחסון אובייקטים

אחסון האובייקטים של Scality מספק קיבולת בלתי מוגבלת עבור Data lakes ויישומי אנליטיקה – בממדים מרובים – כולל מספר כלשהו של קבצים או אובייקטי נתונים, ממספר כלשהו של מקורות ומאפשר הזנה של Workloads רבים במקביל. אחסון ענן בלתי ניתן לפריצה עבור מאגרי נתונים (Data Centers) מגן על הנתונים ומשמר את הזמינות כך שהארגונים יכולים לבצע ניתוח נתונים בכל קנה מידה נדרש. הדבר מאפשר ליהנות מהיתרונות של ענן ציבורי בתוספת שליטה, ביצועים ואבטחה של תשתית ענן פרטית מקומית.

תרחיש שימוש להפקת לקחים

לפנינו דוגמה המתארת כיצד Scality RING, בשילוב עם Splunk, מנהל ניתוח Big Data בקנה מידה גדול מאוד. ספק שירותי נסיעות אירופאי עובד עם כמה מחברות התעופה הגדולות באירופה ומשרת היקף גדול מאוד של חיפושי נסיעות בכל יום. הוא פונה למסד נתונים המאוחסן בזיכרון כדי להשיג את רמת הביצועים הנדרשת.

יש לקלוט ולנתח את היומנים של כל החיפושים הללו כדי לחלץ מהם דפוסים – יעדים ומועדי נסיעות – כדי לסייע בקביעת התמחור. החברה הייתה זקוקה לפתרון עבור PB אחד של נתוני יומן ליום, כזה שיכול לספק גישה לכלי האנליטיקה של Splunk.

Scality RING היה הפתרון המדויק למקרה זה; הוא משמש כמשאב אחסון ייצור לנתונים אלה. הנתונים מאוחסנים למשך 14 יום, כאשר הנתונים הישנים ביותר במחזור (היום ה 14) נמחקים מדי יום. ל-RING יש יכולת לבצע פעולות אלו תוך מתן אפשרות קריאת נתונים של שבועיים מ-300 צומתי אינדקס Splunk ולהשיג לתפוקת שיא של ‎60 GB בשנייה.

זהו אחד ממערכי הפריסה הגדולים ביותר של Splunk: 300 אינדקסים של Splunk ב-36 שרתי HPE Apollo 4200.

מערכים אקולוגיים של שותפי טכנולוגיה מאפשרים להשיג יעדים שאפתניים

המערך האקולוגי המקיף של שותפי הטכנולוגיה שלנו (130 ספקי שירותי אינטרנט הנמנים עם ספקי התשתית הגדולים ביותר) – מסייע לממש פרויקטים בקנה מידה כה גדול. עם הספקים הללו נמנים  Vertica‏, Splunk‏, ELK Stack ו-Weka, וזוהי רשימה חלקית.

Scality הטמיעה מאות פתרונות ללקוחות בהיקף אחסון כולל העולה בהרבה על Exabyte. לארגונים הזקוקים לפתרונות ענן אחסון מקומי ליישומים מודרניים עתירי נתונים, Scality מספקת אחסון אובייקטים לארכיוני נתונים ושכבות תמיכה במערכי האחסון הראשיים[DK1] .

RING מציע אחסון מקומי בקנה מידה גמיש (Storage scalability) הדומה לזו של הענן. ניתן להתאים את RING לאירוח מספר אינסופי של אובייקטים ואלפי צמתי שרת הפרוסים על פני מספר אתרים.

שינוי קנה מידה לפי דרישה

מכיוון שקצב גידול הנתונים מתגבר במהירות הבזק, ארגונים זקוקים ליכולת לנצל אותם בצורה הטובה ביותר לעסק. הדבר מצריך ניתוח של כמויות אדירות של נתונים ויכולת לשנות את קנה המידה של אחסון הנתונים לפי הצורך. Scality פעלה עם השותפים שלנו ויחד הם יצרו פתרונות אחסון אובייקטים שמסייעים ללקוחות להשיג את המטרות הללו.

בעקבות המגמה הגורפת של שימוש ב-Object Storage עבור אחסון מסיבי של דאה לא מובנה , אשר הוכיח את עצמו היטב במגוון תרחישי שימוש טכנולוגיים, ונוכח הביקוש הגובר לשילוב טכנולוגיות מסוג זה במאגרי נתונים מקומיים ובתצורות היברידיות (אחסון מקומי בשילוב אחסון בענן), היה ברור לי, כבר לפני שנתיים, שיש לשלב טכנולוגיה כזו בתיק מוצרי המחשוב של בינת. עד מהרה בחרתי ב-Scality, שביססה את מעמדה כאחת החברות המובילות את השוק בתחום זה. ארכיטקטורת תוכנה מלאה המבוססת על ה-RING שהוכיח את עצמו בשטח וזכה לפרסום בשוק, משודרגת מעתה בפתרון אחסון האובייקטים החדש והמודרני ARTESCA, המבוסס במלואו על Containers, והפועל בכל פלטפורמות שרת חומרה תואמות לדרישות היצרן.


שתי טכנולוגיות אלו מאפשרות להשיג גמישות אופטימלית בפרויקטים השונים של בינת.
 Data Lakes מצריכים קיבולת המונית בעלויות מוגבלות, ומשרתים תרחישים שונים כגון ארכיון וידאו, הגנת נתונים, תשתיות נתונים משותפות מבוזרות (ריבוי אתרים וריבוי עננים), מאגרי מידע גולמיים AI/ML , ועוד. הן כמובן מתממשקות בצורה קלה ופשוטה עם שירותי אחסון אובייקטים של השחקנים העיקריים בתחום הענן הציבורי, ומופעלות באופן מלא על ידי ממשק API. ריבוי תכונות שללא ספק  הופכות אותן לגורם מפתח להצלחה בכל פרויקט Data Center מודרני (IT/AI/HPC/DEV).