تقویتکننده ابری Domo، روشی را تغییر میدهد که افراد میتوانند دادهها را از سیستمهای متفاوت جمع آوری کنند تا بتوانند با دردسر کمتر تأثیر واقعی بگذارند. Cloud Amplifier با زیرساخت دادهای که قبلاً استفاده میکنید کار میکند و تبدیل، تجسم و انتقال دادهها را آسان میکند.
این ابزار همچنین میتواند به شما در صرفهجویی در هزینهها کمک کند و این کارها را در فضای ذخیرهسازی ابری خود راحتتر انجام دهید. بیایید در مورد اینکه چگونه Cloud Amplifier می تواند بر هزینه های ذخیره سازی ابری شما تأثیر بگذارد، به علاوه استراتژی هایی برای بهینه سازی آنها صحبت کنیم.
نحوه شارژ ارائه دهندگان فضای ابری معمولا
ارائهدهندگان انبار ابری بر اساس تعداد خوشههای محاسباتی که به عنوان انبارهای مجازی نیز شناخته میشوند، برای پردازش درخواستهای داده استفاده میشوند، هزینه میدهند. به هر خوشه مقدار معینی از قدرت پردازش، حافظه و ذخیره سازی موقت برای اجرای درخواست ها اختصاص داده می شود.
این خوشهها به گونهای طراحی شدهاند که برای حداقل دورههای تنظیمشده اجرا شوند و زمان خاموشی تنظیم شده باشند. به عبارت دیگر، اگر هیچ درخواستی اجرا نشود، پس از مدت زمان مشخصی به طور خودکار خاموش می شود. این تنظیم به تعیین هزینه استفاده از خدمات ذخیره سازی ابری کمک می کند.
فقط یک درخواست می تواند باعث شود که یک خوشه محاسباتی کار کند که هزینه دارد. به همین دلیل است که مدیران پایگاه داده و مهندسان داده به دقت مراقب زمان و نحوه پرس و جو هستند. آنها میخواهند از خرج کردن پول برای خوشههای محاسباتی غیرضروری جلوگیری کنند و فرصتهایی را بیابند که منابع کمتری بتوانند همان کار را انجام دهند. این نظارت دقیق به جلوگیری از هزینههای غیرضروری کمک میکند و همه چیز را کارآمد نگه میدارد.
مطالعه موردی با Snowflake
وظیفه: دو درخواست، هر کدام حدود پنج ثانیه طول می کشد
سناریو 1: انبارهای دوگانه
بیایید تصور کنیم از Snowflake با دو درخواست استفاده کنیم که هر کدام حدود پنج ثانیه طول می کشد. اگر هر درخواست در انبار بسیار کوچک خود (یعنی یک خوشه محاسباتی) اجرا شود و آن انبارها پس از 60 ثانیه عدم فعالیت بسته شوند، در نهایت برای مدتی بیشتر از آنچه انتظار دارید هزینه پرداخت می کنید. در این مورد، از آنجایی که هیچ درخواست دیگری برای اشغال آنها وجود نداشت، هر انبار در مجموع 65 ثانیه کار کرد. از آنجایی که از دو انبار جداگانه استفاده شده است، این بدان معناست که شما در مجموع 130 ثانیه زمان محاسبه را پرداخت کرده اید.
سناریو 2: انبار تک
در این سناریوی دوم، تصور کنید که همان دو پرس و جو را اجرا کنید، اما این بار فقط از یک انبار مجازی استفاده کنید. از آنجایی که این انبار دارای CPU، حافظه و حافظه کافی برای رسیدگی به هر دو درخواست به طور همزمان است، آنها با هم پردازش می شوند. این راهاندازی تنها از 65 ثانیه زمان انبار برای هر دو درخواست استفاده میکند، که به طور موثر هزینهها را در مقایسه با استفاده از دو انبار جداگانه به نصف کاهش میدهد.
انتخاب استراتژی انبار شما: تخصیص هزینه در مقابل صرفه جویی در هزینه
پس چرا می خواهید چندین خوشه محاسباتی را به طور همزمان اجرا کنید؟ هنگام مدیریت داده ها، استفاده از خوشه های محاسباتی متعدد به دلایل مختلفی می تواند منطقی باشد:
- انبارها می توانند به عنوان جایگزین عالی برای مراکز هزینه و تخصیص بودجه عمل کنند.
- شما می توانید گروه های مختلفی از خوشه های محاسباتی برای انواع مختلف وظایف داشته باشید.
- ممکن است محدودیتهایی داشته باشید که زمان اجرای خوشههای محاسباتی خاص را محدود میکند.
اکنون باید مصالحه ای را در نظر بگیریم. اگر استراتژی شرکت شما در درجه اول کاهش هزینه ها در صورت امکان است، استفاده از خوشه هایی که در حال حاضر کار می کنند منطقی است. زمانی که یک خوشه محاسباتی در حال اجرا است، از قبل برای CPU، حافظه و فضای ذخیره سازی پرداخت می کنید. چرا از آنها نهایت استفاده را نمی کنیم؟ به این ترتیب، آنچه را که قبلاً روی آن سرمایه گذاری کرده اید به حداکثر می رسانید.
اگر استراتژی شما درک روشنی از هزینههای پروژهها یا بخشهای خاص را در اولویت قرار میدهد، میتوانید انتخاب کنید که دستههای محاسباتی منفرد را متناسب با آن نیازها تنظیم کنید.
این رویکرد با همسو کردن هزینه ها با مناطقی که از نزدیک نظارت می کنید، دید هزینه شما را بهبود می بخشد. با این حال، خطر استفاده از خوشههای محاسباتی متعددی است که به طور کامل مورد استفاده قرار نمیگیرند و کمتر از ظرفیت خود کار میکنند – استفاده ناکارآمد از منابع.
پس من چه چیزی را توصیه می کنم؟ استفاده از خوشه های محاسباتی موجود به جای ایجاد خوشه های جدید به طور خاص برای Cloud Amplifier اغلب مقرون به صرفه تر است. در حالی که ممکن است دلایل خوبی برای ایجاد کلاسترهای اختصاصی برای اتصالات Cloud Amplifier وجود داشته باشد، آنها اغلب می توانند منجر به هزینه های بالاتر شوند.
از سوی دیگر، استفاده مجدد از خوشههای موجود میتواند همان مزایا را با هزینه کاهشیافته به همراه داشته باشد و تقویتکننده ابری را به انتخابی مقرونبهصرفهتر و بدون کاهش ارزش تبدیل کند.
بهینه سازی با Cloud Amplifier
بررسی های به روز Cloud Amplifier و cache TTL
با درک نحوه هزینهای که انبارها برای درخواستها دریافت میکنند، اکنون میتوانید در استفاده از بررسیهای تازه بودن دادههای Domo برای متعادل کردن نیاز به بهروزترین دادهها دقت بیشتری داشته باشید. به طور پیشفرض Snowflake Cloud Amplifier درخواستی را ارسال میکند که به شکل زیر است:
یک پرس و جو برای همه جداول در طرحواره ایجاد می شود. اگر DataSets را با Domo برای جداول پراکنده در 10 طرحواره مختلف ثبت کرده باشید، 10 درخواست به روز رسانی (یکی برای هر طرحواره) خواهید دید.
بیشتر موتورهای Cloud Amplifier برای بررسی بهروز بودن دادهها، پرس و جوی مشابهی انجام میدهند (اگرچه BigQuery از یک API استفاده میکند و یک پرسوجو برای Information.schema ضروری نیست). این درخواست برای تازهسازی دادهها نیازمند راهاندازی یک خوشه محاسباتی است. نتایج این درخواست به روز رسانی برای چندین عملیات استفاده می شود:
- تعیین اینکه آیا ETL باید اکنون در زمانی که داده های جدید در دسترس است اجرا شود
- اکنون ارزیابی هر مجموعه داده هشدار می دهد که داده های جدیدی وجود دارد
- تعیین اینکه آیا Domo باید دفعه بعد که داده درخواست میشود (یعنی نقشهای در Domo مشاهده میشود) از فضای ذخیرهسازی ابری پرس و جو کند یا اینکه همان دادهها قبلاً در حافظه پنهان Domo وجود دارد.
توجه: Domo نتایج جستجوهای فردی را ذخیره می کند، نه کل جدول داده ها را. کش TTL به طور پیش فرض روی 15 دقیقه تنظیم شده است
هزینه دسته چک های سلامت را محاسبه کنید
در زمان نوشتن این وبلاگ، این درخواستهای بهروزرسانی هر 15 دقیقه اجرا میشوند و معمولاً نیاز به یک خوشه محاسباتی دارند که در انبار ابری اجرا میشود (باز هم BigQuery یک استثنا است). اگر یک خوشه محاسباتی از قبل اجرا نشده باشد، یک خوشه محاسباتی راه اندازی می شود. سپس این نشان دهنده هزینه بالقوه برای کسب و کار شما است، بسته به اینکه آیا قبلاً یک خوشه محاسباتی در حال اجرا و راه اندازی دارید یا خیر.
بنابراین به دقت در نظر بگیرید که هر چند وقت یک بار داده های شما از قبل به روز می شوند. تنظیم فاصله بررسی تازه بودن بیشتر از زمانبندی بهروزرسانی دادهها، میتواند سربار غیرضروری را به یک خوشه محاسباتی اضافه کند.
ملاحظات دیگر این است که آیا میخواهید درخواستهای بررسی اعتبار در ساعات غیرفعال زمانی که مردم لزوماً دادهها را مشاهده یا استفاده نمیکنند اجرا شود یا خیر. برای مثال، ادامه اجرای درخواستهای بهروز در شب، زمانی که مردم معمولاً به Domo نگاه نمیکنند، میتواند منجر به هزینههای پنهان برای خوشههای محاسباتی شود که به سرعت جمع میشوند.
ناوبری تقویت کننده ابری و ملاحظات هزینه با Domo
ملاحظات هزینه می تواند دلهره آور به نظر برسد، اما Domo اینجاست تا از شما با ابزارهای مناسب برای رسیدگی موثر به این بحث ها پشتیبانی کند. ما متعهد هستیم که در این فرآیند به شما کمک کنیم و به ارائه مجموعه ای از پست های وبلاگ آینده برای راهنمایی شما ادامه خواهیم داد.
اگر نیاز یا سؤال خاصی دارید، با تیم حساب Domo خود تماس بگیرید تا جزئیات مورد استفاده خود را بررسی کنید.