چگونه استراتژی ذخیره سازی داده خود را با Cloud Amplifier بهینه کنید


تقویت‌کننده ابری Domo، روشی را تغییر می‌دهد که افراد می‌توانند داده‌ها را از سیستم‌های متفاوت جمع آوری کنند تا بتوانند با دردسر کمتر تأثیر واقعی بگذارند. Cloud Amplifier با زیرساخت داده‌ای که قبلاً استفاده می‌کنید کار می‌کند و تبدیل، تجسم و انتقال داده‌ها را آسان می‌کند.

این ابزار همچنین می‌تواند به شما در صرفه‌جویی در هزینه‌ها کمک کند و این کارها را در فضای ذخیره‌سازی ابری خود راحت‌تر انجام دهید. بیایید در مورد اینکه چگونه Cloud Amplifier می تواند بر هزینه های ذخیره سازی ابری شما تأثیر بگذارد، به علاوه استراتژی هایی برای بهینه سازی آنها صحبت کنیم.

نحوه شارژ ارائه دهندگان فضای ابری معمولا

ارائه‌دهندگان انبار ابری بر اساس تعداد خوشه‌های محاسباتی که به عنوان انبارهای مجازی نیز شناخته می‌شوند، برای پردازش درخواست‌های داده استفاده می‌شوند، هزینه می‌دهند. به هر خوشه مقدار معینی از قدرت پردازش، حافظه و ذخیره سازی موقت برای اجرای درخواست ها اختصاص داده می شود.

این خوشه‌ها به گونه‌ای طراحی شده‌اند که برای حداقل دوره‌های تنظیم‌شده اجرا شوند و زمان خاموشی تنظیم شده باشند. به عبارت دیگر، اگر هیچ درخواستی اجرا نشود، پس از مدت زمان مشخصی به طور خودکار خاموش می شود. این تنظیم به تعیین هزینه استفاده از خدمات ذخیره سازی ابری کمک می کند.

فقط یک درخواست می تواند باعث شود که یک خوشه محاسباتی کار کند که هزینه دارد. به همین دلیل است که مدیران پایگاه داده و مهندسان داده به دقت مراقب زمان و نحوه پرس و جو هستند. آن‌ها می‌خواهند از خرج کردن پول برای خوشه‌های محاسباتی غیرضروری جلوگیری کنند و فرصت‌هایی را بیابند که منابع کمتری بتوانند همان کار را انجام دهند. این نظارت دقیق به جلوگیری از هزینه‌های غیرضروری کمک می‌کند و همه چیز را کارآمد نگه می‌دارد.

مطالعه موردی با Snowflake

وظیفه: دو درخواست، هر کدام حدود پنج ثانیه طول می کشد

سناریو 1: انبارهای دوگانه

بیایید تصور کنیم از Snowflake با دو درخواست استفاده کنیم که هر کدام حدود پنج ثانیه طول می کشد. اگر هر درخواست در انبار بسیار کوچک خود (یعنی یک خوشه محاسباتی) اجرا شود و آن انبارها پس از 60 ثانیه عدم فعالیت بسته شوند، در نهایت برای مدتی بیشتر از آنچه انتظار دارید هزینه پرداخت می کنید. در این مورد، از آنجایی که هیچ درخواست دیگری برای اشغال آنها وجود نداشت، هر انبار در مجموع 65 ثانیه کار کرد. از آنجایی که از دو انبار جداگانه استفاده شده است، این بدان معناست که شما در مجموع 130 ثانیه زمان محاسبه را پرداخت کرده اید.

سناریو 2: انبار تک

در این سناریوی دوم، تصور کنید که همان دو پرس و جو را اجرا کنید، اما این بار فقط از یک انبار مجازی استفاده کنید. از آنجایی که این انبار دارای CPU، حافظه و حافظه کافی برای رسیدگی به هر دو درخواست به طور همزمان است، آنها با هم پردازش می شوند. این راه‌اندازی تنها از 65 ثانیه زمان انبار برای هر دو درخواست استفاده می‌کند، که به طور موثر هزینه‌ها را در مقایسه با استفاده از دو انبار جداگانه به نصف کاهش می‌دهد.

انتخاب استراتژی انبار شما: تخصیص هزینه در مقابل صرفه جویی در هزینه

پس چرا می خواهید چندین خوشه محاسباتی را به طور همزمان اجرا کنید؟ هنگام مدیریت داده ها، استفاده از خوشه های محاسباتی متعدد به دلایل مختلفی می تواند منطقی باشد:

  • انبارها می توانند به عنوان جایگزین عالی برای مراکز هزینه و تخصیص بودجه عمل کنند.
  • شما می توانید گروه های مختلفی از خوشه های محاسباتی برای انواع مختلف وظایف داشته باشید.
  • ممکن است محدودیت‌هایی داشته باشید که زمان اجرای خوشه‌های محاسباتی خاص را محدود می‌کند.

اکنون باید مصالحه ای را در نظر بگیریم. اگر استراتژی شرکت شما در درجه اول کاهش هزینه ها در صورت امکان است، استفاده از خوشه هایی که در حال حاضر کار می کنند منطقی است. زمانی که یک خوشه محاسباتی در حال اجرا است، از قبل برای CPU، حافظه و فضای ذخیره سازی پرداخت می کنید. چرا از آنها نهایت استفاده را نمی کنیم؟ به این ترتیب، آنچه را که قبلاً روی آن سرمایه گذاری کرده اید به حداکثر می رسانید.

اگر استراتژی شما درک روشنی از هزینه‌های پروژه‌ها یا بخش‌های خاص را در اولویت قرار می‌دهد، می‌توانید انتخاب کنید که دسته‌های محاسباتی منفرد را متناسب با آن نیازها تنظیم کنید.

این رویکرد با همسو کردن هزینه ها با مناطقی که از نزدیک نظارت می کنید، دید هزینه شما را بهبود می بخشد. با این حال، خطر استفاده از خوشه‌های محاسباتی متعددی است که به طور کامل مورد استفاده قرار نمی‌گیرند و کمتر از ظرفیت خود کار می‌کنند – استفاده ناکارآمد از منابع.

پس من چه چیزی را توصیه می کنم؟ استفاده از خوشه های محاسباتی موجود به جای ایجاد خوشه های جدید به طور خاص برای Cloud Amplifier اغلب مقرون به صرفه تر است. در حالی که ممکن است دلایل خوبی برای ایجاد کلاسترهای اختصاصی برای اتصالات Cloud Amplifier وجود داشته باشد، آنها اغلب می توانند منجر به هزینه های بالاتر شوند.

از سوی دیگر، استفاده مجدد از خوشه‌های موجود می‌تواند همان مزایا را با هزینه کاهش‌یافته به همراه داشته باشد و تقویت‌کننده ابری را به انتخابی مقرون‌به‌صرفه‌تر و بدون کاهش ارزش تبدیل کند.

بهینه سازی با Cloud Amplifier

بررسی های به روز Cloud Amplifier و cache TTL

با درک نحوه هزینه‌ای که انبارها برای درخواست‌ها دریافت می‌کنند، اکنون می‌توانید در استفاده از بررسی‌های تازه بودن داده‌های Domo برای متعادل کردن نیاز به به‌روزترین داده‌ها دقت بیشتری داشته باشید. به طور پیش‌فرض Snowflake Cloud Amplifier درخواستی را ارسال می‌کند که به شکل زیر است:

جستجوی پیش‌فرض Cloud Amplifier برای Snowflake

یک پرس و جو برای همه جداول در طرحواره ایجاد می شود. اگر DataSets را با Domo برای جداول پراکنده در 10 طرحواره مختلف ثبت کرده باشید، 10 درخواست به روز رسانی (یکی برای هر طرحواره) خواهید دید.

بیشتر موتورهای Cloud Amplifier برای بررسی به‌روز بودن داده‌ها، پرس و جوی مشابهی انجام می‌دهند (اگرچه BigQuery از یک API استفاده می‌کند و یک پرس‌وجو برای Information.schema ضروری نیست). این درخواست برای تازه‌سازی داده‌ها نیازمند راه‌اندازی یک خوشه محاسباتی است. نتایج این درخواست به روز رسانی برای چندین عملیات استفاده می شود:

  • تعیین اینکه آیا ETL باید اکنون در زمانی که داده های جدید در دسترس است اجرا شود
  • اکنون ارزیابی هر مجموعه داده هشدار می دهد که داده های جدیدی وجود دارد
  • تعیین اینکه آیا Domo باید دفعه بعد که داده درخواست می‌شود (یعنی نقشه‌ای در Domo مشاهده می‌شود) از فضای ذخیره‌سازی ابری پرس و جو کند یا اینکه همان داده‌ها قبلاً در حافظه پنهان Domo وجود دارد.

توجه: Domo نتایج جستجوهای فردی را ذخیره می کند، نه کل جدول داده ها را. کش TTL به طور پیش فرض روی 15 دقیقه تنظیم شده است

هزینه دسته چک های سلامت را محاسبه کنید

در زمان نوشتن این وبلاگ، این درخواست‌های به‌روزرسانی هر 15 دقیقه اجرا می‌شوند و معمولاً نیاز به یک خوشه محاسباتی دارند که در انبار ابری اجرا می‌شود (باز هم BigQuery یک استثنا است). اگر یک خوشه محاسباتی از قبل اجرا نشده باشد، یک خوشه محاسباتی راه اندازی می شود. سپس این نشان دهنده هزینه بالقوه برای کسب و کار شما است، بسته به اینکه آیا قبلاً یک خوشه محاسباتی در حال اجرا و راه اندازی دارید یا خیر.

بنابراین به دقت در نظر بگیرید که هر چند وقت یک بار داده های شما از قبل به روز می شوند. تنظیم فاصله بررسی تازه بودن بیشتر از زمان‌بندی به‌روزرسانی داده‌ها، می‌تواند سربار غیرضروری را به یک خوشه محاسباتی اضافه کند.

ملاحظات دیگر این است که آیا می‌خواهید درخواست‌های بررسی اعتبار در ساعات غیرفعال زمانی که مردم لزوماً داده‌ها را مشاهده یا استفاده نمی‌کنند اجرا شود یا خیر. برای مثال، ادامه اجرای درخواست‌های به‌روز در شب، زمانی که مردم معمولاً به Domo نگاه نمی‌کنند، می‌تواند منجر به هزینه‌های پنهان برای خوشه‌های محاسباتی شود که به سرعت جمع می‌شوند.

ناوبری تقویت کننده ابری و ملاحظات هزینه با Domo

ملاحظات هزینه می تواند دلهره آور به نظر برسد، اما Domo اینجاست تا از شما با ابزارهای مناسب برای رسیدگی موثر به این بحث ها پشتیبانی کند. ما متعهد هستیم که در این فرآیند به شما کمک کنیم و به ارائه مجموعه ای از پست های وبلاگ آینده برای راهنمایی شما ادامه خواهیم داد.

اگر نیاز یا سؤال خاصی دارید، با تیم حساب Domo خود تماس بگیرید تا جزئیات مورد استفاده خود را بررسی کنید.




دیدگاهتان را بنویسید