Notes
۱۲ آذر
(استفتاء از حسین) الرت لودبالانسر: ریاپلای شدن هلمش
۱۱ آذر
سر تخصیص منابع و رزرو کردن cpu صحبت کردیم. تب جدید اضافه شد تو همین داک.
قرار شد گروه الرت image-pull-critical توسّط کیارش حذف بشه.
قبلیها
دیسک نودهایی که دست ما نیست الرت نگیریم
پاد پندینگ که مشخص نیست چه مشکلی داره -> معمولاً daemonsetها
کمبود منابع برای پادهای سیستمی -> priorityclass
(تسک) اعمال priority class برای همهی پادهای platform-system و kube-system
الرت مرتبط به نودهای استیجینگ
اولویتبندی الرتها
کمبود آیپی (به شکل تیکت قراره هندل شه)
سرتیفیکت apiserver
کلاستر c42 شبها notready میشه
ناتردی شدن نودهایی که خودشون درست میشن
الرتهای خراب
جیرا پندینگ ایشو
الرتهای غیرمرتبط به گاو میگیریم
میراندا، والت، اینا
آبشاری شدن الرتها وقتی نود از دسترس خارج میشه
پرشر
جاب فیلد
پاد پندینگ
شاید: inhibition rule بزنیم
بهبود وضعیت الرتمنیجر
شاید تغییرش :) => کارما
قرار دادن اکسپورتر برای سایلنتهایی که دارن اکسپایر میشن
جدیتر گرفتن over allocation سیپییو
جا به جا کردن vmهایی که روی سرورهایی با cpu usage بالا هستند. ESXi By VM
استفادهی حداکثری از هاردور الوکیتور به این صورت که اصلا دستی چیزی رو داستان نکنیم. ز همین رو میتونیم ورکفلو hw-allocator رو با صرفا پر کردن فیلدهای مربوط به دیسک و ریسورس vm و دیتاسنتر ران کنیم و سرور مناسب برای ماگریت پیدا کنیم.