目前团队使用argo-cd做为统一发布平台,承接所有的环境的发布,最近碰到一个很有意思的问题(下文描述),跟随这个问题引出另一个问题: argo-cd是如何绑定资源的呢?用了argo-cd这么久了,感叹自己从来都没细致研究过,呵呵了.

阅读全文 »

argocd配合GitOps,可以实现对kubernetes多集群的应用版本管理,目前已用于我负责的业务环境中实现统一发布平台.

在这里记录下使用argocd踩过的坑, 不定期更新

阅读全文 »

接上篇,主要介绍了kube-batch中两个重要的对象,queue及podgroup,这次主要讲讲kube-batch的核心的几个模块

阅读全文 »

上篇简单说了下在集群中安装kube-batch且成功运行起来之后, 现在开始对kube-batch中的一些概念进行阐明, 先从podgroup及queue说起

阅读全文 »

记录下遇到的有趣的shell代码, 可能是一些常用的snippet, 也可能是使用的时候不经意踩到的坑

不定时更新

阅读全文 »

上一篇中简单介绍了下kube-batch,这篇来简单说一下kube-batch的安装及配置,虽然官方github写的非常清楚,一来做个汇总,二来有些地方需要特别说明一下

阅读全文 »

k8s默认的调度器无法更好地实现对pod的All or Nothing调度能力, 在HPC或者分布式训练场景中,批处理能力对资源的使用率尤为重要.

阅读全文 »
0%