- Kubernetes 事件是集群中状态变化的报告,提供系统通知和补充数据。事件具有有限的保留时间,主要字段包括 Type、Reason、Message、FirstTimestamp、LastTimestamp 和 Count。通过 kubectl 命令可以查询和监控事件。事件默认在 etcd 中保留1小时,为了长期保存,可以将事件导出到持久化日志系统或使用插件如 kube-eventer 和 kubernetes-event-exporter 进行管理和存储。hrn2024-09-1110
- 该文章详细介绍了BF3 DOCA软件包的安装过程。c****62024-09-1010
- 该文章详细解释了BF3容器支持的DOCA Service。c****62024-09-0610
- Postgres Operator 的作用是提供、修改配置和清理使用 Patroni 的 Postgres 集群,基本上是为了让在 K8s 上运行基于 Patroni 的集群变得简单方便。供应和修改一方面包括 K8s 资源,但也包括一旦集群启动并运行后的数据库和角色供应。我们尝试将尽可能多的工作留给 K8s 和适合它的 Patroni,尤其是集群引导程序和高可用性。然而,运营商参与了一些总体编排,例如滚动更新以改善用户体验。师****文2024-06-2820
- kubernetes的官方文献上提到,为了避免复杂的时钟同步问题,kubernetes的所有容器化的控制面组件都统一使用世界协调时UTC时间,类似calico,flannel这类的网络组件以及prometheus监控组件默认也都使用UTC时间。即便UTC时间比我们常用的CST时间慢8小时,kubernetes组件已经比较偏"系统"的网络、监控组件使用UTC时间对用户日常应用不会带来负面影响。但一旦在业务pod中误用UTC时间,以至于业务pod与节点本地时间相差8小时,可能会造成严重的业务故障。雷****杰2024-06-07170
- 使用kubeadm部署的kubernetes集群,在实际使用过程中非常容易遇到一个与etcd数据库体积超限而引发的错误,在etcd的pod日志,或执行kubectl指令、调用apiserver的api时都会看到该错误提示: ``` mvcc: database space exceeded ``` 该故障通常有两种原因: 1、etcd数据库大小超过etcd的磁盘配额。使用kubeadm工具部署的kubernetes集群etcd的磁盘空间配额默认是2G,比较容易触发超额 2、etcd数据目录所在磁盘空间不足雷****杰2024-06-07621
- 通常,kubernetes的证书过期都通过kubeadm工具来解决,但kubeadm并不处理kubelet的证书,kubelet使用了两类证书: 1)、client证书, 用于kubelet访问apiserver 2)、服务证书, kubelet在10250端口提供https服务 kubelet的client证书只有一年,一旦过期将导致节点`Not Ready`, kuernetes官方自1.8+版本以后默认开启自动轮替,通常不会造成生产问题 kubelet的server证书也只有一年有效期,由集群`ca`为`/etc/kubernetes/pki/ca.crt`签发,证书位置如下: ```shell cert: /var/lib/kubelet/pki/kubelet.crt key : /var/lib/kubelet/pki/kubelet.key ```雷****杰2024-06-07210
- 在刚部署的k8s集群中添加新的master节点时,报了error execution phase preflight: One or more conditions for hosting a new control plane instance is not satisfied的错误,接下来就针对此问题进行解决说明。SummerSnow2024-05-22390
- K8S的Informer模块封装list-watch API......贰拾画生2024-04-1892
- VMware虚拟机上kubevirt安装y****n2024-04-02120
- 使用docker运行kata容器有点麻烦,要用到docker in docker,因此这里用containerd。周朋肖2024-04-022693
- 长期以来,对于容器的“build once, run anywhere”的口号深信不疑。在生产环境中随意拉取公网上docker images,直接使用或在此基础上继续构建自己业务的现象比比皆是。今天我们先不谈镜像的仓库及安全更新问题,只就性能和兼容性问题,带大家看看这样做会给我们带来多大的麻烦。w****n2023-12-251024
- Systemd 是一系列工具的集合,其作用也远远不仅是启动操作系统,它还接管了后台服务、结束、状态查询,以及日志归档、设备管理、电源管理、定时任务等许多职责,并支持通过特定事件(如插入特定 USB 设备)和特定端口数据触发的 On-demand(按需)任务。卢****祥2023-12-15140
- InnoDB引擎有3种行锁算法,分别是: Record Lock : 单个记录上锁; Gap Lock : 间隙锁,锁定一个范围,但不包含记录本身;Next-key Lock : Gap Lock+Record Lock,锁定一个范围并包含记录本身。chuoo2023-11-30140
- pyenv是Python多版本管理工具。pyenv-virtualenv是python虚拟环境管理工具,主要用来管理Python 包的依赖,不同项目需要依赖的包版本不同,则需要使用虚拟环境。pyenv+virtualenv可以打造一个完美的python隔离环境。皇****刚2023-11-09240
- OpenAI的负载是上千节点规模的并行训练,在过去几年间,OpenAI的超算团队(Supercomputing team)在维护大规模k8s集群积累了丰富经验,这几篇文章主要介绍维护该集群遇到的各种问题和解决方案。李****武2023-11-08290
- watch是etcd的重要特性之一,有着非常广泛的应用,本文将详细介绍etcd watch设计原理与源码实现。徐****文2023-11-071880
- 我们集群中的pod通过multus-cni 实现了多网卡网络,但线上经常出现多网卡丢失的线上,现在分析一下multus的工作流程及源码,解决问题一个正经的博主2023-09-26381
- DelayQueue是一个无界阻塞队列,队列中的元素比较特殊,必须是实现了Delayed接口的元素chuoo2023-09-21141
- 本文对网络插件Terway进行预研,为自研underlay网络方案提供借鉴卖肥料的老父亲2023-09-20800
- 集群容器和容器组数据目录挂盘转储l****n2023-09-1960
- 为未使用过helm的使用者,提供一个快速入门的指导。hrn2023-08-31150
- Kubevela是OAM规范的一个实现,以下基于MAC来快速安装和体验。chuoo2023-08-2840
- k8s 提供的自动扩缩容能力,包含水平自动扩缩容(HPA)和垂直自动扩缩容(VPA)。HPA 和VPA 都是基于CPU 很内存资源的变化来动态调整POD 的部署。HPA 在生产使用比较多,VPA的使用较少(两者不能一起使用); 本文主要介绍VPA 的实现原理和实践。tbLu2023-08-23451
- 在 Kubernetes 集群中,网络和安全是非常重要的部分。而 Calico 是一个开源的网络和安全解决方案,用于在 Kubernetes 集群中提供容器网络和网络策略。本文将详细介绍 Calico 组件的原理、优势以及在 Kubernetes 中的应用。1****m2023-08-211110
- 本文通过实例的方式简述如何开发一个 containerd 插件,进行二次开发,定制 containerd。大瘾2023-08-151830
- 讲述docker容器隔离技术,实现在k8s集群中更精准的监控容器性能指标福尔摩斯军2023-08-10210
- 大数据组件Apache Pulsar内网离线部署流程:在完全离线的内网环境下使用官方Helm chart部署可用的Apache Pulsar集群,并进行消息收发功能测试逍遥排骨2023-08-041260
- 探究k8s备份迁移工具velero原理&结合MinIo实现容器化部署数据库的备份、恢复、迁移l****n2023-07-283000
共 56 条
- 1
- 2
页
- Kubernetes 事件是集群中状态变化的报告,提供系统通知和补充数据。事件具有有限的保留时间,主要字段包括 Type、Reason、Message、FirstTimestamp、LastTimestamp 和 Count。通过 kubectl 命令可以查询和监控事件。事件默认在 etcd 中保留1小时,为了长期保存,可以将事件导出到持久化日志系统或使用插件如 kube-eventer 和 kubernetes-event-exporter 进行管理和存储。
- 该文章详细介绍了BF3 DOCA软件包的安装过程。
- 该文章详细解释了BF3容器支持的DOCA Service。
- Postgres Operator 的作用是提供、修改配置和清理使用 Patroni 的 Postgres 集群,基本上是为了让在 K8s 上运行基于 Patroni 的集群变得简单方便。供应和修改一方面包括 K8s 资源,但也包括一旦集群启动并运行后的数据库和角色供应。我们尝试将尽可能多的工作留给 K8s 和适合它的 Patroni,尤其是集群引导程序和高可用性。然而,运营商参与了一些总体编排,例如滚动更新以改善用户体验。
- kubernetes的官方文献上提到,为了避免复杂的时钟同步问题,kubernetes的所有容器化的控制面组件都统一使用世界协调时UTC时间,类似calico,flannel这类的网络组件以及prometheus监控组件默认也都使用UTC时间。即便UTC时间比我们常用的CST时间慢8小时,kubernetes组件已经比较偏"系统"的网络、监控组件使用UTC时间对用户日常应用不会带来负面影响。但一旦在业务pod中误用UTC时间,以至于业务pod与节点本地时间相差8小时,可能会造成严重的业务故障。
- 使用kubeadm部署的kubernetes集群,在实际使用过程中非常容易遇到一个与etcd数据库体积超限而引发的错误,在etcd的pod日志,或执行kubectl指令、调用apiserver的api时都会看到该错误提示: ``` mvcc: database space exceeded ``` 该故障通常有两种原因: 1、etcd数据库大小超过etcd的磁盘配额。使用kubeadm工具部署的kubernetes集群etcd的磁盘空间配额默认是2G,比较容易触发超额 2、etcd数据目录所在磁盘空间不足
- 通常,kubernetes的证书过期都通过kubeadm工具来解决,但kubeadm并不处理kubelet的证书,kubelet使用了两类证书: 1)、client证书, 用于kubelet访问apiserver 2)、服务证书, kubelet在10250端口提供https服务 kubelet的client证书只有一年,一旦过期将导致节点`Not Ready`, kuernetes官方自1.8+版本以后默认开启自动轮替,通常不会造成生产问题 kubelet的server证书也只有一年有效期,由集群`ca`为`/etc/kubernetes/pki/ca.crt`签发,证书位置如下: ```shell cert: /var/lib/kubelet/pki/kubelet.crt key : /var/lib/kubelet/pki/kubelet.key ```
- 在刚部署的k8s集群中添加新的master节点时,报了error execution phase preflight: One or more conditions for hosting a new control plane instance is not satisfied的错误,接下来就针对此问题进行解决说明。
- K8S的Informer模块封装list-watch API......
- VMware虚拟机上kubevirt安装
- 使用docker运行kata容器有点麻烦,要用到docker in docker,因此这里用containerd。
- 长期以来,对于容器的“build once, run anywhere”的口号深信不疑。在生产环境中随意拉取公网上docker images,直接使用或在此基础上继续构建自己业务的现象比比皆是。今天我们先不谈镜像的仓库及安全更新问题,只就性能和兼容性问题,带大家看看这样做会给我们带来多大的麻烦。
- Systemd 是一系列工具的集合,其作用也远远不仅是启动操作系统,它还接管了后台服务、结束、状态查询,以及日志归档、设备管理、电源管理、定时任务等许多职责,并支持通过特定事件(如插入特定 USB 设备)和特定端口数据触发的 On-demand(按需)任务。
- 根据网上资料整理的图解云原生容器化架构k8s
- InnoDB引擎有3种行锁算法,分别是: Record Lock : 单个记录上锁; Gap Lock : 间隙锁,锁定一个范围,但不包含记录本身;Next-key Lock : Gap Lock+Record Lock,锁定一个范围并包含记录本身。
- pyenv是Python多版本管理工具。pyenv-virtualenv是python虚拟环境管理工具,主要用来管理Python 包的依赖,不同项目需要依赖的包版本不同,则需要使用虚拟环境。pyenv+virtualenv可以打造一个完美的python隔离环境。
- OpenAI的负载是上千节点规模的并行训练,在过去几年间,OpenAI的超算团队(Supercomputing team)在维护大规模k8s集群积累了丰富经验,这几篇文章主要介绍维护该集群遇到的各种问题和解决方案。
- watch是etcd的重要特性之一,有着非常广泛的应用,本文将详细介绍etcd watch设计原理与源码实现。
- 我们集群中的pod通过multus-cni 实现了多网卡网络,但线上经常出现多网卡丢失的线上,现在分析一下multus的工作流程及源码,解决问题
- DelayQueue是一个无界阻塞队列,队列中的元素比较特殊,必须是实现了Delayed接口的元素
- 本文对网络插件Terway进行预研,为自研underlay网络方案提供借鉴
- 集群容器和容器组数据目录挂盘转储
- 为未使用过helm的使用者,提供一个快速入门的指导。
- Kubevela是OAM规范的一个实现,以下基于MAC来快速安装和体验。
- k8s 提供的自动扩缩容能力,包含水平自动扩缩容(HPA)和垂直自动扩缩容(VPA)。HPA 和VPA 都是基于CPU 很内存资源的变化来动态调整POD 的部署。HPA 在生产使用比较多,VPA的使用较少(两者不能一起使用); 本文主要介绍VPA 的实现原理和实践。
- 在 Kubernetes 集群中,网络和安全是非常重要的部分。而 Calico 是一个开源的网络和安全解决方案,用于在 Kubernetes 集群中提供容器网络和网络策略。本文将详细介绍 Calico 组件的原理、优势以及在 Kubernetes 中的应用。
- 本文通过实例的方式简述如何开发一个 containerd 插件,进行二次开发,定制 containerd。
- 讲述docker容器隔离技术,实现在k8s集群中更精准的监控容器性能指标
- 大数据组件Apache Pulsar内网离线部署流程:在完全离线的内网环境下使用官方Helm chart部署可用的Apache Pulsar集群,并进行消息收发功能测试
- 探究k8s备份迁移工具velero原理&结合MinIo实现容器化部署数据库的备份、恢复、迁移
点击加载更多