Name: Prometheus Querying
Author: bhagyesh-raut-incontact

搵技能.../

Prometheus Querying | Skills Pool

list_prometheus_metric_names(match="container_cpu")

list_prometheus_metric_metadata(metric="http_requests_total")

list_prometheus_label_names()

list_prometheus_label_values(label_name="namespace")
list_prometheus_label_values(label_name="pod", match="app=my-service")

Type	Description	Example
Counter	Always increasing	`http_requests_total`
Gauge	Can go up or down	`container_memory_usage_bytes`
Histogram	Distribution of values	`http_request_duration_seconds`
Summary	Quantiles over time	`go_gc_duration_seconds`

Function	Use Case	Example
`rate()`	Per-second rate for counters	`rate(http_requests_total[5m])`
`irate()`	Instant rate (spiky data)	`irate(http_requests_total[2m])`
`increase()`	Total increase over range	`increase(errors_total[1h])`
`sum()`	Aggregate by summing	`sum(rate(requests[5m])) by (service)`
`avg()`	Aggregate by averaging	`avg(cpu_usage) by (node)`
`max()`	Maximum value	`max(memory_bytes) by (pod)`
`min()`	Minimum value	`min(disk_free_bytes) by (node)`
`count()`	Count series	`count(up) by (job)`
`histogram_quantile()`	Percentile from histogram	`histogram_quantile(0.99, rate(duration_bucket[5m]))`
`abs()`	Absolute value	`abs(delta(temp[1h]))`
`predict_linear()`	Linear prediction	`predict_linear(disk_bytes[1h], 4*3600)`

metric{label="exact"}          # Exact match
metric{label!="value"}         # Not equal
metric{label=~"pattern.*"}     # Regex match
metric{label!~"pattern.*"}     # Regex not match

sum(rate(container_cpu_usage_seconds_total{container!=""}[5m])) by (pod, namespace)

container_memory_working_set_bytes{container!=""} / 1024 / 1024

sum(rate(container_cpu_usage_seconds_total[5m])) by (pod)
  / sum(kube_pod_container_resource_limits{resource="cpu"}) by (pod)

container_memory_working_set_bytes
  / kube_pod_container_resource_limits{resource="memory"}

increase(kube_pod_container_status_restarts_total[1h]) > 0

kube_pod_status_ready{condition="true"} == 0

sum(rate(http_requests_total[5m])) by (service, method, status)

sum(rate(http_requests_total{status=~"5.."}[5m])) by (service)
  / sum(rate(http_requests_total[5m])) by (service)

histogram_quantile(0.99,
  sum(rate(http_request_duration_seconds_bucket[5m])) by (service, le)
)

sum(rate(http_request_duration_seconds_sum[5m])) by (service)
  / sum(rate(http_request_duration_seconds_count[5m])) by (service)

1 - avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) by (instance)

node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes

1 - (node_filesystem_avail_bytes / node_filesystem_size_bytes)

sum(rate(node_network_receive_bytes_total[5m])) by (instance)
sum(rate(node_network_transmit_bytes_total[5m])) by (instance)

Prometheus Querying

Prometheus Querying Skill

Available Operations

Execute a Query

List Metric Names

Prometheus Querying

Prometheus Querying Skill

Available Operations

Execute a Query

List Metric Names

Get Metric Metadata

List Label Names

List Label Values

PromQL Quick Reference

Metric Types

Essential PromQL Functions

Label Matchers

Common Query Patterns

Kubernetes Resource Monitoring

HTTP / Service Metrics

Infrastructure Metrics

Common Workflows

Investigate High CPU Usage

Calculate Error Rate for a Service

Find Metrics for a Service

Best Practices

Bluebubbles

Add Tracing

Analytics Events

Add Expert

Arthas

Arthas Eagleeye Traceid