lib/streamaggr: do not flush dedup shards in parallel

This significantly increases CPU usage on systems with many CPU cores, while doesn't reduce flush latency too much
2025-02-09 15:27:11 +00:00 · 2024-03-04 16:59:19 +02:00 · 2024-03-04 16:59:19 +02:00 · eb40395a1c
commit eb40395a1c
parent 946814afee
2 changed files with 8 additions and 14 deletions
--- a/lib/streamaggr/dedup.go
+++ b/lib/streamaggr/dedup.go
@ -113,22 +113,14 @@ func (ctx *dedupFlushCtx) reset() {
 }
 func (da *dedupAggr) flush(f func(samples []pushSample)) {
-	var wg sync.WaitGroup
+	// Do not flush shards in parallel, since this significantly increases CPU usage
 	// on systems with many CPU cores, while doesn't improve flush latency too much.
 	ctx := getDedupFlushCtx()
 	for i := range da.shards {
-		flushConcurrencyCh <- struct{}{}
+		ctx.reset()
-		wg.Add(1)
+		da.shards[i].flush(ctx, f)
 		go func(shard *dedupAggrShard) {
 			defer func() {
 				<-flushConcurrencyCh
 				wg.Done()
 			}()
 			ctx := getDedupFlushCtx()
 			shard.flush(ctx, f)
 			putDedupFlushCtx(ctx)
 		}(&da.shards[i])
 	}
-	wg.Wait()
+	putDedupFlushCtx(ctx)
 }
 type perShardSamples struct {
--- a/lib/streamaggr/streamaggr.go
+++ b/lib/streamaggr/streamaggr.go
@ -670,7 +670,9 @@ func (a *aggregator) dedupFlush(dedupInterval time.Duration) {
 	startTime := time.Now()
 	flushConcurrencyCh <- struct{}{}
 	a.da.flush(a.pushSamples)
 	<-flushConcurrencyCh
 	d := time.Since(startTime)
 	a.dedupFlushDuration.Update(d.Seconds())