VictoriaMetrics/lib/logstorage/pipe_unpack_logfmt.go

package logstorage

import (
	"fmt"
	"slices"
)

// pipeUnpackLogfmt processes '| unpack_logfmt ...' pipe.
//
// See https://docs.victoriametrics.com/victorialogs/logsql/#unpack_logfmt-pipe
type pipeUnpackLogfmt struct {
	// fromField is the field to unpack logfmt fields from
	fromField string

	// fields is an optional list of fields to extract from logfmt.
	//
	// if it is empty, then all the fields are extracted.
	fields []string

	// resultPrefix is prefix to add to unpacked field names
	resultPrefix string

	keepOriginalFields bool
	skipEmptyResults   bool

	// iff is an optional filter for skipping unpacking logfmt
	iff *ifFilter
}

func (pu *pipeUnpackLogfmt) String() string {
	s := "unpack_logfmt"
	if pu.iff != nil {
		s += " " + pu.iff.String()
	}
	if !isMsgFieldName(pu.fromField) {
		s += " from " + quoteTokenIfNeeded(pu.fromField)
	}
	if len(pu.fields) > 0 {
		s += " fields (" + fieldsToString(pu.fields) + ")"
	}
	if pu.resultPrefix != "" {
		s += " result_prefix " + quoteTokenIfNeeded(pu.resultPrefix)
	}
	if pu.keepOriginalFields {
		s += " keep_original_fields"
	}
	if pu.skipEmptyResults {
		s += " skip_empty_results"
	}
	return s
}

func (pu *pipeUnpackLogfmt) updateNeededFields(neededFields, unneededFields fieldsSet) {
	updateNeededFieldsForUnpackPipe(pu.fromField, pu.fields, pu.keepOriginalFields, pu.skipEmptyResults, pu.iff, neededFields, unneededFields)
}

func (pu *pipeUnpackLogfmt) newPipeProcessor(workersCount int, _ <-chan struct{}, _ func(), ppBase pipeProcessor) pipeProcessor {
	unpackLogfmt := func(uctx *fieldsUnpackerContext, s string) {
		p := getLogfmtParser()

		p.parse(s)
		if len(pu.fields) == 0 {
			for _, f := range p.fields {
				uctx.addField(f.Name, f.Value)
			}
		} else {
			for _, fieldName := range pu.fields {
				addedField := false
				for _, f := range p.fields {
					if f.Name == fieldName {
						uctx.addField(f.Name, f.Value)
						addedField = true
						break
					}
				}
				if !addedField {
					uctx.addField(fieldName, "")
				}
			}
		}

		putLogfmtParser(p)
	}

	return newPipeUnpackProcessor(workersCount, unpackLogfmt, ppBase, pu.fromField, pu.resultPrefix, pu.keepOriginalFields, pu.skipEmptyResults, pu.iff)

}

func parsePipeUnpackLogfmt(lex *lexer) (*pipeUnpackLogfmt, error) {
	if !lex.isKeyword("unpack_logfmt") {
		return nil, fmt.Errorf("unexpected token: %q; want %q", lex.token, "unpack_logfmt")
	}
	lex.nextToken()

	var iff *ifFilter
	if lex.isKeyword("if") {
		f, err := parseIfFilter(lex)
		if err != nil {
			return nil, err
		}
		iff = f
	}

	fromField := "_msg"
	if lex.isKeyword("from") {
		lex.nextToken()
		f, err := parseFieldName(lex)
		if err != nil {
			return nil, fmt.Errorf("cannot parse 'from' field name: %w", err)
		}
		fromField = f
	}

	var fields []string
	if lex.isKeyword("fields") {
		lex.nextToken()
		fs, err := parseFieldNamesInParens(lex)
		if err != nil {
			return nil, fmt.Errorf("cannot parse 'fields': %w", err)
		}
		fields = fs
		if slices.Contains(fields, "*") {
			fields = nil
		}
	}

	resultPrefix := ""
	if lex.isKeyword("result_prefix") {
		lex.nextToken()
		p, err := getCompoundToken(lex)
		if err != nil {
			return nil, fmt.Errorf("cannot parse 'result_prefix': %w", err)
		}
		resultPrefix = p
	}

	keepOriginalFields := false
	skipEmptyResults := false
	switch {
	case lex.isKeyword("keep_original_fields"):
		lex.nextToken()
		keepOriginalFields = true
	case lex.isKeyword("skip_empty_results"):
		lex.nextToken()
		skipEmptyResults = true
	}

	pu := &pipeUnpackLogfmt{
		fromField:          fromField,
		fields:             fields,
		resultPrefix:       resultPrefix,
		keepOriginalFields: keepOriginalFields,
		skipEmptyResults:   skipEmptyResults,
		iff:                iff,
	}

	return pu, nil
}
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`package logstorage`

			`import (`
			`"fmt"`
lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`"slices"`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`)`

			`// pipeUnpackLogfmt processes '\| unpack_logfmt ...' pipe.`
			`//`
			`// See https://docs.victoriametrics.com/victorialogs/logsql/#unpack_logfmt-pipe`
			`type pipeUnpackLogfmt struct {`
lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`// fromField is the field to unpack logfmt fields from`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`fromField string`

lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`// fields is an optional list of fields to extract from logfmt.`
			`//`
			`// if it is empty, then all the fields are extracted.`
			`fields []string`

			`// resultPrefix is prefix to add to unpacked field names`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`resultPrefix string`
lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00
lib/logstorage: work-in-progress 2024-05-24 22:30:58 +00:00			`keepOriginalFields bool`
			`skipEmptyResults bool`

lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`// iff is an optional filter for skipping unpacking logfmt`
			`iff *ifFilter`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`}`

			`func (pu *pipeUnpackLogfmt) String() string {`
			`s := "unpack_logfmt"`
lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`if pu.iff != nil {`
			`s += " " + pu.iff.String()`
			`}`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`if !isMsgFieldName(pu.fromField) {`
			`s += " from " + quoteTokenIfNeeded(pu.fromField)`
			`}`
lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`if len(pu.fields) > 0 {`
			`s += " fields (" + fieldsToString(pu.fields) + ")"`
			`}`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`if pu.resultPrefix != "" {`
			`s += " result_prefix " + quoteTokenIfNeeded(pu.resultPrefix)`
			`}`
lib/logstorage: work-in-progress 2024-05-24 22:30:58 +00:00			`if pu.keepOriginalFields {`
			`s += " keep_original_fields"`
			`}`
			`if pu.skipEmptyResults {`
			`s += " skip_empty_results"`
			`}`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`return s`
			`}`

			`func (pu *pipeUnpackLogfmt) updateNeededFields(neededFields, unneededFields fieldsSet) {`
lib/logstorage: work-in-progress 2024-05-24 22:30:58 +00:00			`updateNeededFieldsForUnpackPipe(pu.fromField, pu.fields, pu.keepOriginalFields, pu.skipEmptyResults, pu.iff, neededFields, unneededFields)`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`}`

			`func (pu *pipeUnpackLogfmt) newPipeProcessor(workersCount int, _ <-chan struct{}, _ func(), ppBase pipeProcessor) pipeProcessor {`
lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`unpackLogfmt := func(uctx *fieldsUnpackerContext, s string) {`
			`p := getLogfmtParser()`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00
lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`p.parse(s)`
			`if len(pu.fields) == 0 {`
			`for _, f := range p.fields {`
			`uctx.addField(f.Name, f.Value)`
			`}`
			`} else {`
			`for _, fieldName := range pu.fields {`
			`addedField := false`
			`for _, f := range p.fields {`
			`if f.Name == fieldName {`
			`uctx.addField(f.Name, f.Value)`
			`addedField = true`
			`break`
			`}`
			`}`
			`if !addedField {`
			`uctx.addField(fieldName, "")`
			`}`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`}`
			`}`
lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00
			`putLogfmtParser(p)`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`}`

lib/logstorage: work-in-progress 2024-05-24 22:30:58 +00:00			`return newPipeUnpackProcessor(workersCount, unpackLogfmt, ppBase, pu.fromField, pu.resultPrefix, pu.keepOriginalFields, pu.skipEmptyResults, pu.iff)`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00
			`}`

			`func parsePipeUnpackLogfmt(lex lexer) (pipeUnpackLogfmt, error) {`
			`if !lex.isKeyword("unpack_logfmt") {`
			`return nil, fmt.Errorf("unexpected token: %q; want %q", lex.token, "unpack_logfmt")`
			`}`
			`lex.nextToken()`

lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`var iff *ifFilter`
			`if lex.isKeyword("if") {`
			`f, err := parseIfFilter(lex)`
			`if err != nil {`
			`return nil, err`
			`}`
			`iff = f`
			`}`

lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`fromField := "_msg"`
			`if lex.isKeyword("from") {`
			`lex.nextToken()`
			`f, err := parseFieldName(lex)`
			`if err != nil {`
			`return nil, fmt.Errorf("cannot parse 'from' field name: %w", err)`
			`}`
			`fromField = f`
			`}`

lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`var fields []string`
			`if lex.isKeyword("fields") {`
			`lex.nextToken()`
			`fs, err := parseFieldNamesInParens(lex)`
			`if err != nil {`
			`return nil, fmt.Errorf("cannot parse 'fields': %w", err)`
			`}`
			`fields = fs`
			`if slices.Contains(fields, "*") {`
			`fields = nil`
			`}`
			`}`

lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`resultPrefix := ""`
			`if lex.isKeyword("result_prefix") {`
			`lex.nextToken()`
			`p, err := getCompoundToken(lex)`
			`if err != nil {`
			`return nil, fmt.Errorf("cannot parse 'result_prefix': %w", err)`
			`}`
			`resultPrefix = p`
			`}`

lib/logstorage: work-in-progress 2024-05-24 22:30:58 +00:00			`keepOriginalFields := false`
			`skipEmptyResults := false`
			`switch {`
			`case lex.isKeyword("keep_original_fields"):`
			`lex.nextToken()`
			`keepOriginalFields = true`
			`case lex.isKeyword("skip_empty_results"):`
			`lex.nextToken()`
			`skipEmptyResults = true`
			`}`

lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`pu := &pipeUnpackLogfmt{`
lib/logstorage: work-in-progress 2024-05-24 22:30:58 +00:00			`fromField: fromField,`
			`fields: fields,`
			`resultPrefix: resultPrefix,`
			`keepOriginalFields: keepOriginalFields,`
			`skipEmptyResults: skipEmptyResults,`
			`iff: iff,`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`}`

lib/logstorage: work-in-progress 2024-05-22 19:01:20 +00:00			`return pu, nil`
lib/logstorage: work-in-progress 2024-05-20 02:08:30 +00:00			`}`