Есть ли способ группировать результаты из нескольких документов при выполнении агрегации

#mongodb #mongodb-query #aggregation-framework

#mongodb #mongodb-запрос #aggregation-framework

Вопрос:

Я новичок в mongo и пытаюсь выполнить запрос агрегации, чтобы вычислить минимальное / максимальное количество временных меток для данного документа.

Примеры документов приведены ниже —

 {
"_id" : ObjectId("5c9cd93adddca9ebb2b3fcba"),
"frequency" : 5,
"s_id" : "30081993",
"timestamp" : NumberLong(1546300800000),
"date" : ISODate("2019-01-01T00:00:00.000Z"),

"values" : {
    "1547439900000" : {
        "number_of_values" : 3,
        "min_value" : 32.13,
        "max_value" : 81.42
    },
    "1547440200000" : {
        "number_of_values" : 3,
        "min_value" : 48.08,
        "max_value" : 84.52
    },
    "1547440500000" : {
        "number_of_values" : 2,
        "min_value" : 27.39,
        "max_value" : 94.64
    }
  }
}
  

 {
"_id" : ObjectId("5c9cd851dddca9ebb2b3f2ac"),
"frequency" : 5,
"s_id" : "27061995",
"timestamp" : NumberLong(1546300800000),
"date" : ISODate("2019-01-01T00:00:00.000Z"),

"values" : {
    "1547539900000" : {
        "number_of_values" : 31,
        "min_value" : 322.13,
        "max_value" : 831.42
    },
    "1547540200000" : {
        "number_of_values" : 3,
        "min_value" : 418.08,
        "max_value" : 8114.52
    },
    "1547740500000" : {
        "number_of_values" : 2,
        "min_value" : 207.39,
        "max_value" : 940.64
    }
  }
}
  

Я придумал следующий запрос, который работает для одного документа.

     db.testdb.aggregate([
      {
        $match: {
          "s_id": "30081993",
          "frequency": 5,

        }
      },
      {
        $project: {
          _id: 1,
          valuesarray: {
            $objectToArray: "$values"
          }
        }
      },
      {
        $unwind: "$valuesarray"
      },
      {
        $group: {
          "_id": "",
          "min_timestamp": {
            $min: "$valuesarray.k"
          },
          "max_timestamp": {
            $max: "$valuesarray.k"
          }
        }
      }
    ]);
  

Вывод приведен ниже

 {
    "_id" : "",
    "min_timestamp" : "1547439900000",
    "max_timestamp" : "1547440500000"
}
  

Мне нужен запрос агрегации, который может вычислять максимальное / минимальное количество временных меток, но для нескольких документов, т. е. я хочу использовать оператор $ in на этапе $ match и получить минимальное / максимальное значение всех s_id. Возможно ли это?

Ожидается :

 {
    "_id" : "30081993",
    "min_timestamp" : "1547439900000",
    "max_timestamp" : "1547440500000"
}


{
    "_id" : "27061995",
    "min_timestamp" : "1547539900000",
    "max_timestamp" : "1547740500000"
}
  

Ответ №1:

Да, требуются лишь небольшие изменения, чтобы это работало для нескольких документов.

На $match этапе укажите свой $in запрос:

 $match: {
    "s_id": { $in : [ "30081993", "27061995" ] }, 
    "frequency": 5,
}
  

На $project этапе переименуйте s_id в _id , чтобы гарантировать, что мы сохраняем s_id связанные с каждым документом:

 $project: {
    _id: "$s_id",
    valuesarray: {
        $objectToArray: "$values"
    }
}
  

На $group этапе группируйте по _id (первоначально s_id ), чтобы убедиться, что мы правильно группируем временные метки перед вычислением $min / $max :

 $group: {
    "_id": "$_id",
    "min_timestamp": {
        $min: "$valuesarray.k"
    },
    "max_timestamp": {
        $max: "$valuesarray.k"
    }
}
  

Весь конвейер:

 db.testdb.aggregate([
  {
    $match: {
      "s_id": { $in : [ "30081993", "27061995" ] }, 
      "frequency": 5,
    }
  },
  {
    $project: {
      _id: "$s_id",
      valuesarray: {
        $objectToArray: "$values"
      }
    }
  },
  {
    $unwind: "$valuesarray"
  },
  {
    $group: {
      "_id": "$_id",
      "min_timestamp": {
        $min: "$valuesarray.k"
      },
      "max_timestamp": {
        $max: "$valuesarray.k"
      }
    }
  }
]);