#mongodb #mongodb-query #aggregation-framework
#mongodb #mongodb-запрос #aggregation-framework
Вопрос:
Я новичок в mongo и пытаюсь выполнить запрос агрегации, чтобы вычислить минимальное / максимальное количество временных меток для данного документа.
Примеры документов приведены ниже —
{
"_id" : ObjectId("5c9cd93adddca9ebb2b3fcba"),
"frequency" : 5,
"s_id" : "30081993",
"timestamp" : NumberLong(1546300800000),
"date" : ISODate("2019-01-01T00:00:00.000Z"),
"values" : {
"1547439900000" : {
"number_of_values" : 3,
"min_value" : 32.13,
"max_value" : 81.42
},
"1547440200000" : {
"number_of_values" : 3,
"min_value" : 48.08,
"max_value" : 84.52
},
"1547440500000" : {
"number_of_values" : 2,
"min_value" : 27.39,
"max_value" : 94.64
}
}
}
{
"_id" : ObjectId("5c9cd851dddca9ebb2b3f2ac"),
"frequency" : 5,
"s_id" : "27061995",
"timestamp" : NumberLong(1546300800000),
"date" : ISODate("2019-01-01T00:00:00.000Z"),
"values" : {
"1547539900000" : {
"number_of_values" : 31,
"min_value" : 322.13,
"max_value" : 831.42
},
"1547540200000" : {
"number_of_values" : 3,
"min_value" : 418.08,
"max_value" : 8114.52
},
"1547740500000" : {
"number_of_values" : 2,
"min_value" : 207.39,
"max_value" : 940.64
}
}
}
Я придумал следующий запрос, который работает для одного документа.
db.testdb.aggregate([
{
$match: {
"s_id": "30081993",
"frequency": 5,
}
},
{
$project: {
_id: 1,
valuesarray: {
$objectToArray: "$values"
}
}
},
{
$unwind: "$valuesarray"
},
{
$group: {
"_id": "",
"min_timestamp": {
$min: "$valuesarray.k"
},
"max_timestamp": {
$max: "$valuesarray.k"
}
}
}
]);
Вывод приведен ниже
{
"_id" : "",
"min_timestamp" : "1547439900000",
"max_timestamp" : "1547440500000"
}
Мне нужен запрос агрегации, который может вычислять максимальное / минимальное количество временных меток, но для нескольких документов, т. е. я хочу использовать оператор $ in на этапе $ match и получить минимальное / максимальное значение всех s_id. Возможно ли это?
Ожидается :
{
"_id" : "30081993",
"min_timestamp" : "1547439900000",
"max_timestamp" : "1547440500000"
}
{
"_id" : "27061995",
"min_timestamp" : "1547539900000",
"max_timestamp" : "1547740500000"
}
Ответ №1:
Да, требуются лишь небольшие изменения, чтобы это работало для нескольких документов.
На $match
этапе укажите свой $in
запрос:
$match: {
"s_id": { $in : [ "30081993", "27061995" ] },
"frequency": 5,
}
На $project
этапе переименуйте s_id
в _id
, чтобы гарантировать, что мы сохраняем s_id
связанные с каждым документом:
$project: {
_id: "$s_id",
valuesarray: {
$objectToArray: "$values"
}
}
На $group
этапе группируйте по _id
(первоначально s_id
), чтобы убедиться, что мы правильно группируем временные метки перед вычислением $min
/ $max
:
$group: {
"_id": "$_id",
"min_timestamp": {
$min: "$valuesarray.k"
},
"max_timestamp": {
$max: "$valuesarray.k"
}
}
Весь конвейер:
db.testdb.aggregate([
{
$match: {
"s_id": { $in : [ "30081993", "27061995" ] },
"frequency": 5,
}
},
{
$project: {
_id: "$s_id",
valuesarray: {
$objectToArray: "$values"
}
}
},
{
$unwind: "$valuesarray"
},
{
$group: {
"_id": "$_id",
"min_timestamp": {
$min: "$valuesarray.k"
},
"max_timestamp": {
$max: "$valuesarray.k"
}
}
}
]);