Поиск уникального Google Mid от GEG в big-запросе

# #google-bigquery

Вопрос:

Я новичок в больших запросах, поэтому заранее приношу извинения, если мой вопрос неясен или прост 🙂

В рамках задания я хочу увидеть уникальные упоминания о Марокко в израильских газетах, чтобы продемонстрировать растущий интерес к отношениям Марокко и Израиля по мере активизации переговоров между двумя странами. Я пытаюсь найти статьи в gdelt, в частности gdelt-bq.gdeltv2.geg_gcnlapi . Хотя у меня есть код для запуска из более раннего задания для другой сущности, я не знаю, как найти уникальный entity.mid для Марокко (в задании мы использовали «/m/0fm2h » для Биньямина Нетаньяху).

Кажется, мне трудно найти уникальную середину. Я попытался использовать базу данных geg_gcnlapi, которая подразумевалась как правильное расположение в этой статье (https://blog.gdeltproject.org/announcing-the-global-entity-graph-geg-and-a-new-11-billion-entity-dataset/) но, возможно, я сделал что-то не так, или это не то место.

Для справки, вот код, который я пытаюсь запустить:

 CREATE OR REPLACE TABLE
  `dotted-vim-311413.Class56146_Week_6.geg_morocco_in_leading_il_en_domains` AS
SELECT
  date,
  url,
  lang,
  score,
  entity.name AS name,
  entity.type AS type,
  entity.mid AS mid,
  entity.wikipediaUrl AS wikipediaUrl,
  entity.numMentions AS numMentions,
  entity.avgSalience AS avgSalience
FROM
  `dotted-vim-311413.Class56146_Week_6.geg_il_domain`,
  UNNEST(entities) AS entity
WHERE
  entity.mid = '***Morocco***'
  AND NET.REG_DOMAIN(url) IN ('globes.co.il',
    'israeltoday.co.il');
 

Предпоследняя строка-это промежуточная запись, для которой я ищу уникальный идентификатор для Марокко.

Заранее благодарю вас 🙂

Ответ №1:

 SELECT
  DISTINCT entity.name,
  entity.mid,
  entity.avgSalience,
  entity.wikipediaURL
FROM
  `gdelt-bq.gdeltv2.geg_gcnlapi`,
  UNNEST(entities) AS entity
WHERE
  LOWER(entity.name) LIKE '%morocco%'
  AND DATE(date) >= "2021-06-20"
ORDER BY
  avgSalience DESC;
  -- Top results show that Morocco's MID is /m/04wgh