download-hindcast-NMME

O objetivo do download-hindcast-NMME é processar os dados das previsões climática do NMME.

Dependências

remotes::install_cran("qs", type = "source", configure.args = "--with-simd=AVX2")
remotes::install_github("rspatial/terra")
remotes::install_github("rspatial/raster")

pcks <- c("tidyverse", "data.table", "metR", "raster", "terra", "qs", "readr", 
          "here", "checkmate", "fs", "glue", "purrr", "stringr", "tictoc",
          "lubridate", "ggpubr", "ggExtra", "viridis", "see", "ggh4x")
easypackages::libraries(c("tidyverse"))
#> Loading required package: tidyverse
#> ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.0 ──
#> ✔ ggplot2 3.3.6          ✔ purrr   0.3.4     
#> ✔ tibble  3.1.7          ✔ dplyr   1.0.9     
#> ✔ tidyr   1.2.0.9000     ✔ stringr 1.4.0     
#> ✔ readr   2.1.2          ✔ forcats 0.5.1
#> ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
#> ✖ dplyr::filter() masks stats::filter()
#> ✖ dplyr::lag()    masks stats::lag()
#> All packages loaded successfully
#fs::dir_ls(here("R"), glob = "*.R") %>%
#  fs::path_file()
packageVersion("terra")
#> [1] '1.5.20'
packageVersion("raster")
#> [1] '3.5.15'
packageVersion("qs")
#> [1] '0.25.2'

Descrição

down-hindcasts-nmme.R: script com looping para baixar arquivos NetCDF para um intervalo de anos e uma lista de modelos.

depende do script models-nmme.R que gera objeto chamado tabela1 com informações dos modelos, como nomes e períodos. Requer alteração quando inserir novos modelos. Tabela gerada manualmente. Atualmente somente o nome dos modelos desta tabela são usados.
depende do script down-nmme.R: função para download dos dados por modelo e ano, no formato NetCDF. O domínio espacial dos dados é a América do Sul.
arquivos de saída em output/{variavel}/nmme_{variavel}_{modelo}_{ano}.nc

dados-brutos.R:

depende do script data-proc-nc.R que contém as funções para:
- extrair os dados de todos arquivos NetCDF de um dado modelo, para todos lead times (L o qual varia de 0.5 a 11.5).
- gerar a tabela model_counts.{rds, qs} com o periodo dos modelos e as dimensões dos arquivos.
arquivos de entrada em output/{variavel}/nmme_{variavel}_{modelo}_{ano}.nc
arquivos de saída em output/{rds,qs}/nmme_{var_name}_{model_id}_lt{lead_time}.{rds, qs} (arquivo .qs com tamanho de ~300 MB contra ~3 GB do .rds)

ensemble-members-averages.R:

depende do script data-proc-rds.R que contém as funções para obter a média ou a mediana (para cada ponto, por data de inicialização e lead time) de todos membros de um dado modelo.
arquivos de saída em output/{rds,qs}/ensemble-{model_id}-{stat}.{RDS,qs} (cada arquivo ~290 MB)

spatial-average-nmme-basins.R (etapa mais demorada)

arquivos de entrada em output/{rds,qs}/ensemble-{model_id}-{stat}.{RDS, qs}
depende do script data-proc-basin.R que contém as funções para obter a média na área das bacias hirográficas (por data de inicialização e lead time) da variável de interesse (precipitação, temperatura) agregada (média, mediana ou identidade) de cada modelo.
- Há duas opções para agregação espacial: média aritmética (arithmetic) ou média ponderada pela fração de área das células do modelo dentro da bacia hidrográfica (weighted).
arquivos de saída em output/rds/basin/avgs/{spatial_average_type}/{model_id}-{stat}. Os arquivos são separados por tipo de média espacial, modelo, mês de inicialização e lead time. O nome dos aquivos RDS segue o padrão {model_id}_S{YYYYMMDD}_L{0.5-11.5}_{spatial_agreggation_type}_avg.RDS (cada arquivo em torno de 4.5 KB)

join-spavg-nmme-basins.R:

depende do script data-join-rds.R que contém a função para juntar todos arquivos binários (.qs ou .RDS).
arquivos de saída em output/rds/basin/avgs/{sp_average} no fomato RDS no padrão nmme-models-{sp_average}-avg-basins-ons.RDS (cada arquivo em torno de 160 MB)

spatial-average-obs-basins.R:

depende do script data-proc-basin.R que contém as funções para obter a média na área bacias hidrográficas para os dados do CRU.
arquivos de saída em output/{ext}/basin/avgs/{sp_average} no formato RDS no padrão cru-prec-basins-{sp_average}-avg.{ext} (cada arquivo em torno de 3.6 MB), onde ext = 'qs' ou 'RDS' e sp_average = 'weighted' ou 'arithmetic'.

join-prec-cru-nmme.R: combina os dados observados e previsões dos membros dos modelos.

depende do script tidy-basin_data.R que arruma os dados das previsões dos membros dos modelos no formato tidy para combiná-los com as observações do CRU.
arquivo de saída em output/{ext}/basin-avgs/{sp_average}/nmme-cru-mly-{sp_average}-avg-basins-ons.qs

aggregate-members.R:

depende do script aggregate-nmme.R que tem as funções:
- aggregate_members_nmme(): para calcular a média dos modelos a partir das previsões dos membros;
  - arquivo de saída em output/{ext}/basin-avgs/{sp_average}/nmme-cru-mly-weighted-avg-basins-ons-ens-members-prec.qs
- spread_members_nmme(): para distribuir as previsões dos membros de cada modelo através das colunas (arquivo de saída desta função é usado na função join_nmme_models_members_ensemble());
  - arquivo de saída em output/{ext}/basin-avgs/{sp_average}/nmme-cru-mly-weighted-avg-basins-ons-wide-flat.qs
- aggregate_models(): calcular a média do conjunto das previsões dos modelos;
  - arquivo de saída em output/{ext}/basin-avgs/{sp_average}/nmme-cru-mly-weighted-avg-basins-ons-ens-models-prec-1982-2010.qs.
- join_nmme_model_ensemble(): juntar os arquivos de saída das funções aggregate_members_nmme() e aggregate_models();
  - arquivo de saída em output/{ext}/basin-avgs/{sp_average}/nmme-cru-mly-weighted-avg-basins-ons-ens-members-ens-mean-prec-1982-2010.qs.
- join_nmme_models_members_ensemble(): juntar os arquivos de saída das funções join_nmme_model_ensemble() e spread_members_nmme() formando o arquivo de dados principal; ou seja com as previsões de cada membro, a média por modelo e a média do conjunto.
  - arquivo de saída em output/{ext}/basin-avgs/{sp_average}/nmme-cru-mly-weighted-avg-basins-ons-ens-members-models-ens-mean-prec-1982-2010.qs.
as funções acima, são rodadas sequencialmente no script aggregate-members.R

climatology-cru-nmme.R

depende do script clim-functions.R que contém funções para visualização da Climatologia dos modelos do NMME em função dos leads times, em comparação as observações do CRU.
depende do script plot-clim-models-funs.R que contém funções para visualização da Climatologia dos modelos do NMME em função dos leads times, em comparação as observações do CRU.
saída são 3 gráficos:
- Climatologia por modelo e lead time;
- Climatologia por modelo com lead times agrupados;
- Climatologia por lead time com modelos agrupados;

view-eval-cru-nmme.R:

depende do script utils.R
calcula a correlação entre prev e obs para os diferentes tempos de antecedências por meses e apresenta visualização para algumas Bacias Hidrográficas;
CRPSS, diagrama de confiabilidade, PIT p-value, PBIAS, RMSE, KGE

jdtatsch / download-hindcast-nmme Goto Github PK

download-hindcast-nmme's Introduction

download-hindcast-NMME

Dependências

Descrição

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent