Michelini, A., Cianetti, S., Gaviano, S., Giunchi, C., Jozinovic, D., e Lauciani.
Earth System Science Data Discussions, https://doi.org/10.5194/essd-2021-164.
Astratto
I dati delle forme d'onda dei terremoti italiani sono qui raccolti in un set di dati adatto per applicazioni di analisi di machine learning (ML). Il dataset è costituito da circa 1,2 milioni di tracce di forme d'onda a tre componenti (3C) provenienti da circa 50.000 terremoti e più di 130.000 tracce di forme d'onda 3C di rumore, per un totale di circa 43.000 ore di dati e una media di 21 tracce 3C fornite per evento. L'elenco dei terremoti si basa sul bollettino sismico italiano (http://terremoti.ingv.it/bsi) dell'Istituto Nazionale di Geofisica e Vulcanologia tra gennaio 2005 e gennaio 2020 e comprende eventi nella gamma di magnitudo compresa tra 0.0 e 6.5. I dati delle forme d'onda sono stati registrati principalmente dalla Rete Sismica Nazionale Italiana (codice di rete IV) e comprendono sia registrazioni deboli (canali HH, EH) che strong motion (canali HN). Tutte le tracce della forma d'onda hanno una lunghezza di 120 s, sono campionate a 100 Hz e sono fornite sia nei conteggi che nelle unità di movimento del terreno dopo la deconvoluzione delle funzioni di trasferimento dello strumento. Il set di dati della forma d'onda è accompagnato da metadati costituiti da oltre 100 parametri che forniscono informazioni complete sulla sorgente del terremoto, le stazioni di registrazione, le caratteristiche delle tracce e altre quantità derivate. Questo ricco set di metadati consente agli utenti di indirizzare la selezione dei dati per i propri scopi. Molti di questi metadati possono essere utilizzati come etichette nell'analisi ML o per altri studi. Il dataset, assemblato in formato HDF5, è disponibile presso http://doi.org/10.13127/instance (Michelini et al., 2021).
(clicca sull'immagine)
Figura 14. Esempio di forme d'onda sismiche selezionate casualmente dei canali HH a banda larga contenuti in INSTANCE. Ogni riga contiene tre tracce scelte a caso in base ai seguenti criteri: a-c) terremoti di 2≤M <3 (66,8 % del totale dei canali HH); d-f) terremoti3≤M <4(13,5 %); g-i) terremoti M≥4(2,0 %); j-l) earthquakestrace_E_snr_db≥10 andpath_ep_distance<100 km (55,0 %); (m-o)