Nel corso degli ultimi anni c’è stato un esplosivo aumento nella capacità di
acquisizione dei dati sperimentali associato ad un parallelo abbassamento
esponenziale nel costo.
Grazie a queste precondizioni tecnologiche ed economiche, è ora possibile
considerare progetti di ricerca biomedica che, all’interno di necessari vincoli di
privacy e bioetica, si pongano alla confluenza di questi due flussi di dati e che
abbiano come obiettivo studi ad alta risoluzione su coorti dell’ordine della
decina di migliaia di individui. Studi cioè che, a tecnologia corrente, possono
produrre ciascuno dataset dell'ordine della decina di petabyte, ed in cui la
quantità di informazione da analizzare e gestire è destinata a crescere di un
ordine di grandezza almeno ad ogni successiva (in tecnologia) campagna di
acquisizione sperimentale sugli stessi campioni biologici.
Lo scopo di COBIK è di costruire una piattaforma software, una biobanca
computazionale, in grado di gestire in maniera uniforme ed efficiente tutto il
flusso informatico/computazionale necessario a condurre studi a grande scala
basati sull’integrazione sistematica di dati clinici e sperimentali, in particolare
nel contesto della genomica.
The COBIK project deals with problems stemming from the recent huge increase in dataset size from biosciences and health informatics. Its main goal is building a software framework capable of efficiently and uniformly handling the computational throughput associated to large-scale studies based on the integration of clinical and experimental data, specifically in the field of genomics.