historia de éxito

Cómo el aprendizaje automático, los datos simulados, AWS y Virtusa llevaron la innovación a la investigación de la diabetes en el IBRI

Un catalizador de la innovación, un instituto de investigación en biociencia líder con sede en el Medio Oeste, el Indiana Bioscience Research Institute (IBRI), está trabajando para cumplir su misión de convertirse en el primer instituto inspirado por la industria en el desarrollo de soluciones que mejoren la salud de quienes padecen diabetes, enfermedades metabólicas y mala nutrición. Amazon Web Services (AWS) y Virtusa fueron contratados por Cardinal Health para ayudar al IBRI y a Fuse a proporcionar las habilidades técnicas y la infraestructura para evaluar y optimizar un conjunto de datos de registros sanitarios electrónicos (EHR) simulados de Fuse para que coincidan con las características de los conjuntos de datos EHR relacionados con la diabetes tipo 2 (T2D) del IBRI.

El IBRI utiliza estos conjuntos de datos de HCE con sus colaboradores de investigación para obtener información sobre los subgrupos de pacientes, las características de la enfermedad y las complicaciones de los pacientes con T2D y para desarrollar y validar modelos de predicción relacionados con la T2D." Una plataforma de análisis de datos mejorada y un conjunto de datos simulados de "realista que se ajusta a las complejidades de un conjunto de datos de HCE real como el proporcionado por Fuse tiene el potencial de acelerar algunas de las actividades de investigación del IBRI.

 

 

El desafío

El instituto aprovecha los conjuntos de datos de HCE proporcionados en virtud de acuerdos de uso de datos apropiados para impulsar su investigación, pero aunque estos datos son anónimos, los datos tienen restricciones de uso específicas, así como sesgos internos. Los retos son:

  • Actualmente, los datos de la HCE se limpian y procesan en ordenadores seguros a los que es difícil que accedan los científicos.
  • Se dedicaba demasiado tiempo a la ingeniería, la elaboración de perfiles y la comprobación de los conjuntos de datos.
  • La arquitectura de la base de datos para soportar y acceder a grandes cantidades de datos de forma regular era limitada.
  • No se dispone de fuentes de datos alternativas (por ejemplo, datos de HCE simulados) para impulsar determinadas actividades de investigación adecuadas.
La solución

La plataforma vLifeplatform de Virtusa impulsada por AWS y el acceso y la optimización de los datos simulados almacenados en esta plataforma ayudaron al IBRI a probar las capacidades de análisis seguro y colaborativo para acelerar la investigación y la innovación:

  • Cuadros de mando: Los cuadros de mando interactivos ofrecen información agregada en tiempo real a partir de los datos perfilados, y proporcionan gráficos y visualizaciones de autoservicio.
  • Construcción de modelos de aprendizaje automático (ML): Se dispone de un acceso rápido y una transformación de una característica para permitir el aprendizaje automático y probar las precisiones de los modelos en todos los conjuntos de datos.
  • Lago de datos sintético: Se almacenan cantidades masivas de datos y se accede a ellos rápidamente con la capacidad de soportar vistas de bases de datos pre-construidas que pueden ser consultadas instantáneamente.
  • Carga de datos y control de calidad: Los archivos de datos colocados en el lago de datos se cargan automáticamente en la base de datos y las métricas de control de calidad se compilan automáticamente.
  • Generador de datos simulados: Los datos simulados pueden mejorarse de forma iterativa para que coincidan con las características de los conjuntos de datos de HCE del mundo real, y el aprendizaje automático se utiliza para probar las correlaciones profundas (por ejemplo, complicaciones o variables clínicas) dentro de los datos "reales" frente a "simulados".

Servicios de AWS utilizados

  • Amazon EC2
  • Amazon SageMaker
  • Amazon S3
  • Amazonía Atenea
  • Amazon CloudFront
  • Amazon Redshift
  • Amazon RDS
  • Amazon ELB
La solución
La ventaja

Los investigadores del IBRI ahora tienen acceso a una plataforma basada en AWS y a un conjunto de datos de HCE simulado y optimizado para la diabetes que utiliza tecnologías de aprendizaje informático profundo para acelerar la investigación relacionada con la misión del IBRI.

  • AWS Cloud crea una única fuente de verdad para todos los datos, dando a los investigadores acceso a los datos en tiempo real para tomar mejores decisiones más rápidamente.
  • El aprendizaje automático automatiza el tedioso trabajo de la ingeniería de datos, la elaboración de perfiles y las pruebas, manteniendo la atención de los investigadores en el descubrimiento de soluciones nuevas e innovadoras.
  • La simulación realista de los datos de la HCE proporciona una herramienta alternativa para las colaboraciones de investigación con numerosas ventajas que se detallan en las referencias que figuran a continuación.

 

Referencias:

Artículo: El nuevo sintético

Artículo: Desbloquear el poder de los datos simulados para acelerar la investigación

Acerca del IBRI

El Indiana Biosciences Research Institute (IBRI) es un instituto de investigación aplicada independiente y sin ánimo de lucro creado en 2013 y con sede en Indianápolis. El IBRI existe para reunir a empresas y universidades con el fin de trabajar en colaboración en cuestiones de salud interrelacionadas que son de importancia mundial y tienen un impacto desproporcionado en los residentes de Indiana: la diabetes, las enfermedades metabólicas y la mala nutrición, así como la ciencia y el análisis de datos de salud relacionados. Nuestro lema es Discovery With Purpose (Descubrimiento con propósito), que refleja nuestro compromiso con la traducción de los descubrimientos científicos en mejores resultados para los pacientes. http://indianabiosciences.org

Una plataforma de innovación para las ciencias de la vida

Conozca cómo puede beneficiarse de la plataforma de innovación abierta vLife

Contenido relacionado