Biotechvana

MEDIDAS DE DIFUSIÓN DE RESULTADOS

En estas líneas, el proyecto TSI-100903-2019-11 consta de 10 entregables referidos a continuación en Tabla 1 y 10 datasets referidos en Tabla 2.

En primer lugar describimos los 10 entregables:

Tabla 1.- Entregables: disposición pública o confidencial de los mismos
Código Descripción Estatus
E1-E01 cronograma de actividades y gastos Público
E2-E02 Justificación gastos y memoria de resultados anualidad 1 Confidencial
E3-E03 Justificación gastos y memoria de resultados anualidad 2 Confidencial
E4-E11 Diseñador gráfico de configuración de pipelines Público
E5-E12 Base de datos de conocimiento omico Público
E6-E21 Sistema experto Público
E7-E22 Asistente virtual de GPRO Público
E8-E31 Container para infraestructura BackEnd Público
E9-E32 Nueva versión GPRO suite escalada a RAP Público
E10-E41 Informe técnico de validación y valorización Publico

A continuación, detallamos los enlaces a los ENTREGABLES públicos.

E1-E01 cronograma de actividades y gastos

https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/E1-E01.pdf
https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/E1-E01.xlsx

E4-E11 Diseñador gráfico de configuración de pipelines

El diseñador gráfico de configuración de pipeline (abreviado en inglés como (pipeline mode) está integrado y funcionando como una sección de interfaces anidadas en las aplicaciones de pipelines (DeNovoSeq, RNASeq y VariantSeq) todas ellas públicamente accesibles.

El diseñador gráfico de configuración de pipeline se encuentra en el menú superior de las tres aplicaciones (Nombre_aplicación Protocols  Pipeline Mode). Cada aplicación tiene su propia configuración ya que los análisis a realizar son totalmente diferentes en cada aplicación creada. Véase los manuales de las aplicaciones para instrucciones de cómo acceder y usar el modo pipeline. Los manuales están públicamente disponibles en las siguientes URLs:

RNASeq (sección pipeline mode)
https://gpro.biotechvana.com/tool/rnaseq/manual/pipeline-mode-usage
VariantSeq (sección pipeline mode)
https://gpro.biotechvana.com/tool/variantseq/manual/pipeline-mode-usage
DeNovoSeq (sección pipeline mode)
https://gpro.biotechvana.com/tool/denovoseq/manual/pipeline-mode-usage

E5-E12 Base de datos de conocimiento omico

La base de datos de conocimiento omico de GPRO está integrada y funcionando dentro de la SQL del server side de GPRO es decir el container para infraestructura backend que es públicamente accesible tal y como indicamos en la sección de este documento E8-E31 Container para infraestructura BackEnd. La base de datos de conocimiento omico de GPRO está también disponible como dataset. Ver más abajo en este documento, la sección de disposición publica de los datasets generados en el proyecto.

E6-E21 Sistema experto

El componente front end del sistema experto es público y está integrado y funcionando como una sección del panel de trazabilidad de las aplicaciones gestoras de pipelines (DeNovoSeq, RNASeq y VariantSeq) todas ellas públicamente accesibles (Véase entregable E9-E31 a continuación para acceder a las aplicaciones). El panel de trazabilidad se puede visualizar en cualquiera de las tres aplicaciones accediendo al menú superior de cada aplicación Pipeline Jobs  Job Tracking System. Para más detalle, ver el preprint (sección material suplementario) del artículo de investigación que estamos en proceso de publicación para las aplicaciones RNASeq y VariantSeq que está disponible online https://doi.org/10.48550/arXiv.2202.07473.

El sistema BackEnd del sistema experto es de acceso restringido porque no puede ser operado por personal no autorizado o experto dado que podría inducir al mal funcionamiento o a la inestabilidad de todo el módulo de inteligencia artificial

E7-E22 Asistente virtual de GPRO

Al igual que con el sistema experto, el front end del chatbot es público y está integrado y funcionando en la sección help accesible en el top menú de las aplicaciones gestoras de pipelines (DeNovoSeq, RNASeq y VariantSeq) todas ellas públicamente accesibles (Véase entregable E9-E31 a continuación para acceder a las aplicaciones).

Al mismo tiempo el chatbot cuenta con una página web propia, donde el usuario puede interaccionar con el chatbot https://gpro.biotechvana.com/genie

Para más detalle, ver el preprint (sección material suplementario) del artículo de investigación que estamos en proceso de publicación para las aplicaciones RNASeq y VariantSeq que está disponible online con el siguiente DOI https://doi.org/10.48550/arXiv.2202.07473

El sistema BackEnd del chatbot es de acceso restringido y no puede ser de acceso libre en base a las mismas razones previamente indicadas en el contexto del sistema experto

Como indicamos el chatbot a su vez esta soportado por un chat de expertos al cual el chatbot deriva aquellas cuestiones que todavía no es capaz de responder. Este chat o foro de expertos es accesible en esta URL https://forum.biotechvana.com/

E8-E31 Container para infraestructura BackEnd

El server side o container con la infraestructura Backend de GPRO esta públicamente disponible en esta URL del Docker Hub https://hub.docker.com/r/biotechvana/gpro

Instrucciones sobre como instalarlo y sus componentes están disponibles en el manual accesible en https://gpro.biotechvana.com/tool/gpro-server/manual así como también en el preprint (sección material suplementario) del artículo de investigación que estamos en proceso de publicación para las aplicaciones RNASeq y VariantSeq que está disponible online con el siguiente DOI https://doi.org/10.48550/arXiv.2202.07473

E9-E32 Nueva versión GPRO suite escalada a RAP

Este trabajo consistió en migrar el código antiguo desde el antiguo framework de eclipse 3.x a un nuevo framework e4 que permite compilar tanto versiones RCP como RAP de las aplicaciones. Las nuevas versiones de las aplicaciones compiladas tanto en RCP como en RAP están públicamente disponibles en la página de descarga de cada aplicación.

Para RNAseq
https://gpro.biotechvana.com/download/RNAseq
Para VariantSeq
https://gpro.biotechvana.com/download/VariantSeq
Para DeNovoSeq
https://gpro.biotechvana.com/download/DeNovoSeq
Para STATools
https://gpro.biotechvana.com/download/STATools
Para Worksheet
https://gpro.biotechvana.com/download/Worksheet
Para SeqEditor
https://gpro.biotechvana.com/download/SeqEditor

Nótese que hay versión RCP en el nuevo frame e4 para todas las aplicaciones en tres sistemas operativos, macOS, Windows, y Linux. En tanto que las versiones RAP están disponibles para las aplicaciones DeNovoSeq, STATools, y RNAseq y VariantSeq porque son las aplicaciones que trabajan con el server side (el Docker) y son las que permiten trabajar en la nube. Las otras dos aplicaciones (Woksheet y SeqEditor) son aplicaciones standalone que no trabajan de lado servidor ni necesitan que el usuario tenga una cuenta en el servidor. Por eso no hemos implementado una versión RAP para ellas dado que no son recursos de computación en la nube como son las otras cuatro.

Nótese que en estas líneas las aplicaciones que trabajan de lado servidor requieren un usuario o contraseña para acceder a los recursos del server side. En el manual del server side indicamos como usar un usuario publico sin contraseña para conectar una aplicación al server side una vez estén instaladas o generar una contraseña propia.

https://gpro.biotechvana.com/tool/gpro-server/manual

Es decir, las aplicaciones están públicamente disponibles, pero requieren una cuenta de usuario y contraseña en el servidor donde se instalen.

Las versiones RAP de las aplicaciones que trabajan de lado servidor son accesible desde los siguientes links

http://biotechvaladdin.uv.es/RNASeq/app
http://biotechvaladdin.uv.es/VariantSeq/app
http://biotechvaladdin.uv.es/DeNovoSeq/app
http://biotechvaladdin.uv.es/STATools/app

Los manuales de todas las herramientas tambien son públicamente accesibles

Para RNAseq
https://gpro.biotechvana.com/tool/rnaseq/manual
Para VariantSeq
https://gpro.biotechvana.com/tool/variantseq/manual
Para DeNovoSeq*
https://gpro.biotechvana.com/tool/denovoseq/manual
Para STATools*
https://gpro.biotechvana.com/tool/statools/manual
Para Worksheet*
https://gpro.biotechvana.com/tool/worksheet/manual
Para SeqEditor https://gpro.biotechvana.com/tool/seqeditor/manual

*Notese que los manuales de DENovoSeq, STATools, y Worksheet están todavía en preparación.

Las publicaciones realizadas hasta la fecha son las siguientes:

Para SeqEditor

Hafez A, Futami R, Arastehfar A, Daneshnia F, Miguel A, Roig FJ, Soriano B, Perez-Sánchez J, Boekhout T, Gabaldón T, Llorens C. 2020.SeqEditor: an application for primer design and sequence analysis with or without GTF/GFF files, Bioinformatics, 37(11), 1610-1612 https://doi.org/10.1093/bioinformatics/btaa903

Para RNAseq y VariantSeq (en fase de publicación)

Hafez A and 17 co-authors (including Soriano B, Ceprian R, Elsayed. AA, Martinez-Sanchis G, and Llorens C). 2022. RNASeq and VariantSeq applications and Server Side of GPRO suite. ArXiv https://arxiv.org/abs/2202.07473

Actualmente una vez terminemos de publicar el paper de RNAseq y VariantSeq procederemos a preparar los manuales y los artículos de investigación para las otras tres aplicaciones DenovoSeq, STATools, y Worksheet.

E10-E41 Informe técnico de validación y valorización

El entregable del informe técnico de en la validación se ha colgado públicamente en la siguiente URL https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/E10-E41.pdf el cual incluye una valoración de cada una de las pruebas de concepto realizadas tal y como se detallan a continuación:

https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/A14-A41.pdf
https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/A15-A42.pdf
https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/A16-A43.pdf
https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/A17-A44.pdf
https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/A18-A45.pdf
https://gpro.biotechvana.com/sedai_TSI-100903-2019-11_transp/A19-A46.pdf

A continuación, procedemos a describir la disposición publica de los 10 datasets generados en este proyecto (Tabla2).

Tabla 2.- Datasets generados: disposición pública de los mismos
Dataset sFTP Biotechvana
valoracion_actividad_A14_A41 biotechvana.uv.es/01_valoracion_actividad_A14_A41
valoracion_actividad_A15_A42 biotechvana.uv.es/02_valoracion_actividad_A15_A42
valoracion_actividad_A16-A43 biotechvana.uv.es/03_valoracion_actividad_A16_A43
valoracion_actividad_A17-A44 biotechvana.uv.es/04_valoracion_actividad_A17_A44
base_datos_entregable_E5-E12 biotechvana.uv.es/05_ base_datos_entregable_E5-E12
LogFilesDB_AImodule biotechvana.uv.es/06_logFilesDB_AImodule
YMLDB_AImodule biotechvana.uv.es/07_YMLDB_AImodule
XMLDB_AImodule biotechvana.uv.es/08_XMLDB_AImodule
ProvenFactsDB_AImodule biotechvana.uv.es/09_ProvenFactsDB_AImodule
TrainingSets_AImodule biotechvana.uv.es/10_TrainingSet_AImodule

Estos 10 datasets se encuentran depositados en la nube de Biotechvana y se ha habilitado acceso a los mismos mediante protocolos ssh o sFTP. Aportamos un usuario y contraseña para acceder a esta cuenta que detallamos a continuación.

Si se accede por sFTP:

Servidor sFTP: biotechvana.uv.es
Usuario: DIGITAL
Password: DiGi_19_21*


Si se accede por ssh:

Escribir en consola
ssh DIGITAL@biotechvana.uv.es
A continuación, solicitará el password, introducirlo.

Brevemente la descripción de cada contenido es la siguiente:

01_valoracion_actividad_A14_A41

Este dataset corresponde al big data omico prueba concepto análisis variantes descrito en pdf 01_valoracion_actividad_A14-A41.pdf que se presentó anexo al entregable E10-E41 en la justificación de 2021. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo.

Adicionalmente hemos creado un tutorial de análisis de variantes en base a este dataset que está públicamente disponible en

https://ecampus.biotechvana.com/course/view.php?id=19

02_valoracion_actividad_A15_A42

Este dataset corresponde al big data omico prueba concepto transcriptoma descrito en pdf 02_valoracion_actividad_A15-A42.pdf que se presentó anexo al entregable E10-E41 en la justificación de 2021. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo

Adicionalmente hemos creado un tutorial de análisis RNASeq en base a este dataset que está públicamente disponible en

https://ecampus.biotechvana.com/course/view.php?id=17

03_valoracion_actividad_A16-A43

Este dataset corresponde al big data omico prueba concepto estudio de novo pdf 03_valoracion_actividad_A65-A43.pdf que se presentó anexo al entregable E10-E41 en la justificación de 2021. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo

Adicionalmente estamos preparando un tutorial de análisis de novo no disponible todavía que acompañará la publicación de la aplicación deNovoSeq (notese que la preparación de manuales y tutoriales no es parte del proyecto, ni está financiada por el mismo. Es material complementario que vamos generando para hacer difusión de los resultados.

04_valoracion_actividad_A17-A44

Este dataset corresponde al big data omico prueba concepto estudio de novo pdf 03_valoracion_actividad_A65-A43.pdf que se presentó anexo al entregable E10-E41 en la justificación de 2021. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo

Adicionalmente estamos preparando un tutorial de análisis metagenomica 16s no disponible todavía que acompañará la publicación de la aplicación deNovoSeq (nótese que la preparación de manuales y tutoriales no es parte del proyecto, ni está financiada por el mismo. Es material complementario que vamos generando para hacer difusión de los resultados.

05_base_datos_entregable_E5-E12

Este dataset es la base de conocimiento omico que a su vez es también el entregable E5-E12. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo

06_logFilesDB_AImodule

Base de datos de ficheros logs de ejecuciones de procesos de ejecucion de aplicaciones via pipeline o workflow que usa el sistema experto para mostrar en pantalla si un proceso ha corrido bien o ha generado algún error o si en caso de haberlo hay alguna posible solución. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo

07_YMLDB_AImodule

Base de datos de preguntas y respuestas y respuestas sinónimas procesadas por el chatbot. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo

08_XMLDB_AImodule

Base de datos de información sobre cada software CLI implementado en los pipelines o workflows de las aplicaciones gestoras de pipelines (RNAseq, VariantSeq y DENovoSeq) procesadas por el chatbot. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo

09_ProvenFactsDB_AImodule

Base de datos de hechos probados a partir de nuestra experiencia sobre la ejecución de procesos asociada al sistema experto. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo

10_ TrainingSets_AImodule

Los datos de entrenamiento del chatbot recopilados a partir de distintas fuentes como pubmed, Biostar, GATK, y SeqAnswers. El presente documento de subsanación se acompaña con un índice sobre este dataset por lo voluminoso del mismo




GPRO licensing and Usage           Former versions           TSI-100903-2019-11

Biotechvana


Valencia Lab
Parc Cientific Universitat de Valencia
Carrer del Catedràtic Agustín Escardino, 9. 46980 Paterna (Valencia) Spain
Madrid Lab
Parque Científico de Madrid
Campus de Cantoblanco
Calle Faraday 7, 28049 Madrid Spain
Contact us
Phone: +34 960 06 74 93
Email: biotechvana@biotechvana.com

Supported by


Hipra Scientific S.L.U, Polypeptide Therapeutic Solutions S.L., Biotechvana S.L. and Nostrum Biodiscovery constitute the consortium of enterprises participating in the project "Research of a new vaccine for a human respiratory disease", granted by the CDTI (Center for Industrial Technological Development), and supported by the Ministry of Science and Innovation and financed by the European Union – NextGenerationEU. The main objective of this project is to design a safe immunogenic and effective vaccine against the respiratory syncytial virus.

Biotechvana © 2015
Privacy policy
Política de privacidad
This website use cookies, by continuing to browse the site you are agreeing to our use of cookies. More info about our cookies here.