User Tools

Site Tools


start

Our Group

Our research group is located at the Universidad del Valle, Cali, Colombia. We are fascinated by microbiological questions and their complexity, and seek to contribute to their analysis and solution. We belong to the Computer Science Department (EISC) of our university, therefore our approaches are mainly informatics and computer oriented.

Our main topics include gene finding and protein prediction, where we apply artificial intelligence methods, based on machine learning, as well as data mining techniques. We also work on metagenomics to analyze Colombian Andean environments. Generally, our results include software tools which allow other users to apply our approaches to their specific context.

Our group is interdisciplinary, made up of professors, graduate and undergraduate students from different disciplines, especially from computer science and biology. That's why we feel capable to face complex problems using both: biological state-of-the-art knowledge and advanced computational methodologies.


More information about our group at:
Bioinformática y Biocomputación, COLCIENCIAS (Departamento Administrativo de Ciencia, Tecnología e Innovación), Colombia.

People

Research Fields

Our group works in several research fields as listed below. Our overall goals in all fields are: improve computational analysis and prediction in our specific research fields; contribute to bioinformatics education at undergraduate, master and PhD level; and support with a strong informatics approach, bioinformatics and computational biology research.

more Gene modeling and prediction

more Gene modeling and prediction

more Gene modeling and prediction

Objective: Develop and analyze models and algorithms for gene analysis, prediction and gene or genome comparison based on informatics methodologies.
Recent developments:
* Multifractal approach for genome analysis.
* Graphic interfaces for gene prediction, able to make training and prediction easier for the end user.
* User directed feedback which allows to control and improve the training process.
* Comparison of different gene predictions and their optimization by Bayesian mixtures.
* New models for promotors and exons.

more Protein structure and function modeling

more Protein structure and function modeling

more Protein structure and function modeling

Objective: Develop computer models and algorithms able to analyze and predict protein structure and its relation to function.
Recent developments:
* New models for secondary structure prediction based on generalized HMM.
* Secondary structure classification based on support vector machines.
* Simplified molecular dynamics using a cellular automaton approach for contact maps.
* Analysis of the relationship between protein structure and physico-chemical properties of its aminoacid sequence.

more Metagenomics

more Metagenomics

more Metagenomics

Objective: Develop software tools for computational construction and analysis of metagenomes, to apply specially to Colombian Andean regions.
Recent developments
* Development of new metagenome assembly algorithms based on partial sequence information.
* Algorithms and models in order to identify genome data of microorganisms i a metagenome.
* Gene finding in metagenomes.

more Bioinformatics software development

more Bioinformatics software development

more Bioinformatics software development

Objective: Develop software tools for bioinformatics analysis and prediction of high quality and efficiency in specific cases where public domain software is not apliable or sufficient.
Recent developments:
* Software for fractal and multifractal analysis.
* Software tools to analyze and characterize retrovirus integration sites.
* Public computation in bioinformatics.
* Virtual machines in bioinformatics.

Research Projects

more A metagenomics bioinformatics platform for characterization and exploitation of genetic resources in Colombian extreme environments. Centro de Investigación de Excelencia en Genómica y Bioinformática GeBix, 2008-2013.

more A metagenomics bioinformatics platform for characterization and exploitation of genetic resources in Colombian extreme environments. Centro de Investigación de Excelencia en Genómica y Bioinformática GeBix, 2008-2013.

more A metagenomics bioinformatics platform for characterization and exploitation of genetic resources in Colombian extreme environments. Centro de Investigación de Excelencia en Genómica y Bioinformática GeBix, 2008-2013.

Original title: “Conformación de una plataforma en metagenómica y bioinformática para la caracterización y aprovechamiento de recursos genéticos de ambientes extremos”.
Resumen: Colombia se considera uno de los países con mayor diversidad en el planeta y por consiguiente posee un recurso natural invaluable. Es imprescindible, sin embargo, conocer en profundidad esta biodiversidad para lograr así aprovechar todo su potencial. Dentro de esta biodiversidad existe un desconocimiento de la vida microbiana, y sobre todo de su potencial, debido en gran parte a que la mayoría de los microorganismos presentes en el ambiente no son cultivables. En respuesta a esta dificultad ha surgido la metagenómica, estrategia que se define como el análisis del contenido genómico total de una comunidad, ya que complementa enfoques descriptivos y permite acceder y valorizar la riqueza biológica no cultivable. El auge de la genómica se ha dado a la par con el desarrollo de herramientas bioinformáticas que hoy en día hacen posible descripciones globales de sistemas biológicos y sus rutas metabólicas y estudiar procesos que van desde la célula hasta ecosistemas. La presente propuesta de investigación está orientada a consolidar la capacidad nacional para hacer estudios genómicos, y específicamente metagenómicos para explorar y valorar la diversidad microbiana de ambiente extremos, a través de la conformación del Centro Colombiano de Genómica y Bioinformática de Ambientes Extremos (GeBiX) que reunirá los esfuerzos de 16 grupos de investigación en 8 instituciones del país. Se tomará como modelo de estudio el Parque Nacional Natural de los Nevados que contiene diferentes ambientes extremos, como el páramo y manantiales termales. Estos ambientes representan ecosistemas de propiedades únicas y son fuente valiosa de organismos, genes y enzimas que pueden tener una amplia gama de aplicaciones. Para iniciar, se tamizarán librerías por función y por secuencia para identificar productos de interés industrial. La bioinformática permitirá el almacenamiento, procesamiento, la disponibilidad, consulta y administración de la información.

more A graphic environment for eukariote gene prediction based on a highly configurable software tool (Genezilla). Bioinformatics and Biocomputation, Universidad del Valle (2011)

more A graphic environment for eukariote gene prediction based on a highly configurable software tool (Genezilla). Bioinformatics and Biocomputation, Universidad del Valle (2011)

more A graphic environment for eukariote gene prediction based on a highly configurable software tool (Genezilla). Bioinformatics and Biocomputation, Universidad del Valle (2011)

Original title: “Desarrollo de un predictor gráfico altamente configurable para genes de diversos organismos”.
Universidad del Valle, June 2006 - May 2011.
Abstract: Gene prediction is one of the mayor problems in bioinformatics. It is principally a computational task, which includes modeling of gene components and the whole gene. Due to the increasing amount of available information and the growing computational capacity, the actual gene predictors reach high prediction levels. Among these predictors, Genezilla stands out because it reaches precision levels of about 88% in human gene prediction. Genezilla is highly configurable, that is, it allows to select the models and adapt their parameters to a specific organism, using adequate data sets. However, for a molecular biologist, the correct configuration could turn out difficult. This complex process requires a general understanding of training and prediction processes and specifically, the computational programming used in Genezilla which works with scripts.

Therefore, the Bioinformatics and Biocomputation research group intended to complement this predictor, with the objective to increase the amiability of the required computational processes and to facilitate further analysis of the obtained results. Therefore we developed an interactive interface of wizard type which guides the user through the training and prediction processes. We provide a user friendly visualization of results where predicted genes with their different components are easily identified. We developed an additional functionality, an evaluation module which is able to measure and compare the goodness of different predictors or different configurations of Genezilla as well as predictions made by Genezilla and other programs. With this project, we hope to deliver to the bioinformatics community, an easy-to-use software tool which offers the possibility of being configured according to the user's necessities. Furthermore we would like to emphasize the project's impact to student formation, given the participation of a group of undergraduate and graduate students. Finally, with this first research project, the Bioinformatics and Biocomputation research group was consolidated and started working with impact at local and regional level. more

more Optimization of eukariote gene prediction, applying decision trees and bayesian nets. Bioinformatics and Biocomputation, Universidad del Valle (2011)

more Optimization of eukariote gene prediction, applying decision trees and bayesian nets. Bioinformatics and Biocomputation, Universidad del Valle (2011)

more Optimization of eukariote gene prediction, applying decision trees and bayesian nets. Bioinformatics and Biocomputation, Universidad del Valle (2011)

Original title: “Optimización de la predicción de genes de organismos eucariotas,aplicando árboles de decisión y redes bayesianas”.
Universidad del Valle, June 2007 - May 2011.
Abstract: In the present research project we seek to contribute to gene prediction, an important bioinformatics field, that comprises the modeling of gene components as well the whole gen. The project is constructed on the well known gene prediction software Genezilla. In addition, we use results of a prior project of our group, where we developed interfaces for Genezilla, which make it easier for the bioinformatics user to apply the central training and prediction processes of this predictor. The present project seeks to improve predictions, using different approaches: development of new models, adequate combination of diverse predictions, and implementation of feedback mechanisms that provide the user with information about the precision of a configuration during the training process. The project belongs to the research field: “Bioinformatics software development” of the Bioinformatics and Biocomputationón research group of the Universidad del Valle. more

more Genomic cartography of the integration process of provirus HTLV-1. Laboratorio de Biología Molecular y Patogénesis; Bioinformatics and Biocomputation, Universidad del Valle (2009)

more Genomic cartography of the integration process of provirus HTLV-1. Laboratorio de Biología Molecular y Patogénesis; Bioinformatics and Biocomputation, Universidad del Valle (2009)

more Genomic cartography of the integration process of provirus HTLV-1. Laboratorio de Biología Molecular y Patogénesis; Bioinformatics and Biocomputation, Universidad del Valle (2009)

Original title: “Cartografía genómica del proceso de integración del provirus HTLV-1”.
Universidad del Valle, 2007- 2009
Resumen: El virus linfotrópico humano de células T tipo I (HTLV I), fue el primer retrovirus humano identificado. En 1981 se asoció con la Leucemia Linfoma de Células T del Adulto (LLTA), una hemopatía maligna, caracterizada por una expansión preferentemente monoclonal de células CD3+, CD4+, CD8+ y HLA-R+. Posteriormente, en 1985, se asoció con la Paraparesia Espástica Tropical/Mielopatía Asociada al HTLV-I (PET/MAH), una neuropatía desmielinizante de la médula espinal con compromiso piramidal. Diferentes reportes en la literatura mundial, han revelado la existencia de una posible asociación del virus con enfermedades inflamatorias incluidas la dermatitis infecciosa, la uveítis, la artritis, la tiroiditis y la polimiositis, entre otras. Actualmente la distribución de la infección por HTLV-I es mundial; datos epidemiológicos recientes, muestran que hay aproximadamente 25 millones de personas infectadas. En Colombia se registran seroprevalencias del 1% al 2%. A pesar de su distribución mundial, existen focos endémicos en el Japón, el Caribe, algunas zonas de áfrica central, Centro y Sur América. Estudios recientes, evidencian que tanto en el HTLV-I como en otros retrovirus humanos y no humanos, su integran no es al azar. Este proceso no aleatoria es dependiente de factores estructurales y funcionales de los genomas tanto del huésped como del virus. Como producto de estos factores, se seleccionarían ambientes genómicos específicos para la integración. En este proyecto se propone desarrollar estudios in silico, de citogenética molecular y de epidemiología sobre la estructura y características genómicas de 189 secuencias del genoma humano vecinas a las regiones de integración de provirus HTLV-I; éstas provienen de pacientes colombianos y japoneses con diagnóstico de PET/MAH, LLTA además de asintomáticos naturalmente infectados. Los resultados que se obtengan permitirán demostrar la existencia o no de diferencias.

more Molecular and genome analysis of sequences and complete genomes. Bimac, Universidad del Cauca; Bioinformatics and Biocomputation, Universidad del Valle (2009)

more Molecular and genome analysis of sequences and complete genomes. Bimac, Universidad del Cauca; Bioinformatics and Biocomputation, Universidad del Valle (2009)

more Molecular and genome analysis of sequences and complete genomes. Bimac, Universidad del Cauca; Bioinformatics and Biocomputation, Universidad del Valle (2009)

Original title: “Análisis molecular y genómico de secuencias y genomas completos”.
Colciencias, Universidad del Cauca, Universidad del Valle, 2007-2009.

more Fractal analysis of interrupted genes. Bimac, Universidad del Cauca; Bioinformatics and Biocomputation, Universidad del Valle (2008)

more Fractal analysis of interrupted genes. Bimac, Universidad del Cauca; Bioinformatics and Biocomputation, Universidad del Valle (2008)

more Fractal analysis of interrupted genes. Bimac, Universidad del Cauca; Bioinformatics and Biocomputation, Universidad del Valle (2008)

Original title: Análisis fractal de genes interrumpidos“.
Universidad del Cauca, Universidad del Valle, 2005-2008

Courses

more Bioinformatics I

more Bioinformatics I

more Bioinformatics I

Bioinformatics is a multidisciplinary field where Biology and Computer Science interact. It seeks to solve complex biological problems using informatics and computation tools. It also includes collection, organization, storage and retrieval of biological information from databases. Bioinformatics analysis and modeling has impact on disease detection and treatment, and on genetic improvement of agrarian products, with positive effects on conditions and quality of human life.
This course introduces students to the basic concepts of Bioinformatics and Computational Biology. The computational processes of description, analysis and modeling of biological information are demonstrated, using DNA, RNA and protein data stored in public database, and it is shown how they conduce to a better understanding of many biological processes. course outline

see Spanish version

see Spanish version

see Spanish version

Bioinformática I. Bioinformática es una disciplina multidisciplinaria científica definida como la interacción entre dos ciencias: Biología y Computación. Involucra la solución de problemas complejos biológicos usando herramientas de sistemas y computación. También incluye la colección, organización, almacenamiento y recuperación de la información biológica que se encuentra en base de datos. Como resultados del análisis y modelado bioinformático se obtienen avances en la detección y tratamiento de enfermedades y la producción de alimentos gen´eticamente modificados, que puede ayudar a mejorar la condición y calidad de vida humana. El presente curso introduce al estudiante a la los conceptos básicos de la Bioinformática y Biología computacional. Haciendo uso de una siempre creciendo cantidad de datos genéticos y proteicos almacenados en bases de datos de acceso público, se introduce al estudiante a los procesos computacionales para la descripción, análisis y modelación de información biológica, que puede resultar en un mejor entendimiento de muchos procesos biológicos.

more Restricted Molecular Dynamics

more Restricted Molecular Dynamics

more Restricted Molecular Dynamics

Molecular dynamics (MC), the computer simulation of movements of atoms and molecules, is frequently applied to biomolecules (DNA or RNA sequences, proteins). Based on numerical methods, MD calculates their time-depend behavior. Generally, it is used to study the molecule's structure and understand the dynamics of the formation, functioning and interaction. In proteomics, MD is used to analyze a protein's stability and allows to model the complex processes a protein to perform fulfilling its function. The objective of this course is to provide an overview of the theoretical fundamentals of classical molecular dynamics, discuss some practical aspects and show some specific applications of energy minimization and dynamics simulation of proteins or nucleotide sequences in order to illustrate the theoretical concepts. Students will be able to deepen their understanding of principles of macromolecular structure and function, to gain practical experience in the of molecular model construction and evaluation and to get familiar with standard MD algorithms. course outline

see Spanish version

see Spanish version

see Spanish version

Dinámica molecular restringida. Una de las herramientas para estudiar las macromoléculas de interés biológico (secuencias de ADN o ARN, proteínas) es la dinámica molecular. La dinámica molecular calcula el comportamiento de un sistema molecular en dependencia del tiempo. Este método se emplea hoy día en forma rutinaria para investigar la estructura y entender la dinámica en los procesos de formación, operación e interacci ón de estas macromoléculas. En el campo de la proteómica, se usa la dinámica molecular para analizar la estabilidad de una proteína, su plegamiento y sus cambios conformacionales, la interacción con otras proteínas u otras biomoléculas, y permite describir y modelar los procesos complejos que aplican las proteínas para poder cumplir con su función, como por ejemplo la unión de ligados, el transporte de iones y la inserción en membranas. El objetivo del presente curso es dar una visión general de los fundamentos teóricos de la dinámica molecular clásica, discutir algunos aspectos prácticos, y mostrar algunas aplicaciones específicas de la minimización de energía y la simulación dinámica de proteínas o secuencia de nucleótidos. Estos temas de aplicación acompa˜naran e ilustrarán la exposición de los conceptos teóricos a lo largo del curso. Se espera poder profundizar el entendimiento del estudiante en los principios de la estructura macromolecular y su relación con su función, generar experiencia práctica en el proceso de construcci ón y evaluación de modelos moleculares y familiarizar el estudiante con el uso de los algoritmos estándares de la dinámica molecular.

more Machine Learning in Bioinformatics

more Machine Learning in Bioinformatics

more Machine Learning in Bioinformatics

Machine learning (ML), a branch of artificial intelligence, comprises techniques that allow computers to learn. ML seeks to optimize a performance criterion in order to describe information contained in data. In bioinformatics, ML is able to retrieve information from the increasing biological databases. From an informatics perspective, the ML techniques are classified in different groups, among them: Classification y Clustering, Feature selection, Biological sequence analysis and phylogenetic inference. The proposed course applies a theoretical-practical approach. The theoretical part introduces the relevant biological and computational concepts, explains the main ML techniques and points out biologicas problemas, where these techniques are successful. The practical part, exemplary problems are solved, based on ML software ( for example BioMall). The student should not only apply these techniques but also draw consistent informatic and biologic conclusions. course outline

see Spanish version

see Spanish version

see Spanish version

Aprendizaje de máquina en bioinformática. Aprendizaje de máquina, una rama de la inteligencia artificial, trata de las técnicas que permiten que los computadores aprendan. Está basado en datos y busca optimizar un criterio de desempe˜no, para lograr describir la información contenida en ellos. Tiene importancia especial en bioinformática, área que puede ser considerada como la aplicación de tecnologías de información a la biología molecular. La cantidad de datos biológicos almacenados en bases de datos crece exponencialmente, y la mayor ía de ellos está públicamente disponible. En varios campos biológicos como genómica, proteómica y biología de sistemas, se aplican con éxito técnicas de aprendizaje de máquina. Desde el enfoque informático, las técnicas de aprendizaje se pueden clasificar en grupos grandes, entre ellos los que son objetivos de esta asignación: Clasificación y agrupamiento, selección de características, análisis de secuencias biológicas e inferencia filogenética. La asignación propuesta tiene un enfoque teórico—práctico. En la parte teórica se introducen los conceptos de ambos campos involucrados, se explican las principales técnicas de aprendizaje de máquina y se se˜nalan los problemas bioinformáticos, donde se pueden aplicar exitosamente estas técnicas. La parte práctica consiste en la solución de problemas ejemplares, basado en un software de aprendizaje de máquina (por ejemplo BioMall), donde el estudiante, basándose en datos biológicos, no sólo aplica las técnicas, sino que está motivado a sacar conclusiones de tipo informático y biológico.

more Stochastic models in Bioinformatics

more Stochastic models in Bioinformatics

more Stochastic models in Bioinformatics

Biological Sequence Modeling is a most important task in bioinformatics, which applies to DNA, RNA and aminoacid sequences. It is used in many of the typical problems of computational biology, like structure analysis and prediction, profile constructing of related sequence sets (families) or evolutionary analysis. The most successful models are of stochastic type, because they are able to describe the statistic nature inherent in biological processes: mutations which may conduce to evolutionary consequences are generally random driven, making statistic approaches most adequate. The proposed course therefore emphasizes the use of probabilistic models, including Markov Chains, Hidden Markov Models, and their generalization: models based on context free grammars. The course introduces the general concepts required to understand these models, describes the essential algorithms for their application and illustrates with practical examples their use in biological sequence analysis.

see Spanish version

see Spanish version

see Spanish version

Modelos estocásticos en bioinformática. La modelación de secuencias biológicas es una tarea importante de la bioinformática, la cual aplica a secuencias de ADN, ARN y de aminiácidos. Se usa en muchos problemas típicos de la biología computacional, como lo son el análisis y la predicción de estructuras, la construcción del perfiles para conjuntos de secuencias relacionadas (familias) o análisis evolutivo. Los modelos más exitosos son de tipo estocástico, ya que son capaces de describir la naturaleza estadística inherente en procesos biológicos: mutaciones que puede conducir a consecuencias evolutivas, se deben generalmente a la aleatoriedad, lo que hace los enfoque estadísticos tan adecuados. El curso propuesto hece por ende énfasis en el uso de modelos probabilísticos, incluyendo cadenas de Markov, modelos ocultos de Markov y su generalización: modelos basados en gramáticas libres de contexto.El curso introduce los conceptos generales que son necesarios para entender estos modelos; describe los algoritmos esenciales para su aplicación; y ilustra con ejemplos prácticos como se usan estos modelos en el análisis de secuencias biológicas.

more Introduction to Bioinformatics

more Introduction to Bioinformatics

more Introduction to Bioinformatics

Original title: “Introducción a la bioinformática”.

more Bioinformatics Tools

more Bioinformatics Tools

more Bioinformatics Tools

Original title: “Herramientas para la bioinformática”.

Thesis

Publications

Software

Awards

Caracterización genómica de los sitios de integración de provirus HTVL-I en linfocitos en individuos asintomáticos del suroccidente. Premio Nacional en el área Genética y Biotecnología. En el marco del XLIV Congreso Nacional de la Asociación Colombiana de Ciencias Biológicas (Personería Jurídica No. 05547, Dic. 16 de 1974. Nit. 805.014.676-1). Octubre 10 de 2.009.

Contact

Bioinformática y Biocomputación

pedro.moreno@correounivalle.edu.co
Teléfono: (57) 2 3212100 Ext. 2283

Edificio 331, espacio 2068
Ciudad Universitaria Meléndez
Calle 13 No 100-00

Universidad del Valle
Cali, Colombia
?nolink240x180
start.txt · Last modified: 2017/04/17 19:29 by bioinfo