Our Group

Our bioinformatics research group is located at the Universidad del Valle, Cali, Colombia. We are fascinated by microbiological and human genome questions and their complexity, and seek to contribute to their analysis and solution. We belong to the Computer Science Department (EISC) of our university, therefore our approaches are mainly informatics and computer oriented.

Our main topics omics analyses, gene finding and protein structure prediction, where we apply artificial intelligence methods, AlphaFold-DeepMind-IA, neural networks as well as data mining techniques, chaos theory approache (fractal and multifractal analysis), statistical analysis, and FPGA technology. We also work on metagenomics to analyze Colombian Andean environments and human health problems, such as breast cancer. Generally, our results include software and hardware tools which allow other users to apply our approaches to their specific context.

Our group is interdisciplinary, made up of professors, graduate and undergraduate students from different disciplines, especially from computer science, biology, and health sciences. That's why we feel capable to face complex problems using both: biological state-of-the-art knowledge and advanced computational methodologies.

More information about our group at:
GrupLac, MinCiencias, Colombia.

People

Leaders

PhD

Master

Undergraduate

We wait for you here!

MFA and human genome project-2007

GeBiX project-2012

Breast cancer and Omics I project-2015

Human genome FPGA project-2018

Cenicaña project-2018

Human gene regulation project-2018

EISC teachers and students-2019

In silico antimalarial molecules project-2020

Protein folding project-2021

Rare diseases project-2022

RIABIO network project-2023

Breast cancer and Omics II project-2023

IGR project-2025

M2HOD project-2025

Research Fields

Our group works in several research fields and projects as listed below. Our overall goals in all fields are: improve computational analysis and prediction in our specific research fields; contribute to bioinformatics education at undergraduate, master and PhD level; and support with a strong informatics approach, bioinformatics and computational biology research.

MFA-HG Project https://ingenieriainforma.blogspot.com/2011/11/un-grupo-de-bioinformatica-de-la.html
GeBiX Project https://www.mineducacion.gov.co/1621/w3-article-235090.html
Omics I Project https://ingenieriainforma.blogspot.com/2022/07/investigadores-buscan-los-genes-que.html
MFA&FPGA Project https://bibliotecadigital.univalle.edu.co/bitstreams/16a19ce2-84d0-4061-a045-1a0d8f5d58c3/download
Antiplasmodial Project - In silico antimalarial molecules project -https://onlinelibrary.wiley.com/doi/abs/10.1002/ardp.202400081
RDP-Rare Disease Project - https://www.javerianacali.edu.co/centro-interdisciplinario-de-estudios-en-salud/asociacion-genomica-para-enfermedades-raras
RIABIO Network Project https://www.cyted.org/RIABIO
Omics II Project (82210) https://minciencias.gov.co/sites/default/files/20210414113718cwnoqbanco_definitivo_mecanismo_1_1.pdf
IGR Project - Genomics and Bioinformatics in Intrauterine Growth Restriction
M2HOD Project - Molecular Mechanisms in Human and Organismal Diversity

Click to display ⇲

Click to hide ⇱

Gene modeling and prediction

Objective: Develop and analyze models and algorithms for gene analysis, prediction and gene or genome comparison based on informatics methodologies.
Recent developments:
* Multifractal approach for genome analysis.
* Graphic interfaces for gene prediction, able to make training and prediction easier for the end user.
* User directed feedback which allows to control and improve the training process.
* Comparison of different gene predictions and their optimization by Bayesian mixtures.
* New models for promotors and exons.

Protein structure and function modeling

Objective: Develop computer models and algorithms able to analyze and predict protein structure and its relation to function.
Recent developments:
* New models for secondary structure prediction based on generalized HMM.
* Secondary structure classification based on support vector machines.
* Simplified molecular dynamics using a cellular automaton approach for contact maps.
* Analysis of the relationship between protein structure and physico-chemical properties of its aminoacid sequence.

Metagenomics

Objective: Develop software tools for computational construction and analysis of metagenomes, to apply specially to Colombian Andean regions.
Recent developments
* Development of new metagenome assembly algorithms based on partial sequence information.
* Algorithms and models in order to identify genome data of microorganisms and metagenomes.
* Gene finding in metagenomes.

Bioinformatics software development

Objective: Develop software tools for bioinformatics analysis and prediction of high quality and efficiency in specific cases where public domain software is not apliable or sufficient.
Recent developments:
* Software for fractal and multifractal analysis.
* Software tools to analyze and characterize retrovirus integration sites.
* Public computation in bioinformatics.
* Virtual machines in bioinformatics.
* Frameworks for NGS workflows.

Omics sciences

Objective: Develop software and analysis tools for the construction and computational analyses of genomes, exomes, transcriptomes, metagenomes, etc., applied to Colombian environmental and health problems.
Recent developments
* Development of new framework for exomes analyses in breast cancer samples.
* Algorithms and models in order to identify exomes data of patients with breast cancer.
* Finding of genes and variations in the breast cancer exome.
https://link.springer.com/chapter/10.1007/978-3-319-43033-1_1

Research Projects

Click to display ⇲

Click to hide ⇱

**Análisis Ómico, Multifractal y Ancestría En Medicina Personalizada y de Precisión con Impacto en el Cáncer de Mama

**Implementación y evaluación de un modelo predictivo de asociación genómica para Enfermedades Raras basado en configuraciones de repeticiones ADN y variantes estructurales

**UTILIZACIÓN DE UNA ESTRATEGIA MULTIDISCIPLINARIA PARA LA IDENTIFICACIÓN DE NUEVOS COMPUESTOS HETEROCÍCLICOS SINTÉTICOS CON ACTIVIDAD ANTIMALÁRICA (2021 - 2024)

Análisis de imágenes de pacientes con ca. mamario mediante IA. Vélez PE., Spetale F., Tapia E., Moreno PA. (2021 - Sent to the RIABIO network)

Platform in omics sciences and breast cancer health states (Phase II) and modeling with artificial intelligence techniques. Universidad del Cauca, Universidad del Valle; Bioinformatics and Biocomputation,(2021-2024)

Original title: “PLATAFORMA EN CIENCIAS ÓMICAS DEL CÁNCER MAMARIO, SUR-OCCIDENTE (FASE II) Y MODELAMIENTO CON TÉCNICAS DE INTELIGENCIA ARTIFICIAL ”.
Convocatoria 890 - MinCiencias. Universidad del Valle.

RIABIO: RED IBEROAMERICANA DE INTELIGENCIA ARTIFICIAL PARA BIG BIODATA (2021-2024)

Original title: “RED IBEROAMERICANA DE INTELIGENCIA ARTIFICIAL PARA BIG BIODATA (RIABIO) ”.
Cyted es el Programa Iberoamericano de Ciencia y Tecnología para el Desarrollo, creado por los gobiernos de los países iberoamericanos para promover la cooperación en temas de ciencia, tecnología e innovación para el desarrollo armónico de Iberoamérica. http://www.cyted.org/es/noticias/redes-y-proyectos-aprobados-convocatoria-2020. The network is made up of 10 countries, 35 research groups (3 from Colombia) and 172 researchers. Research, workshops, training for young researchers and graduate students will be held here. The network will apply to collaborative research projects to obtain funding for the indicated activities, among others.

Platform in omics sciences and breast cancer health states, Cali, Valle del Cauca, Occident. Plataforma en ciencias omicas del cancer mamario, Cali, Valle del Cauca, occidente. Omicas, 2015-2020.

Original title: “Implementación plataforma en ciencias omicas y salud del cancer mamario, Cali, Valle del Cauca, occidente.”.
Resumen: La presente propuesta de investigación de macro-proyecto en Fase II de pre-inversión, prefactibilidad para su financiación por el Sistema General de Regalías (SGR) en modalidad de investigación básica-aplicada se encuentra enmarcada de acuerdo a la agenda nacional de CTeI, las agendas departamentales del Valle, Cauca, Chocó y Nariño y las municipalidades de Cali, Buenaventura, Popayán, Guapí, Quibdó, Pasto y Tumaco involucradas. Las actividades de ciencia, tecnología e innovación (ACTI) a desarrollar se enmarcan en Investigación y desarrollo experimental. La plataforma es liderada por la Universidad del Valle e integra la experticia de 3 grupos de investigación, pertenecientes a la Universidad del Valle y uno de la Universidad del Cauca. La plataforma propende contribuir al desarrollo integral en CTeI de cada uno de los grupos de investigación involucrados y al entendimiento de la génesis del Ca mamario en el SO del país. A su vez, la plataforma se apoya en la colaboración de algunos Hospitales Dptles., Clínicas, Secretaría Dptal. de Salud del Valle, Universidades y de las personas involucradas en el estudio y localizadas en las municipales citadas arriba. Royalties project granted by the Gobernación del Valle and National System of Royalties. Research Grant #2013000100297.

A metagenomics bioinformatics platform for characterization and exploitation of genetic resources in Colombian extreme environments. Centro de Investigación de Excelencia en Genómica y Bioinformática GeBix, 2008-2016.

Original title: “Conformación de una plataforma en metagenómica y bioinformática para la caracterización y aprovechamiento de recursos genéticos de ambientes extremos”.Colciencias Biotechnology Research Grant #6570-392-19990
Resumen: Colombia se considera uno de los países con mayor diversidad en el planeta y por consiguiente posee un recurso natural invaluable. Es imprescindible, sin embargo, conocer en profundidad esta biodiversidad para lograr así aprovechar todo su potencial. Dentro de esta biodiversidad existe un desconocimiento de la vida microbiana, y sobre todo de su potencial, debido en gran parte a que la mayoría de los microorganismos presentes en el ambiente no son cultivables. En respuesta a esta dificultad ha surgido la metagenómica, estrategia que se define como el análisis del contenido genómico total de una comunidad, ya que complementa enfoques descriptivos y permite acceder y valorizar la riqueza biológica no cultivable. El auge de la genómica se ha dado a la par con el desarrollo de herramientas bioinformáticas que hoy en día hacen posible descripciones globales de sistemas biológicos y sus rutas metabólicas y estudiar procesos que van desde la célula hasta ecosistemas. La presente propuesta de investigación está orientada a consolidar la capacidad nacional para hacer estudios genómicos, y específicamente metagenómicos para explorar y valorar la diversidad microbiana de ambiente extremos, a través de la conformación del Centro Colombiano de Genómica y Bioinformática de Ambientes Extremos (GeBiX) que reunirá los esfuerzos de 16 grupos de investigación en 8 instituciones del país. Se tomará como modelo de estudio el Parque Nacional Natural de los Nevados que contiene diferentes ambientes extremos, como el páramo y manantiales termales. Estos ambientes representan ecosistemas de propiedades únicas y son fuente valiosa de organismos, genes y enzimas que pueden tener una amplia gama de aplicaciones. Para iniciar, se tamizarán librerías por función y por secuencia para identificar productos de interés industrial. La bioinformática permitirá el almacenamiento, procesamiento, la disponibilidad, consulta y administración de la información.

Multifractal, FPGA technology and Human genome. http://eisc.univalle.edu.co, Universidad del Valle; Bioinformatics and Biocomputation,(2010-2012)

Original title: “Aceleración en hardware del análisis multifractal del genoma humano. SICOP: 2766. Code: CI-2766 ”.
Convocatoria interna SICOP 2766, Universidad Del Valle.

A graphic environment for eukariote gene prediction based on a highly configurable software tool (Genezilla). Bioinformatics and Biocomputation, Universidad del Valle (2011)

Original title: “Desarrollo de un predictor gráfico altamente configurable para genes de diversos organismos”.
Universidad del Valle, June 2006 - May 2011.
Abstract: Gene prediction is one of the mayor problems in bioinformatics. It is principally a computational task, which includes modeling of gene components and the whole gene. Due to the increasing amount of available information and the growing computational capacity, the actual gene predictors reach high prediction levels. Among these predictors, Genezilla stands out because it reaches precision levels of about 88% in human gene prediction. Genezilla is highly configurable, that is, it allows to select the models and adapt their parameters to a specific organism, using adequate data sets. However, for a molecular biologist, the correct configuration could turn out difficult. This complex process requires a general understanding of training and prediction processes and specifically, the computational programming used in Genezilla which works with scripts.

Therefore, the Bioinformatics and Biocomputation research group intended to complement this predictor, with the objective to increase the amiability of the required computational processes and to facilitate further analysis of the obtained results. Therefore we developed an interactive interface of wizard type which guides the user through the training and prediction processes. We provide a user friendly visualization of results where predicted genes with their different components are easily identified. We developed an additional functionality, an evaluation module which is able to measure and compare the goodness of different predictors or different configurations of Genezilla as well as predictions made by Genezilla and other programs. With this project, we hope to deliver to the bioinformatics community, an easy-to-use software tool which offers the possibility of being configured according to the user's necessities. Furthermore we would like to emphasize the project's impact to student formation, given the participation of a group of undergraduate and graduate students. Finally, with this first research project, the Bioinformatics and Biocomputation research group was consolidated and started working with impact at local and regional level. more

Optimization of eukariote gene prediction, applying decision trees and bayesian nets. Bioinformatics and Biocomputation, Universidad del Valle (2011)

Original title: “Optimización de la predicción de genes de organismos eucariotas,aplicando árboles de decisión y redes bayesianas”.
Universidad del Valle, June 2007 - May 2011.
Abstract: In the present research project we seek to contribute to gene prediction, an important bioinformatics field, that comprises the modeling of gene components as well the whole gen. The project is constructed on the well known gene prediction software Genezilla. In addition, we use results of a prior project of our group, where we developed interfaces for Genezilla, which make it easier for the bioinformatics user to apply the central training and prediction processes of this predictor. The present project seeks to improve predictions, using different approaches: development of new models, adequate combination of diverse predictions, and implementation of feedback mechanisms that provide the user with information about the precision of a configuration during the training process. The project belongs to the research field: “Bioinformatics software development” of the Bioinformatics and Biocomputationón research group of the Universidad del Valle. more

FPGA technology and Metabolism. http://eisc.univalle.edu.co, Universidad del Valle; Bioinformatics and Biocomputation,(2008-2010)

Original title: “Diseño de una arquitectura hardware para emular la glucólisis usando FPGA”.
Convocatoria interna SICOP 2621, Universidad Del Valle.

Genomic cartography of the integration process of provirus HTLV-1. Laboratorio de Biología Molecular y Patogénesis; Bioinformatics and Biocomputation, Universidad del Valle (2009)

Original title: “Cartografía genómica del proceso de integración del provirus HTLV-1”.
Universidad del Valle, 2007- 2009
Resumen: El virus linfotrópico humano de células T tipo I (HTLV I), fue el primer retrovirus humano identificado. En 1981 se asoció con la Leucemia Linfoma de Células T del Adulto (LLTA), una hemopatía maligna, caracterizada por una expansión preferentemente monoclonal de células CD3+, CD4+, CD8+ y HLA-R+. Posteriormente, en 1985, se asoció con la Paraparesia Espástica Tropical/Mielopatía Asociada al HTLV-I (PET/MAH), una neuropatía desmielinizante de la médula espinal con compromiso piramidal. Diferentes reportes en la literatura mundial, han revelado la existencia de una posible asociación del virus con enfermedades inflamatorias incluidas la dermatitis infecciosa, la uveítis, la artritis, la tiroiditis y la polimiositis, entre otras. Actualmente la distribución de la infección por HTLV-I es mundial; datos epidemiológicos recientes, muestran que hay aproximadamente 25 millones de personas infectadas. En Colombia se registran seroprevalencias del 1% al 2%. A pesar de su distribución mundial, existen focos endémicos en el Japón, el Caribe, algunas zonas de áfrica central, Centro y Sur América. Estudios recientes, evidencian que tanto en el HTLV-I como en otros retrovirus humanos y no humanos, su integran no es al azar. Este proceso no aleatoria es dependiente de factores estructurales y funcionales de los genomas tanto del huésped como del virus. Como producto de estos factores, se seleccionarían ambientes genómicos específicos para la integración. En este proyecto se propone desarrollar estudios in silico, de citogenética molecular y de epidemiología sobre la estructura y características genómicas de 189 secuencias del genoma humano vecinas a las regiones de integración de provirus HTLV-I; éstas provienen de pacientes colombianos y japoneses con diagnóstico de PET/MAH, LLTA además de asintomáticos naturalmente infectados. Los resultados que se obtengan permitirán demostrar la existencia o no de diferencias.

Multifractal analysis of the human genome. Bimac, Universidad del Cauca; Bioinformatics and Biocomputation, Universidad del Valle (2004-2008)

Original title: “Análisis Multifractal del Genoma Humano para la Búsqueda de Regularidades con Sentido Biológico”.
Colciencias, Universidad del Cauca, Universidad del Valle, 2004-2008. Biotechnology Research Grant #1103-12-16765.

Courses

Click to display ⇲

Click to hide ⇱

Herramientas computacionales de bases de datos biológicas

750107m_herramientas_de_bases_de_datos_biolo_gicas.xxx 750107M. Herramientas Computacionales para el Análisis de Bases de Datos Biológicas. Facultad de Ingeniería EISC - Universidad del Valle. Semestre 2024_II

Clase Fecha Área temática

1. Principios de Biología Molecular Tema Material disponible en el “Google drive” 1 Historia y Conceptos de biología molecular Diapositivas 2 Propiedades de los ácidos nucleicos Diapositivas 3 Replicación, estructura de genes, transcripción, procesamiento del ARN, regulación Diapositivas 4 Traducción o Síntesis de proteínas Diapositivas. Material de repaso 5

2. Algoritmos en bioinformática

3. Herramientas y Aplicaciones en bioinformática

(Biotecnologías, Biomedicina, Agricultura, Medio ambiente, Energías, etc)

¿Qué es la bioinformática?

Programa BioEdit. Linux. Bases de datos: NCBI, KEGG, PDB, etc. Parcial BM Diapositivas. Libros: 1) Developing Bioinformatics skills, Gibas 2001. 2) Bioinformatics_ for_Dummies 6 Análisis de secuencias Algoritmos y presentaciones (Programación dinámica, Algoritmos (N-W, S-W, BLAST) Diapositivas. Material en la web 7 Continuación: Algoritmos y presentaciones (N-W, S-W, BLAST y tipos de BLAST). Programas “on line” Diapositivas. Material en la web 8 Filogenia. Presentaciones: Algoritmos (UPGMA, MP, NJ, ML). Programa MEGA. Diapositivas. Material en la web 9 Estructura de proteínas y predicción (PDB, Pfam. Jpred). Taller Diapositivas. Material en la web 10 Ciencias ómicas (Genómica, transcriptómica, proteómica, metabolómica). Metagenómica. Otras ómicas Diapositivas. Material en la web 11 Inteligencia artificial, Técnicas de aprendizaje de máquinas, Aprendizaje profundo, Minería de datos, modelos (Ocultos) de Markov aplicadas a problemas en bioinformática. Diapositivas. Material en la web

		Estructura de proteínas y predicción (PDB, Pfam. Jpred). Alphafold. Modelamiento molecular	Diapositivas. Material en la web

12 - 13 Biología de sistemas. Integrómica. Bioproyectos *: Presentaciones (BioLinux, BioPerl, BioPython, Biojava). Diapositivas. Material en la web 14 - 16 Examen final Repasar notas y ejercicios

Profesor: Pedro A. Moreno Página web: http://bioinformatica.univalle.edu.co Evaluación del curso: 1) Parcial de BM 20%,

Introduction to Bioinformatics

Original title: “Introducción a la bioinformática”.

Bioinformatics I

Bioinformatics is a multidisciplinary field where Biology and Computer Science interact. It seeks to solve complex biological problems using informatics and computation tools. It also includes collection, organization, storage and retrieval of biological information from databases. Bioinformatics analysis and modeling has impact on disease detection and treatment, and on genetic improvement of agrarian products, with positive effects on conditions and quality of human life.
This course introduces students to the basic concepts of Bioinformatics and Computational Biology. The computational processes of description, analysis and modeling of biological information are demonstrated, using DNA, RNA and protein data stored in public database, and it is shown how they conduce to a better understanding of many biological processes. course outline

see Spanish version

Bioinformática I. Bioinformática es una disciplina multidisciplinaria científica definida como la interacción entre dos ciencias: Biología y Computación. Involucra la solución de problemas complejos biológicos usando herramientas de sistemas y computación. También incluye la colección, organización, almacenamiento y recuperación de la información biológica que se encuentra en base de datos. Como resultados del análisis y modelado bioinformático se obtienen avances en la detección y tratamiento de enfermedades y la producción de alimentos gen´eticamente modificados, que puede ayudar a mejorar la condición y calidad de vida humana. El presente curso introduce al estudiante a la los conceptos básicos de la Bioinformática y Biología computacional. Haciendo uso de una siempre creciendo cantidad de datos genéticos y proteicos almacenados en bases de datos de acceso público, se introduce al estudiante a los procesos computacionales para la descripción, análisis y modelación de información biológica, que puede resultar en un mejor entendimiento de muchos procesos biológicos.

Multifractal scaling in Bioinformatics

Biological Sequence Modeling is a most important task in bioinformatics, which applies to DNA, RNA and aminoacid sequences. It is used in many of the typical problems of computational biology, like structure analysis and prediction, profile constructing of related sequence sets (families). The most successful models used by us are of fractal behavior, because they are able to describe the scalar properties in biological processes: mutations which may conduce to chaotic consequences are generally random driven, making statistic approaches most adequate. The proposed course therefore emphasizes the use of chaotics models, including fractals, multi fractal, wavelets, Markov Chains, Hidden Markov Models, and their generalization: models based on context free grammars. The course introduces the general concepts required to understand these models, describes the essential algorithms for their application and illustrates with practical examples their use in biological sequence analysis.

see Spanish version

Modelos estocásticos en bioinformática. La modelación de secuencias biológicas es una tarea importante de la bioinformática, la cual aplica a secuencias de ADN, ARN y de aminiácidos. Se usa en muchos problemas típicos de la biología computacional, como lo son el análisis y la predicción de estructuras, la construcción de perfiles para conjuntos de secuencias relacionadas (familias) o análisis clasificatorio. Los modelos más exitosos son de tipo fractal y multirracial, ya que son capaces de describir la naturaleza escalar inherente en procesos biológicos: mutaciones que puede conducir a consecuencias autoorganizadas, se deben generalmente a la aleatoriedad, lo que hace los enfoque caótico tan adecuados.

Restricted Molecular Dynamics

Molecular dynamics (MC), the computer simulation of movements of atoms and molecules, is frequently applied to biomolecules (DNA or RNA sequences, proteins). Based on numerical methods, MD calculates their time-depend behavior. Generally, it is used to study the molecule's structure and understand the dynamics of the formation, functioning and interaction. In proteomics, MD is used to analyze a protein's stability and allows to model the complex processes a protein to perform fulfilling its function. The objective of this course is to provide an overview of the theoretical fundamentals of classical molecular dynamics, discuss some practical aspects and show some specific applications of energy minimization and dynamics simulation of proteins or nucleotide sequences in order to illustrate the theoretical concepts. Students will be able to deepen their understanding of principles of macromolecular structure and function, to gain practical experience in the of molecular model construction and evaluation and to get familiar with standard MD algorithms. course outline

see Spanish version

Dinámica molecular restringida. Una de las herramientas para estudiar las macromoléculas de interés biológico (secuencias de ADN o ARN, proteínas) es la dinámica molecular. La dinámica molecular calcula el comportamiento de un sistema molecular en dependencia del tiempo. Este método se emplea hoy día en forma rutinaria para investigar la estructura y entender la dinámica en los procesos de formación, operación e interacci ón de estas macromoléculas. En el campo de la proteómica, se usa la dinámica molecular para analizar la estabilidad de una proteína, su plegamiento y sus cambios conformacionales, la interacción con otras proteínas u otras biomoléculas, y permite describir y modelar los procesos complejos que aplican las proteínas para poder cumplir con su función, como por ejemplo la unión de ligados, el transporte de iones y la inserción en membranas. El objetivo del presente curso es dar una visión general de los fundamentos teóricos de la dinámica molecular clásica, discutir algunos aspectos prácticos, y mostrar algunas aplicaciones específicas de la minimización de energía y la simulación dinámica de proteínas o secuencia de nucleótidos. Estos temas de aplicación acompa˜naran e ilustrarán la exposición de los conceptos teóricos a lo largo del curso. Se espera poder profundizar el entendimiento del estudiante en los principios de la estructura macromolecular y su relación con su función, generar experiencia práctica en el proceso de construcci ón y evaluación de modelos moleculares y familiarizar el estudiante con el uso de los algoritmos estándares de la dinámica molecular.

Machine Learning in Bioinformatics

Machine learning (ML), a branch of artificial intelligence, comprises techniques that allow computers to learn. ML seeks to optimize a performance criterion in order to describe information contained in data. In bioinformatics, ML is able to retrieve information from the increasing biological databases. From an informatics perspective, the ML techniques are classified in different groups, among them: Classification y Clustering, Feature selection, Biological sequence analysis and phylogenetic inference. The proposed course applies a theoretical-practical approach. The theoretical part introduces the relevant biological and computational concepts, explains the main ML techniques and points out biologicas problemas, where these techniques are successful. The practical part, exemplary problems are solved, based on ML software ( for example BioMall). The student should not only apply these techniques but also draw consistent informatic and biologic conclusions. course outline

see Spanish version

Aprendizaje de máquina en bioinformática. Aprendizaje de máquina, una rama de la inteligencia artificial, trata de las técnicas que permiten que los computadores aprendan. Está basado en datos y busca optimizar un criterio de desempe˜no, para lograr describir la información contenida en ellos. Tiene importancia especial en bioinformática, área que puede ser considerada como la aplicación de tecnologías de información a la biología molecular. La cantidad de datos biológicos almacenados en bases de datos crece exponencialmente, y la mayor ía de ellos está públicamente disponible. En varios campos biológicos como genómica, proteómica y biología de sistemas, se aplican con éxito técnicas de aprendizaje de máquina. Desde el enfoque informático, las técnicas de aprendizaje se pueden clasificar en grupos grandes, entre ellos los que son objetivos de esta asignación: Clasificación y agrupamiento, selección de características, análisis de secuencias biológicas e inferencia filogenética. La asignación propuesta tiene un enfoque teórico—práctico. En la parte teórica se introducen los conceptos de ambos campos involucrados, se explican las principales técnicas de aprendizaje de máquina y se se˜nalan los problemas bioinformáticos, donde se pueden aplicar exitosamente estas técnicas. La parte práctica consiste en la solución de problemas ejemplares, basado en un software de aprendizaje de máquina (por ejemplo BioMall), donde el estudiante, basándose en datos biológicos, no sólo aplica las técnicas, sino que está motivado a sacar conclusiones de tipo informático y biológico.

Thesis

PhD Thesis

Master Thesis

Undergraduate Thesis

Ongoing Projects and Opportunities

Publications

2025 | 2024 | 2023 | 2022 | 2021 | 2020 | 2019 | 2018 | 2017 | 2016 |2015 | 2014 | 2013 | 2011 | 2010 | 2009 | 2008 | 2007 | 2006 | before 2006 |

Software

2011	before 2011

Videos and Links

* Multifractal System
* Análisis multifractal de genomas
* Bioinformatics group at EISC
* Programas acadèmicos de posgrados - EISC

Contact

Bioinformática y Biocomputación

pedro.moreno@correounivalle.edu.co
Teléfono: (57) 2 3212100 Ext. 2283

Edificio B13, Lab 3005
Ciudad Universitaria Meléndez
Calle 13 No 100-00

Universidad del Valle
Cali, Colombia
Línea de tiempo EISC

Planta física UniValle

Bioinformatics Research Group at Universidad del Valle

Table of Contents

Our Group

People

Research Fields

Research Projects

Courses

Thesis

Publications

Software

Videos and Links

Contact

Bioinformatics Research Group at Universidad del Valle

User Tools

Site Tools

Table of Contents

Our Group

People

Research Fields

Research Projects

Courses

Thesis

Publications

Software

Videos and Links

Contact

Page Tools