Bioinformática

Permanent URI for this collectionhttps://dspace.unia.es/handle/10334/400

Browse

Recent Submissions

Now showing 1 - 8 of 8
  • Open AccessTrabajo académico
    Variabilidad natural de la Isla Genómica 1 de "Haloquadratum walsbyi"
    (Universidad Internacional de Andalucía, 2013) Martín Cuadrado, Ana Belén; Martín Cuadrado, Ana Belén
    Trabajo Fin de Máster. Tutores: Francisco Rodríguez Valera y Enrique Viguera Mínguez. El presente trabajo presenta el análisis bioinformático de varios fósmidos pirosecuenciados pertenecientes a una zona muy concreta del genoma de la archaea cuadrada hiperhalófila Haloquadratum walsbyi, la isla genómica 1 (GI1). Esta área se fue definida como tal en el trabajo de Cuadros-Orellana et al. (2007) usando como referencia el genoma de H. walsbyi DSM 16790. En este trabajo, se han analizado varios fragmentos genómicos pertenecientes a varios linajes co-existentes de esta archaea cuadrada, la cual domina la flora microbiana de aguas hipersalinas. En concreto, el área del genoma estudiada es la isla genómica rica en genes que codifican proteínas implicadas en la envuelta celular de esta archaea (denominda GI1 en este trabajo). A partir de una librería de fósmidos ambiental construida a partir de una muestra recogida en el mismo cristalizador (CR30) donde el primer aislado de H. walsbyi se obtuvo (cepa HSBQ001), se han secuenciado 7 fósmidos que cubren GI1, donde se encuentran, entre otros, el gen para la “proteína mayoritaria de la capa S” y otras glicoproteínas de la superficie celular. Además de estos fragmentos, hemos sumado en el análisis, las islas GI1 presentes en los genomas y la descrita previamente presente en el fósmido eHw-559.
  • Open AccessTrabajo académico
    Identificación de regiones hipervariables de bacterias patógenas mediante herramientas bioinformáticas. Aplicación en el genotipado bacteriano
    (Universidad Internacional de Andalucía, 2012) Jiménez Bautista, Mercedes; Jiménez Bautista, Mercedes
    Trabajo fin de Máster dirigido por Enrique Viguera Mínguez. La gran mayoría de los genomas de organismos procariotas analizados hasta la fecha poseen secuencias de DNA repetidas. Estas repeticiones se localizan tanto en regiones génicas como intergénicas y se clasifican en repeticiones dispersas y repeticiones en tándem. En cuanto a su organización física, estas repeticiones pueden constituir desde repeticiones en tándem de una secuencia de pocos nucleótidos a múltiples copias de genes completos, como en el caso del RNA ribosómico y del RNA transferente.
  • Open AccessTrabajo académico
    Análisis bioinformatico de vías de transducción humanas con identificación de parálogos en contexto transcriptómico
    (Universidad Internacional de Andalucía, 2012) Pérez Martín, Daniel; Pérez Martín, Daniel
    Trabajo fin de Máster dirigido por Javier de las Rivas y Toni Gabaldón. Las vías metabólicas y de señalización presentan una información experimental de forma clara y eficaz. Su procesamiento y análisis bioinformático es una herramienta eficaz en la integración de información experimental. Este trabajo pretende analizar la posibilidad de integrar la información de relaciones entre nodos de una vía con la información de expresión y evolución de los genes que representan. Para ello se analiza la vía de señalización de las MAPK en humanos en clave de coexpresión y coevolución de los genes relacionados. Se han creado una serie de programas para procesar estos cálculos y se presentan los resultados obtenidos para la vía de las MAPK.
  • Open AccessTrabajo académico
    Estudio y evaluación de algoritmos y programas de ensamblaje de secuencias
    (Universidad Internacional de Andalucía, 2011) Hormigo Ruiz, Miguel; Hormigo Ruiz, Miguel
    Trabajo fin de Máster dirigido pro Manuel Gonzalo Claros Llanos. Los objetivos del proyecto son los siguientes: a) Realizar un estudio sobre los métodos de ensamblaje, teniendo en cuenta su componente teórica (algoritmos y heurísticas utilizadas) y su desarrollo en programas de ensamblaje (origen, investigación, desarrollo, referencias iniciales y actuales, y futuro del método). b) Evaluar desde un punto de vista teórico los distintos programas de ensamblaje de secuencias, observando tanto los comerciales como los de libre distribución, clasificando su desarrollo, construcción, objetivos, uso, aplicación, referencias, funcionamiento (fiabilidad, rendimiento, consumos, …) y previendo futuro del programa. c) Instalar y evaluar el funcionamiento de los programas más habituales de ensamblaje de secuencias, teniendo en cuenta su acceso a los mismos. El método de trabajo será principalmente la recopilación de información sobre los algoritmos y programas de ensamblaje de secuencias y la instalación de los programas que se puedan descargar, instalar y ejecutar en plataformas Linux y Microsoft o bien en entornos Web.
  • Open AccessTrabajo académico
    "Smith-Waterman" paralelo en arquitectura de many-core para búsquedas en bases de datos de secuencias
    (Universidad Internacional de Andalucía, 2011) Lago Cabrera, Juan; Lago Cabrera, Juan
    Trabajo fin de Máster dirigido por Sergio Gálvez Rojas, y co-tutores: Oswaldo Trelles Salazar y Gabriel Dorado Pérez. En este trabajo se ha desarrollado un algoritmo denominado MC64-S3W (MultiCore 64 – Sequence Search Smith-Waterman) para realizar el alineamiento local de una secuencia problema contra una base de datos de secuencias de ácidos nucleicos de gran tamaño (entre 80 y 260 kilobases) en arquitectura hardware de muchos núcleos. La posibilidad de realizar alineamientos de gran tamaño (obteniendo el alineamiento local óptimo) bajo arquitectura de muchos núcleos es, por tanto, uno de los elementos diferenciadores de este trabajo. En el trabajo se justifica el ahorro de tiempo que se consigue al paralelizar varios alineamientos simultáneos y se realiza un estudio comparativo con otras implementaciones paralelas ampliamente referenciadas como es el caso del algoritmo CUDASW++. También se incluye una comparativa con BLAST. El trabajo se completa con una revisión del estado del arte en la comparación de secuencias de ácidos nucleicos y péptidos, con objeto de obtener el grado de similitud entre ellas, tanto desde un punto de vista algorítmico como desde el punto de vista de estudios biológicos en los que se referencian alineamientos de secuencias de gran tamaño.
  • Open AccessTrabajo académico
    Análisis bioinformático de genes implicados en replicación en genomas de bacterias endosimbiontes
    (2010) González Soltero, María del Rocío; González Soltero, María del Rocío
    Tesis dirigida por Enrique Viguera Mínguez. La cantidad de DNA se correlaciona positivamente con la complejidad genética del genoma del organismo. Algunas bacterias endosimbiontes de insectos y moluscos han sufrido un proceso de reducción genómica en el proceso de adaptación a la vida endosimbionte, si se compara el tamaño de su genoma con el de sus parientes de vida libre. En los últimos años, han surgido diferentes teorías que intentan explicar los procesos que han conducido a la reducción genómica en estas bacterias. Este tipo de organismos constituyen, por lo tanto, un modelo muy adecuado para el estudio de rutas metabólicas mínimas. EI objetivo principal de este trabajo ha sido el análisis del componente mínimo 3R (Replicación, Recombinación y Reparación) en bacterias endosimbiontes. A partir de estos datos se pueden proponer modelos que expliquen cómo estos microorganismos han compensado la pérdida de determinados genes y han diseñado rutas que Ies permiten lIevar a cabo estas funciones con un set mínimo de genes. Genome size is positively correlated by the genetic complexity of the genome’s organism. Some bacteria, endosymbionts from insects and mollusks, have suffered a process of genomic reduction in the process of adjustment to the endosymbiont lifestyle, if we compare the size of their genomes with that of their relatives of free life. In the last years, there have arisen different theories that try to explain the processes that have led to the genomic reduction in these bacteria. This type of organisms constitute, therefore, a model very adapted for the study of metabolic minimal routes. The principal aim of this work has been the analysis of the minimal component 3R (Replication, Recombination and Repair) in bacterial endosymbionts. From this information models can be proposed to explain how these microorganisms have compensated the loss of certain genes and have designed routes that allow them to carry out these functions with a minimal set of genes.
  • Open AccessTrabajo académico
    A First-Stage Approximation to Identify New Imprinted Genes through Sequence Analysis of Its Coding Regions
    (2010) Daura Oller, Elias; Daura Oller, Elias
    Investigación dirigida por Antoni Romeu y Oswaldo Trelles. In the present study, a positive training set of 30 known human imprinted gene coding regions are compared with a set of 72 randomly sampled human nonimprinted gene coding regions (negative training set) to identify genomic features common to human imprinted genes. The most important feature of the present work is its ability to use multivariate analysis to look at variation, at coding region DNA level, among imprinted and non-imprinted genes. There is a force affecting genomic parameters that appears through the use of the appropriate multivariate methods (principle components analysis (PCA) and quadratic discriminant analysis (QDA)) to analyse quantitative genomic data. We show that variables, such as CG content, [bp]% CpG islands, [bp]% Large Tandem Repeats, and [bp]% Simple Repeats, are able to distinguish coding regions of human imprinted genes.
  • Open AccessTrabajo académico
    BlaSTorP : herramienta NCBI-BLAST a nivel local
    (2010) Chicano Gálvez, Eduardo; Chicano Gálvez, Eduardo
    Tesis dirigida por Antonio Jesús Pérez Pulido y Juan Falgueras Cano. Se ha desarrollado una nueva herramienta bioinformática con el fin de resolver los problemas que el investigador novel en proteómica y bioinformática tiene a la hora de llevar a cabo la identificación masiva de secuencias peptídicas provenientes de secuenciación “de novo” mediante espectrometría de masas en las bases de datos más comúnmente utilizadas por los investigadores en Internet. Estas bases de datos son muy complejas y contienen demasiada información que no siempre se usa en su totalidad. Por ejemplo, la página web de uniprot ofrece información muy extensa sobre la proteína que estemos buscando en varios subapartados: nombres y orígenes, atributos de la proteína, comentarios de la anotación, ontología, anotaciones sobre la secuencia, secuencia en formato fasta y propiedades como longitud y masa teóricas, referencias cruzadas, referencias bibliográficas, etc. La creación de este programa constituye una herramienta eficaz para la realización de este trabajo y ayuda a ahorrar tiempo en la identificación y búsqueda de las funciones más comunes de las proteínas que estemos tratando de identificar, además de resultar una herramienta sencilla y disponible por la web en el caso de montar un servidor público o bien de forma local. // A new bioinformatics tool has been developed to help the new researchers in proteomics and bioinformatics to carry out the identification of sequences obtained by "de novo" sequencing using the most common mass spectrometry databases. Databases are very complex and contain too much information that is not always enterely used. Thus, UniProt offers extensive information about proteins divided into several subsections: names and origins, attributes of the protein, commentaries, ontology, annotations on the sequence, sequence in fasta format and theoretical properties like length and mass, cross references, bibliographic references, etc. This new program is an effective tool for carrying out this work, saving time in protein identifications and recruiting the most common functions of the proteins we are trying to identify, as well as being a simple tool.