X hits on this document

84 views

0 shares

0 downloads

0 comments

20 / 35

16

Ing. Danis Lo´pez Naranjo, Dr. C. Jose´ Herna´ndez Palancar

4.

Unidad de procesamiento gra´ co de propo´sito general o GPGPU

Teo´ricamente, las GPUs son capaces de realizar cualquier ca´lculo que puede transformar el modelo de paralelismo y que permitan la arquitectura especı´fica de la GPU. Este modelo ha sido explotado por mu´ltiples a´reas de investigacio´n. En [35] presentan un nuevo enfoque para las simulaciones dina´mica de alto rendimiento en unidades de procesamiento gra´fico mediante el uso de CUDA en el dise˜no molecular y aplicar un nuevo algoritmo paralelo. Sus resultados indican una mejora de rendimiento significativo en una tarjeta NVIDIA GeForce GTX 8800 en el procesamiento secuencial en la CPU.

Otro documento interesante sobre los ca´lculos del campo de las ciencias de la vida ha sido publicado por Manavski y Valle en [30]. Los autores proponen una solucio´n muy ra´pida del algoritmo Smith-Waterman, de un procedimiento que resuelve la bu´squeda de similitudes en proteı´nas y bases de datos de ADN. Este algoritmo se ejecuta en la GPU y aplica en el entorno de programacio´n CUDA, alcanzando aceleraciones importantes en una estacio´n de trabajo con dos GPUs del modelo GeForce GTX 8800.

Otra a´rea de aplicacio´n generalizada que utiliza la potencia del alto procesamiento de la GPU es la simulacio´n meca´nica. Un ejemplo es el trabajo de Tascora en [7], que presenta un me´todo novedoso para la solucio´n de grandes problemas de la complementariedad de cono por medio de un algoritmo de punto fijo de la iteracio´n, en el contexto de la simulacio´n de la dina´mica de rozamiento de los grandes sistemas de cuerpos rı´gidos. Para demostrar las posibilidades casi ilimitadas de realizar ca´lculos en la GPU, presentamos un ejemplo ma´s, la informa´tica criptogra´ficas como se puede apreciar en [21]. En este documento, los autores presentan un rendimiento re´cord para la minerı´a de datos con el uso de 67 unidades de procesamiento gra´fico en la ejecucio´n del me´todo de curvas elı´pticas (ECM) de la factorizacio´n de nu´meros enteros. La aceleracio´n se beneficia de dos GPU modelo NVIDIA GTX 295 actualmente la unidad de procesamiento ma´s ra´pida de la historia, utilizando una aplicacio´n de ECM nuevo basa´ndose en nuevas fo´rmulas de adicio´n en paralelo y las funciones que se encuentran disponibles por CUDA.

Algunos documentos proponen te´cnicas para acelerar las operaciones de base de datos relacional en la GPU. En [9] explican algunos algoritmos para la unio´n de tablas en bases de datos relacionales, usando una GPU NVIDIA G80 con el modelo de programacio´n CUDA. Dos documentos recientes [13] y [27] abordan el tema de unirse a la similitud en el espacio que determina la caracterı´stica de todos los pares de objetos de dos conjuntos diferentes, R y S que cumplen con una unio´n de predicado o (predicate-join). Lo ma´s comu´n es que la unio´n de predicado determina todos los pares de objetos que tienen una distancia de menos de un umbral predefinido. Los autores de [13] proponen un algoritmo basado en el concepto de espacio de llenado curvas, por ejemplo, el orden z, para la poda del espacio de bu´squeda, trabajando en una GeForce 8800 de NVIDIA utiliza el kit de herramientas CUDA. El orden z de un conjunto de objetos puede ser determinado de manera muy eficiente en la GPU de alta paralelizada clasificacio´n. Su algoritmo opera sobre una serie de Z-listas de granularidad de poda eficiente. Sin embargo, desde todas las dimensiones son tratados por igual, el rendimiento se degrada en dimensiones mayores. Adema´s, debido a la compartimentacio´n del espacio uniforme en todos los a´mbitos del espacio de datos, el espacio de las curvas de llenado no son adecuadas para los datos agrupados.

Document info
Document views84
Page views84
Page last viewedThu Dec 08 22:14:09 UTC 2016
Pages35
Paragraphs855
Words14967

Comments