Revista Digital Universitaria
ISSN: 1607 - 6079 Publicación mensual
 
1 de agosto de 2011 Vol.12, No.8
  Inicio Ejemplares Directorio Quiénes somos Busca artículos Vínculos Contacto Mapa de sitio
 
Documento sin título
 
Minería de datos visual
Laura Patricia Ramírez Rivera
CITA
PDF
   
Proyecto
Conclusiones del sistema distribuido
Etapa de minería de datos
Conclusión y Bibliografía
Aumentar Letra Disminuir Letra Disminuir Letra   facebook
twitter
google
 

Introducción


La exploración de información en espacios heterogéneos requiere métodos de minería tan eficientes como sus interfaces visuales.1

Hace tiempo que la mayoría de los sistemas se concentraban o en los algoritmos de minería o en las técnicas de visualización. La desventaja que se tiene al separar el análisis de la visualización es que en general no tiene tanto apoyo una en otra, es decir, son aplicaciones diferentes que tratan de unirse, muy diferente a una aplicación cuya idea implique el uso de ambas desde un inicio.2

Para que la minería de datos sea efectiva, es importante incluir al humano en el proceso de exploración de los datos. En general es deseable combinar el conocimiento humano con la enorme capacidad de almacenamiento que se tiene en las máquinas así como su poder de procesamiento.

Las exploraciones visuales de datos tienen como objetivo la integración del humano en el proceso de exploración, gestión que tienen los sistemas computacionales.3

La finalidad es aprovechar las capacidades humanas, como la deducción y la intuición, permitiendo así obtener una minería más completa, tomando en cuenta las capacidades inherentes a nuestra especie.4

Para apoyar este tipo de exploraciones se propone el uso de una pared de video que permita una amplia visualización de los datos, al mismo tiempo que se realiza el proceso de minería. Es por eso que el objetivo final es crear un sistema que permita visualizar bases de datos científicas y mostrar los gráficos obtenidos de sus atributos sobre una pared de video.

Cabe recalcar que la pared de video es un medio tecnológico eficaz, que aún no ha sido desarrollado, ni estandarizado, por lo que involucra la investigación sobre su manejo, es decir, requiere conocimiento computacional que todavía no ha sido desarrollado, y del cual sólo se han encontrado ejemplos de uso e ideas y sugerencias para su implantación.

Existen diversas investigaciones para crear visualizadores de bases de datos, que varían en la forma en la que despliegan o manipulan los datos.

Estas investigaciones iniciaron desde hace tiempo, debido a que dentro de diversas áreas del conocimiento se han generado grandes cantidades de datos. En ocasiones son tan numerosos que su manejo es difícil.

Lo que necesitamos es localizar patrones que nos ayuden a ver cómo es el comportamiento de los datos y de ahí tratar de comprender la información contenida en ellos.

Existe también el problema del transporte en un tiempo relativamente corto. Se debe mencionar el tiempo de procesamiento que incrementa en proporción a la cantidad de datos que se presente.

Si unimos todos estos problemas tenemos uno que básicamente consiste en obtener conocimiento de grandes bases de datos científicas, disminuyendo en la medida de lo posible el costo computacional que esto representa.

En cuanto a la solución propuesta para estos problemas, planteamos lo siguiente. Podemos aprovechar las ventajas que la visualización nos proporciona para la mejor y más fácil apreciación de los datos. Desplegando los gráficos en un área mayor, como es una pared de video, podemos observar más de un gráfico a la vez, permitiendo una mejor apreciación del comportamiento de los datos.

Si permitimos el manejo de los objetos gráficos, a disposición del usuario, por toda el área de despliegue, el podrá hacer conjeturas mediante comparaciones evidentes. Se propone la correlación de Pearson5como el método que mostrará evidencia de comportamiento similar en los datos. Se propone el manejo de objetos distribuidos para evitar la interpretación centralizada.

1 Pak Chung Wong. Visual data mining. IEEE Computer Graphics and Applications, pages 2–3, 2002.

2 Cesar Ferri Ramírez José Hernández Orallo, Maria José Ramírez Quintana. Introducción a la minería de datos, volume 19. Marcel Dekker. INc., 2004.

3 Mason J. Katz William J. Link Philip M. Papadopoulos, Caroline A. Papadopoulos and Greg Bruno. Configuring large highperformance clusters at lightspeed: A case study. IEEE Computer Graphics and Applications, 2005.

4 Oreste Verta Domenico Talia, Paolo Trunfio. Weka4ws: a wrsf enabled weka toolkit for distribuited data mining on grids. Data Mining Grid digital library, 2005.
http://grid.deis.unical.it/weka4ws/

5 George W. Snedecor and William. Métodos estadísticos. CECSA, 1977.

 
  subir        
 
  Editorial
 

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons