Descripción
Actualmente, con la disponibilidad de avanzados recursos computacionales y el bajo costo operacional, es extremadamente fácil almacenar datos. Entre los factores que colaboran con el crecimiento de bases de datos están la colecta automática de datos científicos, vía sensores remotos o satélites; y el procesamiento automático de transacciones a través de códigos de barras.
Respuestas referentes a cuestiones formuladas sobre estas grandes bases de datos se pueden dar mediante Data Mining. Este es un proceso de extracción de información, sin conocimiento previo, de un banco de datos, que se usa para una toma de decisiones (Diniz y Louzada_Neto, 2000). 
Data Mining es una poderosa tecnología nueva con gran potencial para ayudar a las compañías a concentrarse en la información más importante de sus Bases de Datos. Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo tomar decisiones proactivas en los negocios y conducidas por un conocimiento acabado de la información.
Una de las herramientas de Data Mining más novedosas y de escaso desarrollo en el país es el Análisis de Datos Simbólicos, que surge con el objeto de resumir datos en término de sus conceptos con el sentido de extraer nuevos conocimientos. Estos conceptos se pueden describir por tipos de datos más complejos, llamados Datos Simbólicos, que contienen variación interna y son estructurados. En este contexto, es que es de gran necesidad extender los métodos de análisis de datos estándar (exploratorio, representaciones gráficas, clustering, análisis factorial, discriminación, etc.) a estos datos simbólicos.
Este proyecto pretende responder a uno de los temas estratégicos declarados por CONICET en el Sector Desarrollo y Tecnología Social que es Grandes Datos (Big Data). Esta línea de investigación se refiere al estudio de las capacidades científicas y tecnológicas para la generación y aprovechamiento de grandes datos, entre los que se enmarca Objeto Simbólico. Se pretende aplicar el Análisis Simbólico de Datos a problemas que provienen de diferentes áreas del conocimiento, en particular Economía, Ciencias Sociales y Ciencias Humanas.
Referencias
Diniz, C. A. R. y Louzada-Neto, F. (2000). Data mining : uma introdução. São Paulo: Associação Brasileira de Estatística.
Investigadores
Director: Dra.Adriana Mallea
Co-director: Mg. Ana María Ruiz
Integrantes
Dra. Myriam Herrera
Lic. Jorgelina Carrizo
Prof. Leonel Ganga
Mg. Flavia Millán
Técnico
Prog. Facundo Vara
Adscripto egresado
Lic. Andrea Salas
Adscripto Alumno
Cecilia Martínez
Proyecto en ejecución
Métodos del Análisis de Datos Simbólicos para Big Data. (2016-2017)
Unidad ejecutora
Departamento de Matemática
Facultad de Filosofía, Humanidades y Artes
Universidad Nacional de San Juan