Analytics system for reducing dimensionality ininterval-valued databases
Abstract
En los últimos años han surgido nuevos conceptos en el área tecnológica como pueden ser el internet de las cosas, el "Cloud Computing", el "Big Data" o el "Blockchain". Todos estos nuevos conceptos están adquiriendo gran importancia en este mundo gobernado por ordenadores, lo que hace necesario que el manejo de datos sea lo más eficiente posible.
Entre los problemas más relevantes del manejo de datos destacan: el orden, ya que por muchos datos que tengas almacenados no sirven de nada si no consigues encontrar los que necesitas; la gestión de los datos, estas bases de datos de proporciones gigantescas no pueden ser gestionadas por una única persona por muy preparada que esté, lo que provoca una gran demanda de personal especializado que el mercado de hoy no está preparado para satisfacer; y por último la reducción de datos, las bases de datos tienen mucha información irrelevante se tienen que buscar procesos que consigan reducir la información al máximo pero sin perder la calidad de dicha información.
Este trabajo se centrará en el tercer problema, aplicado a bases de datos evaluadas por intervalos. Se podría decir que el estudio de bases de datos evaluadas por intervalo está poco exprimido comparado con el de bases de datos puntuales. Esto debe cambiar ya que una gran parte de los datos que manejamos son de intervalo, como pueden ser las incertidumbres y el cálculo de los errores en el campo de la ingeniería, las variaciones diarias de la temperatura en el campo de la climatización o los cambios del valor de una acción en el sector financiero. Primero se realizará un análisis completo sobre los intervalos, (distancias, aritmética, medidas de estadística descriptiva…). Con el fin de dar una solución al problema de la reducción de datos se propondrá un sistema analítico y se aplicará a una base de datos real con su posterior análisis de resultados. In recent years, new concepts have emerged in the technological area, such as the Internet of Things, Cloud Computing, Big Data or Blockchain. All these new concepts are becoming very important in this world governed by computers, which makes it necessary for data management to be as efficient as possible.
Among the most important problems of data management are: structuring, because the data you have stored is useless if you cannot find what you need; data management, these databases of gigantic proportions cannot be managed by a single person, no matter how prepared he or she is, which causes a great demand for specialized personnel that the market is not prepared to satisfy; and finally, reduction of data, databases have a great amount of irrelevant information, this requires new processes that manage the reduction of the information to the maximum without losing the quality of this information.
This project will focus on the third problem, applied to interval-valued databases. It could be said that the study of interval-valued databases hasn't been profoundly studied compared to that of crisp databases. This must change since a large part of the data we handle is interval-valued, such as uncertainties and the calculation of errors in the field of engineering or the constant changes in the value of a certain company in the financial sector. First, a complete analysis of intervals will be carried out (distances, arithmetic, descriptive statistics measures ...). After this a study of crisp data reducing methods, and how can we apply them to interval data. Then a MATLAB analytical system will be proposed in order to provide a solution to the problem of reduction of dimension of interval-valued databases. Finally it will be applied to a real database with its subsequent analysis of results.
Trabajo Fin de Grado
Analytics system for reducing dimensionality ininterval-valued databasesTitulación / Programa
Analytics is at the core of the new paradigm in Business lntelligence and new trends such as Big Data, loT, Cloud Computing or Smart Cities. As part of this paradigm, the reduction of information arises as a key problem. This work will analyze the framework of interval-valued databases. In arder to give a solution to the above problem, different alternatives are considered. Consequently, one computing system is developed.Materias/ categorías / ODS
IEM-M (KL0-mecanica)Palabras Clave
análisis; intervalo; datos; ACP; MATLABanalysis; interval; data; PCA; MATLAB