Verschil tussen Data mining en Data Warehousing
Data mining versus Data Warehousing
Data Mining and Data Warehousing zijn beide zeer krachtige en populaire technieken voor het analyseren van data. Gebruikers die geneigd zijn naar statistieken, gebruiken Data Mining. Ze gebruiken statistische modellen om verborgen patronen in data te zoeken. Gegevensmijnen zijn geïnteresseerd in het vinden van nuttige relaties tussen verschillende data-elementen, die uiteindelijk voor bedrijven winstgevend zijn. Maar aan de andere kant kunnen gegevensdeskundigen die dimensies van het bedrijf analyseren, direct gebruik maken van Data Warehouses.
Data mining is ook bekend als Knowledge Discovery in data (KDD). Zoals hierboven vermeld, is het een gebied van informatica, die zich bezighoudt met de winning van eerder onbekende en interessante informatie uit rauwe data. Door de exponentiële groei van de gegevens, vooral op gebieden zoals zaken, is data mining een zeer belangrijk instrument geworden om deze grote rijkdom van gegevens in te zetten in zakelijke intelligentie, omdat handmatige winning van patronen in de afgelopen decennia blijkbaar onmogelijk is geworden. Bijvoorbeeld, is het momenteel gebruikt voor diverse applicaties zoals sociale netwerkanalyse, fraudeherkenning en marketing. Data mining heeft meestal betrekking op de volgende vier taken: clustering, classificatie, regressie en associatie. Clustering identificeert soortgelijke groepen uit ongestructureerde data. Classificatie is het leren van regels die kunnen worden toegepast op nieuwe gegevens en zullen typisch volgende stappen bevatten: preprocessing van data, modellering ontwerpen, leren / functie selectie en evaluatie / validatie. Regressie vindt functies met minimale fout op modelgegevens. En associatie zoekt verhoudingen tussen variabelen. Data mining wordt meestal gebruikt om vragen te beantwoorden, zoals wat de belangrijkste producten zijn die het volgende jaar in Wal-Mart kunnen helpen met het verkrijgen van een hoge winst?
Zoals hierboven vermeld, wordt Data Warehousing ook gebruikt voor het analyseren van data, maar door verschillende gebruikers en een iets anders doel in gedachten. Bijvoorbeeld, bij de detailhandel, zijn de gebruikers van Data Warehousing meer betrokken bij welke soorten aankopen populair zijn bij klanten, zodat de resultaten van de analyse de klant kunnen helpen door de klantenervaring te verbeteren. Maar Data miners eerste veronderstelling een hypothese, zoals welke klanten een bepaald type product kopen en de gegevens analyseren om de hypothese te testen. Data warehousing kan worden uitgevoerd door een grote retailer die oorspronkelijk zijn winkels met dezelfde maten van producten voorraagt om later te ontdekken dat winkels in New York veel kleinere voorraad verkopen dan sneller dan in Chicago. Zo, door te kijken naar dit resultaat kan de winkelier de winkel in New York opslaan met kleinere maten in vergelijking met Chicago winkels.
Dus, zoals u duidelijk kunt zien, lijken deze twee soorten analyses van hetzelfde aard te zijn voor het blote oog. Beiden doen bezorgdheid over het verhogen van de winst op basis van de historische gegevens. Maar natuurlijk zijn er belangrijke verschillen. In eenvoudige termen zijn Data Mining en Data Warehousing gewijd aan het verstrekken van verschillende soorten analyses, maar zeker voor verschillende typen gebruikers. Met andere woorden, Data Mining zoekt naar correlaties, patters om een statistische hypothese te ondersteunen. Maar Data Warehousing beantwoordt een relatief bredere vraag en schuift en dobbelt data van daaruit om verbeteringswijzen in de toekomst te herkennen.