A | B | C | D | E | F | G | H | CH | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
Hĺbková analýza dát[1] (iné názvy: hĺbková analýza údajov[2], vyťažovanie údajov/dát[3][4], dolovanie údajov/dát[5][6], dolovanie v údajoch/dátach[7], data mining; angl. data mining) je proces analýzy dát z rôznych perspektív a ich sumarizácia na užitočné informácie. Spravidla ide o extrahovanie užitočných informácií z veľkých databáz, hľadanie korelácií alebo vzorov spomedzi tisícok polí v relačných databázach.
Využíva metódy štatistiky, matematiky (matematické modelovanie = klasifikačné pravidlá alebo stromy, regresia, zhluková analýza), umelej inteligencie (neuronové siete, rozpoznávanie, samoučiace sa algoritmy), nástroje OLAP (on-line analytické spracovanie)[8] a strojového učenia.
Typy modelov
- Predikčné modely – cieľom je na základe historických dát predpovedať budúcnosť
- Segmentačné modely – cieľom je roztriediť množstvo dát na zvládnuteľný počet homogénnych skupín
Aplikácia v praxi
- Propensity to buy - cross-sell (predaj ďalších produktov existujúcim zákazníkom) a up-sell (zvýšenie spotreby daného produktu, doplnky)
- Credit risk - modelovanie pravdepodobnosti nesplácania úveru
- Fraud - identifikácia podvodov
- Churn - identifikácia zákazníkov náchylných na prechod ku konkurencii
- Segmentácia - zoskupovanie do homogénnych skupín
- Market basket analysis - analýza nákupného koša
- Diagnostické modely
- Modely analýzy časových radov
- Text mining
Delenie
Metodológie
Typické oblasti využitia
- marketing, podpora pri výbere klientov do marketingových kampaní (cross-sell, up-sell)
- poisťovníctvo, identifikácia podvodov, churn
- bankovníctvo, manažment rizika (credit risk, fraud)
- medicína, podpora pri stanovení pravdepodobnosti danej diagnózy
- telekomunikácie, cross-sell, up-sell, churn, fraud
- maloobchod, analýza nákupného koša, cross-sell, up-sell
- štátna správa, fraud
Algoritmy
- Lineárna regresia
- Logistická regresia
- Diskriminačná analýza
- Faktorová analýza
- Zhluková analýza
- Neurónové siete
- Support vector machines
- Rozhodovacie stromy
- Naivný Bayesov klasifikátor
- Bayesove siete
- Algoritmus k najbližších susedov (KNN)
- Kohonenove mapy
- Asociačné pravidlá
- Analýza sekvencií
- Analýza časových radov
Softvér
- DOCKitIN
- SAS
- SPSS Clementine, SPSS
- Statistica
- SQL Server
- Oracle Data miner
- IBM DB2 Intelligent Miner
- R (slobodný softvér)
- Weka (slobodný softvér)
- RapidMiner, pred 2007-05-27 pod menom YALE (slobodný softvér)
- MATLAB
Referencie
- ↑ EU v Bratislave - Projekt predmetu SK
- ↑ Terek, M., Horníková, A., Labudová, V.: Hĺbková analýza údajov (Data Mining). Bratislava: Iura Edition 2010
- ↑ http://eur-lex.europa.eu/legal-content/SK/ALL/?uri=CELEX:52008IP0561
- ↑ https://www.vugtk.cz/slovnik/3905_dolovani-dat
- ↑ http://www.vus.sk/iecd/new/Vyklad_srch.asp
- ↑ http://www2.fiit.stuba.sk/~kapustik/ZS/Clanky0708/hornak/index.html
- ↑ Krammer, P.: Dolovanie v údajoch so zameraním na interpretovateľnosť modelov. Dizertačná práca, FIIT STU,. Bratislava, 2015
- ↑ Kučerová, Helena. data mining. In KTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV) . Praha : Národní knihovna ČR, 2003- . Dostupné z WWW: .
Iné projekty
- Commons ponúka multimediálne súbory na tému Hĺbková analýza dát
Externé odkazy
Text je dostupný za podmienok Creative Commons Attribution/Share-Alike License 3.0 Unported; prípadne za ďalších podmienok. Podrobnejšie informácie nájdete na stránke Podmienky použitia.
Štatistická jednotka
Štatistická metóda
Štatistický súbor
Štatistický znak
Štatistika
Aritmetický priemer
Bázický bod
Beta funkcia
Bravaisov-Pearsonov korelačný koeficient
Brownov pohyb
Demografická štatistika
Demografická štatistika na Slovensku
Ekonometria
Eurobarometer
Gama funkcia
Geometrický priemer
Hĺbková analýza dát
Harmonický priemer
Histogram
Historiometria
Incidencia (medicína)
Index spotrebiteľských cien
Kontingenčná tabuľka
Korelácia (štatistika)
Korelačný koeficient
Kvadratický priemer
Mätúca premenná
Matematická štatistika
Medián
Modus (najčastejšia hodnota)
Moment (štatistika)
Obchodná činnosť
Odhad
Opakovateľnosť merania
Pôrodnosť
Paretov princíp
Presnosť merania
Prevalencia
Priemer (štatistika)
Pseudonáhodné číslo
Rozptyl (štatistika)
Rozvodovosť
Sčítanie obyvateľstva
Simpsonov paradox
Smerodajná odchýlka
Sobášnosť
Spoločná nomenklatúra územných jednotiek pre štatistické účely
Statistics Explained
Stelárna štatistika
Stredná hodnota (stred súboru)
Testovanie hypotéz
Základný súbor
Zhluková analýza
Text je dostupný za podmienok Creative
Commons Attribution/Share-Alike License 3.0 Unported; prípadne za ďalších
podmienok.
Podrobnejšie informácie nájdete na stránke Podmienky
použitia.
www.astronomia.sk | www.biologia.sk | www.botanika.sk | www.dejiny.sk | www.economy.sk | www.elektrotechnika.sk | www.estetika.sk | www.farmakologia.sk | www.filozofia.sk | Fyzika | www.futurologia.sk | www.genetika.sk | www.chemia.sk | www.lingvistika.sk | www.politologia.sk | www.psychologia.sk | www.sexuologia.sk | www.sociologia.sk | www.veda.sk I www.zoologia.sk