Data Analytics Using Open-Source Tools
This book is about Data Analytics. In that respect, it is like others. What distinguishes it from the rest is the variety of open-source tool applications. This book incorporates the use of R Studio, Python, SAS Studio (University Edition), and KNIME. This book is also about manipulating Big Data. Apache Hadoop on Hortonworks Sandbox is introduced and we manage, move, handle, and transform data using Apache Hive, Apache Spark, MapReduce and TEZ, with terminal shell commands and Ambari. We show you how to set up a virtual machine in Microsoft Azure. We then use the data in later chapters for modeling. We cover Descriptive Modeling and Predictive. The content includes Support Vector Machines, Decision Tree learning, Random Forests, Naive and Empirical Bayes, Gradient Boosting, Cluster Modeling, Generalized Linear Models, Logistic Regression, and Artificial Neural Networks. Every chapter includes completely worked examples using one or more open-source tools.
-
Autore:
-
Editore:
-
Anno:2016
-
Rilegatura:Hardback
-
Pagine:706 p.
Le schede prodotto sono aggiornate in conformità al Regolamento UE 988/2023. Laddove ci fossero taluni dati non disponibili per ragioni indipendenti da Feltrinelli, vi informiamo che stiamo compiendo ogni ragionevole sforzo per inserirli. Vi invitiamo a controllare periodicamente il sito www.lafeltrinelli.it per eventuali novità e aggiornamenti.
Per le vendite di prodotti da terze parti, ciascun venditore si assume la piena e diretta responsabilità per la commercializzazione del prodotto e per la sua conformità al Regolamento UE 988/2023, nonché alle normative nazionali ed europee vigenti.
Per informazioni sulla sicurezza dei prodotti, contattare productsafety@feltrinelli.it