Log In
Or create an account ->
Imperial Library
Home
About
News
Upload
Forum
Help
Login/SignUp
Index
Data Science con Python Dalle stringhe al machine learning, le tecniche essenziali per lavorare sui dati
Ringraziamenti
Introduzione
Informazioni su questo libro
A chi si rivolge questo libro
Questioni di software
Note sugli apici
Il forum del libro
Esercitazioni
Che cosa si intende per scienza dei dati?
Unità 1 - La tipica sequenza di analisi dei dati
Unità 2 - Sequenza di acquisizione dei dati
Unità 3 - Struttura dei report
Esercitazioni
Hello, World! (∗)
Elementi di base di Python per la scienza dei dati
Unità 4 - Le funzioni che operano sulle stringhe
Unità 5 - La struttura dati appropriata
Unità 6 - Definizione e manipolazione delle liste
Unità 7 - I contatori
Unità 8 - Manipolazione dei file
Unità 9 - Andare sul Web
Unità 10 - Ricerche a pattern tramite espressioni regolari
Il linguaggio delle espressioni regolari
Ricerca, suddivisione e sostituzione con il modulo re
Unità 11 - Globbing di nomi di file e altre stringhe
Unità 12 - Pickling dei dati
Esercitazioni
Contatore della frequenza delle parole (∗)
Indicizzatore di file (∗∗)
Estrattore di numeri telefonici (∗∗∗)
Elaborare i dati testuali
Unità 13 - Elaborazione di file HTML
Unità 14 - Manipolazione dei file CSV
Unità 15 - Leggere i file JSON
Unità 16 - Elaborazione di testi in linguaggio naturale
Corpus NLTK
Normalizzazione
Altre procedure di elaborazione del testo
Esercitazioni
Rilevatore di collegamenti ipertestuali non funzionanti (∗)
Wikipedia Miner (∗∗)
Classificatore del genere musicale (∗∗∗)
Utilizzare i database
Unità 17 - Configurazione di un database MySQL
Unità 18 - Uso di un database MySQL: riga di comando
Inserimento
Cancellazione
Modifica
Selezione
Unione
Unità 19 - Uso di un database MySQL: pymysql
Unità 20 - Gestire gli archivi di documenti: MongoDB
Esercitazioni
Indicizzatore di file MySQL (∗)
Convertitore MySQL - MongoDB (∗∗)
Usare i dati numerici tabulari
Unità 21 - Creazione di array
Unità 22 - Trasposizione e alterazione
Unità 23 - Indicizzazione e slicing
Unità 24 - Operazioni vettoriali
Unità 25 - Le funzioni universali
Unità 26 - Le funzioni condizionali
Unità 27 - Aggregazione e ordinamento degli array
Unità 28 - Trattare gli array come se fossero insiemi
Unità 29 - Salvataggio e lettura di array
Unità 30 - Generare un’onda sinusoidale di sintesi
Esercitazioni
Sottrazioni fra array (∗)
HEI Locator (∗∗)
Calcolo delle analogie negli Stati USA (∗∗∗)
Manipolare serie di dati e frame
Unità 31 - Le strutture di dati in Pandas
Le serie
I frame
Unità 32 - Cambiare aspetto ai dati
Indicizzazione
Reindicizzazione
Indicizzazione gerarchica
Stack e pivot
Unità 33 - Gestione dei dati mancanti
Cancellazione dei dati mancanti
Ricostruzione dei dati mancanti
Sostituzione dei valori
Unità 34 - Combinare i dati
Unione
Concatenamento
Cancellazione dei duplicati
Unità 35 - Ordinamento e descrizione dei dati
Ordinamento e classificazione
Statistica descrittiva
Unicità, conteggio, appartenenza
Unità 36 - Trasformazione dei dati
Operazioni aritmetiche
Aggregazione dei dati
Discretizzazione
Mappaggio
Tabulazione incrociata
Unità 37 - I/O su file in Pandas
Lettura di file CSV e tabulari
Chunking
Lettura di altri tipi di file
Esercitazioni
Trappole per linci (∗)
PIL vs. Consumo di alcol (∗∗)
Meteo vs. Consumo di alcol (∗∗∗)
Utilizzo dei dati delle reti
Unità 38 - Parliamo di grafi
Elementi, tipi e densità dei grafi
Struttura di un grafo
Centralità
Unità 39 - Sequenza di analisi di una rete
Unità 40 - Parliamo di networkx
Costruzione e manipolazione di una rete
Esplorazione e analisi di una rete
Gestione degli attributi
Cricche e struttura comunitaria
Input e output
Esercitazioni
Centralità e correlazioni (∗)
Opere di Shakespeare (∗∗)
Reti e confini (∗∗)
Rappresentazione grafica
Unità 41 - Tracciamento di grafici con PyPlot
Unità 42 - Altri tipi di grafici
Unità 43 - Decorazione dei grafici
Unità 44 - Grafici e Pandas
Esercitazioni
American Pie (∗)
Popolazione della California (∗∗)
Probabilità e statistica
Unità 45 - Le distribuzioni delle probabilità
Distribuzione uniforme
Distribuzione normale
Distribuzione binomiale
Unità 46 - Raccolta delle misurazioni statistiche
Unità 47 - Statistica in Python
Generazione di numeri casuali
Calcolo delle misurazioni statistiche
Esercitazioni
S&P 500 nel Ventunesimo secolo (∗)
Nutrienti in Rete (∗∗∗)
Machine Learning
Unità 48 - Progettazione di un esperimento predittivo
Unità 49 - La regressione lineare
Regressione OLS (metodo dei minimi quadrati)
Regressione ridge (Regolarizzazione di Tichonov)
Regressione logistica (Logit)
Unità 50 - Raggruppamento dei dati con il clustering K-Means
Unità 51 - Sopravvivere nelle foreste decisionali casuali
Esercitazioni
MOSN Clusters (∗)
S&P 500 (∗∗)
Predittore di metrò (∗∗∗)
Ulteriori letture
Soluzioni dei progetti di tipo (∗)
Capitolo 1Hello, World!
Capitolo 2Contatore della frequenza delle parole
Capitolo 3Rilevatore di collegamenti ipertestuali non funzionanti
Capitolo 4Indicizzatore di file MySQL
Capitolo 5Sottrazioni fra array
Capitolo 6Trappole per linci
Capitolo 7Centralità e correlazioni
Capitolo 8American Pie
Capitolo 9S&P 500 nel Ventunesimo secolo
Capitolo 10Cluster MOSN
Bibliografia
← Prev
Back
Next →
← Prev
Back
Next →