Lezione 18 - Dati del sondaggio in Laboratorio IA
45 minuti
Panoramica
Questa è la terza di una serie di cinque lezioni giornaliere che preparano gli studenti al progetto finale. In questa lezione, gli studenti imparano a visualizzare i dati del sondaggio in Google Sheets e a salvarli sul proprio computer come file csv. Quindi, caricano i dati salvati su Laboratorio IA ed esaminano i risultati del sondaggio di uno degli studenti per addestrare un modello utilizzando i loro dati. Quindi, gli studenti utilizzano Google Sheets per esaminare i dati di un altro studente in cui i dati contengono errori e quindi provare a correggerli. I passaggi che gli studenti intraprenderanno in questa lezione sono identici ai passaggi che gli studenti intraprenderanno nel loro progetto finale e le strategie di risoluzione dei problemi che svilupperanno li aiuteranno a superare le sfide del loro progetto finale.
Domanda del giorno: come posso importare dati in Laboratorio IA per addestrare un modello di apprendimento automatico?
Opportunità di valutazione
-
Scaricare un file csv da Fogli Google
Il completamento dell'esercizio 3 soddisfa questo obiettivo.
-
Caricare un file csv su Laboratorio IA
Il completamento dell'esercizio 3 soddisfa questo obiettivo.
-
Analizzare e pulire i dati in Fogli Google
Il completamento dell'esercizio 5 soddisfa questo obiettivo.
Mappatura delle competenze
AP - Algorithms & Programming
- 2-AP-19 - Document programs in order to make them easier to follow, test, and debug.
DA - Data & Analysis
- 2-DA-08 - Collect data using computational tools and transform the data to make it more useful and reliable.
- 3A-DA-12 - Create computational models that represent the relationships among different elements of data collected from a phenomenon or process.
IC - Impacts of Computing
- 2-IC-22 - Collaborate with many contributors through strategies such as crowdsourcing or surveys when creating a computational artifact.
BI-3 - Computers can learn from data
3-A-iii - Nature of Learning - training a model
- 3-A-iii.6-8 - Train and evaluate a classification or prediction model using machine learning on a tabular dataset
3-A-iv - Nature of Learning - constructinv vs using a reasoner
- 3-A-iv.9-12 - Illustrate what happens during each of the steps required when using machine learning to construct a classifier or predictor.
3-C-i - Datasets - feature sets
- 3-C-i.6-8 - Create a dataset for training a decision tree classifier or predictor and explore the impact that different feature encodings have on the decision tree.
- 3-C-i.9-12 - Compare two real world datasets in terms of the features they comprise and how those features are encoded.
Pianificazione
Obiettivi
Gli alunni saranno in grado di:
- analizzare e pulire i dati in Fogli Google
- scaricare un file csv da Fogli Google
- caricare un file csv su Laboratorio IA
Preparazione
- Consulta il forum "Aula insegnanti" per trovare insegnanti verificati per trovare strategie o risorse aggiuntive condivise da altri insegnanti
Collegamenti
Attenzione! Fai una copia di tutti i documenti che intendi condividere con gli alunni.
Per gli insegnanti
- Dati del sondaggio in Laboratorio IA - Diapositive (Scarica)
Guida didattica
Preparazione (5 minuti)
Sondaggio
Code Studio: chiedi agli studenti di accedere a Code Studio. Il primo esercizio rimanda a un sondaggio a cui gli studenti possono partecipare.
Discussione: Quali sono le due domande di questo sondaggio che ritieni possano essere correlate? Potresti usare una frase come "Penso che le persone che rispondono... probabilmente vorrebbero unirsi al club…”
Obiettivo della discussione: è molto importante coinvolgere gli studenti in Code Studio e partecipare al sondaggio, poiché utilizzeranno i dati di questo sondaggio durante la lezione. La discussione aiuta gli studenti alle prime armi a cercare schemi quando accedono a Laboratorio IA. Man mano che gli studenti condividono le risposte, non ci sono risposte giuste o sbagliate: prendi nota delle idee che gli studenti hanno e sii pronto a farvi riferimento in seguito quando usi Laboratorio IA per analizzare i dati.
Osservazioni
Ieri abbiamo aiutato il nostro gruppo a creare un sondaggio: oggi esamineremo i dati e utilizzeremo Laboratorio IA per iniziare ad addestrare un modello. Kim ha già raccolto dati, quindi inizieremo imparando come importare i loro dati in Laboratorio IA e vedremo quali schemi riusciamo a trovare.
Domanda del giorno: come posso importare dati in Laboratorio IA per addestrare un modello di apprendimento automatico?
Attività (35 minuti)
Code Studio: chiedi agli studenti di passare all'esercizio successivo in code studio. Questo esercizio prevede che gli studenti facciano clic su un link per creare una copia di un foglio Google che rappresenta i dati del sondaggio di questo modulo.
Qual è la mia riga?: anche se gli studenti hanno appena compilato questo modulo, i loro dati non saranno rappresentati qui. Invece, questa è un'istantanea dei dati di diversi studenti che viene utilizzata solo per questa lezione. Ciò significa che la dimensione dell'insieme di dati non corrisponderà al numero di studenti che hanno appena partecipato al sondaggio e se gli studenti cercano di decodificare i dati per trovare una voce specifica, non saranno in grado di farlo.
Video: mostra il filmato. Questo video mostra agli studenti come visualizzare i dati in Fogli Google, salvare i propri dati come CSV e caricarli in Laboratorio IA. View and Download Survey Data
Fai questo: rinomina i titoli di ogni colonna con qualcosa di più descrittivo. Cerca di inserire una o due parole nell'intestazione di ogni colonna. Quindi salva il file come csv sul tuo computer.
Sovraccarico di dati: guardare tutti questi dati contemporaneamente può essere travolgente! Fortunatamente, gli studenti devono fare solo due cose su questa schermata:
- Digita la prima riga della tabella per rinominare le intestazioni
- Salva il file come CSV
Gli studenti non devono esplorare i dati o provare a scoprire schemi: a questo serve Laboratorio IA!
Girando tra i banchi: effettua la verifica iniziale con gli studenti mentre completano questo processo. Incoraggia gli studenti a fare una verifica iniziale anche tra loro per acquisire maggiore familiarità con Google Sheets, in particolare il processo di salvataggio in formato csv.
Code Studio: chiedi agli studenti di passare all'esercizio successivo su Code Studio. In questo sercizio, gli studenti caricheranno i propri dati su Laboratorio IA e addestreranno un modello a partire dai dati.
Fai questo: segui le istruzioni in ogni fase di Laboratorio IA. Nel corso di questo esercizio, i tuoi obiettivi sono:
- Addestra un modello con almeno il 70% di accuratezza che utilizza il minor numero di funzioni
- Compila la scheda modello e salva il tuo modello
Girando tra i banchi: monitora gli studenti mentre lavorano tramite Laboratorio IA. Concentrati su come gli studenti selezionano le loro caratteristiche, assicurandoti che trovino il giusto equilibrio tra accuratezza e semplicità. Incoraggia gli studenti a provare diverse caratteristiche e a porre domande utili nel contesto del consiglio in un club.
Man mano che gli studenti si avvicinano al completamento delle schede modello, disponili in gruppi e condividi la diapositiva successiva.
Mostra agli studenti la diapositiva con la schermata della scheda modello.
Osservazioni
Da quando abbiamo caricato i nostri dati, abbiamo alcuni nuovi campi da compilare sulla nostra scheda modello! Dobbiamo descrivere da dove provengono questi dati e dobbiamo descrivere ciascuna delle colonne che stiamo usando come funzionalità ed etichetta. Questo è un ottimo posto per scrivere la domanda del sondaggio!
Fai questo: chiedi agli studenti di completare la scheda modello. Chiedi agli studenti di utilizzare le domande del sondaggio per la descrizione di ogni colonna e le informazioni della diapositiva per la descrizione dei dati.
Osservazioni
È fantastico: siamo stati in grado di aiutare Kim a creare un modello di apprendimento automatico per i suoi dati! Ma Kim non è l'unica persona che raccoglie dati! Parliamo anche con Isaac e vediamo come stanno
Mostra la diapositiva successiva, che mostra Isaac e alcuni dei suoi dati
Discussione: cosa notate dei dati di Isaac?
Obiettivo della discussione: gli studenti devono notare che i dati numerici hanno un ampio intervallo che non ha senso e devono notare che i dati categoriali includono valori aggiuntivi che non avrebbero dovuto far parte del sondaggio.
Discussione: perché pensi che i dati siano finiti così?
Obiettivo della discussione: questa discussione dovrebbe concentrarsi su due aree: come Isaac ha impostato il suo modello e come ha raccolto i suoi dati.
- Se Isaac non fosse stato attento con il modulo di ieri, avrebbe potuto accidentalmente consentire alle persone di digitare le proprie risposte o lasciare le risposte vuote, motivo per cui i dati categoriali presentano problemi. Questa può essere una buona occasione per consolidare la lezione di ieri e quanto sia importante impostare correttamente il modulo per assicurarsi che gli studenti raccolgano dati accurati.
- Se Isaac ha costretto persone a partecipare al suo sondaggio che non volevano farlo, potrebbero non averlo preso sul serio e aver dato risposte false come vediamo con i dati numerici. Gli studenti possono paragonarlo a ciò che ha fatto Kim, quando ha chiesto alle persone di partecipare piuttosto che costringerle a farlo.
Osservazioni
Ora che abbiamo capito perché i dati di Isaac potrebbero avere questo aspetto, vediamo se possiamo aiutarlo a "pulire" i suoi dati.
Code Studio: chiedi agli studenti di passare all'esercizio successivo su Code Studio. In questo esercizio, gli studenti scaricheranno i dati di Isaac e riceveranno le istruzioni per la pulizia dei dati.
Video: mostra il video Cleaning Survey Data. Questo video guida gli studenti su come ripulire i dati in un foglio di calcolo in modo che possano essere utilizzati in Laboratorio IA.
Non ripetere gli errori: idealmente, gli studenti non avranno bisogno di questa abilità nelle lezioni successive, quando creeranno i propri sondaggi. Si spera che siano in grado di utilizzare correttamente il modello, il che eviterà i problemi che Isaac sta affrontando in questo momento. Con questo in mente, va bene se gli studenti non padroneggiano la capacità di modificare i fogli di calcolo, ma sottolinea invece quanto sia importante assicurarsi che i dati vengano raccolti in un modo controllato che eviti questo tipo di situazione.
Fai questo: correggi gli errori nei dati di Isaac in modo che funzionino con Laboratorio IA. Una volta corretti gli errori, scarica il file in formato CSV e caricalo su Laboratorio IA per verificare che i dati funzionino nuovamente correttamente.
Salva come CSV: questo esercizio è un'altra opportunità per gli studenti di esercitarsi a salvare i propri dati come file csv e caricarli su Laboratorio IA. Se gli studenti non risolvono tutti gli errori al primo tentativo, potrebbero dover scaricare nuovamente e caricare nuovamente il file CSV più volte. Questo può sembrare noioso ora, ma acquisire familiarità con questo processo aiuterà gli studenti a risparmiare tempo e frustrazione durante il progetto finale.
Ci sono 6 errori intenzionali nei dati di Isaac. Mentre gli studenti lavorano, sentiti libero di offrirlo come suggerimento agli studenti.
Salvataggio di un modello: gli studenti non sono in grado di creare un modello dai dati di Isaac. Se gli studenti chiedono il motivo, è perché la dimensione del campione è troppo piccola e Isaac dovrebbe raccogliere più dati prima di sentirsi a proprio agio ad addestrarne un modello.
Osservazioni
Preparare i dati del nostro sondaggio per Laboratorio IA è un passo importante. Kim aveva i suoi dati pronti perché il suo modulo era impostato correttamente, ma Isaac aveva bisogno di aiuto per pulire i suoi dati. Questa è una lezione importante da tenere a mente la prossima settimana, quando preparerai i dati del tuo sondaggio.
Conclusione (5 minuti)
**Discussione: ** qual è una situazione in cui ritieni che sia giusto apportare una modifica ai dati della tua indagine per contribuire a pulirla? Qual è una situazione in cui pensi in cui invece non sia opportuno?
Obiettivo della discussione: in base all'attività odierna, gli studenti potrebbero pensare che sia giusto modificare i dati quando è chiaramente un errore di battitura simile a un'altra risposta. Gli studenti potrebbero pensare che non sia giusto cambiare completamente una risposta a qualcos'altro. In generale, ci sono molte aree grigie in queste situazioni, motivo per cui è importante coinvolgere un operatore umano nell'apprendimento automatico per usare il proprio giudizio in queste decisioni.
Questo compito è disponibile previa Licenza Creative Commons (CC BY-NC-SA 4.0).
Se sei interessato ad utilizzare i materiali di Code.org per scopi commerciali, contattaci.