< Unità 7 - IA e apprendimento automatico ('22-'23)

Lezione 19 - Modelli di risoluzione dei problemi

45 minuti

Panoramica

Questa è la quarta di una serie di cinque giorni di lezioni giornaliere che preparano gli studenti al progetto finale. In questa lezione, gli studenti esaminano i dati del sondaggio di altri membri del gruppo di studenti e analizzano i motivi per cui i loro modelli non funzionano correttamente. Nell'esaminare i dati, gli studenti sviluppano strategie per evitare questi problemi in futuro e strategie per far fronte a questi problemi se dovessero ripetersi. Queste sono le competenze che gli studenti utilizzeranno nel progetto finale per sviluppare i propri sondaggi e raccogliere dati.

Domanda del giorno: quali sono le strategie per garantire che i nostri dati generino un modello accurato?

Opportunità di valutazione

  1. Spiegare in che modo le scelte nella raccolta dei dati possono portare a problemi durante l'addestramento di un modello di apprendimento automatico

    Vedi la guida alle attività per questa lezione per misurare questo obiettivo

Mappatura delle competenze

Mappatura completa del corso
CSTA K-12 Computer Science Standards (2017)
    • 2-AP-15 - Seek and incorporate feedback from team members and users to refine a solution that meets user needs.
    • 2-IC-21 - Discuss issues of bias and accessibility in the design of existing technologies.
    • 2-IC-22 - Collaborate with many contributors through strategies such as crowdsourcing or surveys when creating a computational artifact.
Linee guida nazionali AI4K12 2021
      • 3-A-iv.9-12 - Illustrate what happens during each of the steps required when using machine learning to construct a classifier or predictor.
      • 3-C-iii.3-5 - Examine features and labels of training data to detect potential sources of bias.
      • 3-C-iii.6-8 - Explain how the choice of training data shapes the behavior of the classifier, and how bias can be introduced if the training set is not properly balanced.

Pianificazione

Obiettivi

Gli alunni saranno in grado di:
  • spiegare in che modo le scelte nella raccolta dei dati possono portare a problemi durante l'addestramento di un modello di apprendimento automatico

Preparazione

  • Consulta il forum "Aula insegnanti" per trovare insegnanti verificati per trovare strategie o risorse aggiuntive condivise da altri insegnanti

Collegamenti

Attenzione! Fai una copia di tutti i documenti che intendi condividere con gli alunni.

Per gli insegnanti

Guida didattica

Preparazione (5 minuti)

Diario

Mostra la diapositiva illustrata da Zoey che spiega come hanno provato ad addestrare il loro modello, ma non possono mai ottenere un'accuratezza superiore al 60%.

Discussione: quali sono alcuni motivi per cui Zoey potrebbe non essere in grado di addestrare un modello accurato?

Obiettivo della discussione: questa discussione prepara gli studenti all'attività principale di oggi: strategie su cosa fare quando i dati non portano a un modello accurato. Gli studenti dovrebbero attingere alle loro esperienze nell'unità quando hanno addestrato i propri modelli. Alcune risposte possono includere:

  • Zoey non ha scelto abbastanza caratteristiche - se seleziona più caratteristiche, potrebbe diventare più accurata
  • Zoey sta selezionando caratteristiche che non sono strettamente correlate alla loro etichetta. Dovrebbero utilizzare le visualizzazioni dei dati per avere un'idea migliore di quali caratteristiche saranno le migliori per l'etichetta.
  • Zoey potrebbe non disporre di dati sufficienti: se raccoglie più dati, potrebbe ottenere risultati migliori.

Osservazioni

Anche dopo aver creato il nostro sondaggio e aver raccolto i nostri dati, è ancora possibile che non saremo in grado di addestrare un modello accurato a partire dai nostri dati. Ci sono molte ragioni per cui ciò potrebbe accadere: oggi parleremo dei motivi per cui ciò potrebbe accadere e di alcune strategie per adattarci se i nostri dati non portano a buoni risultati.

Domanda del giorno: quali sono le strategie per garantire che i nostri dati generino un modello accurato?

Attività (35 minuti)

Code Studio: chiedi agli studenti di accedere a Code Studio e passare al primo esercizio di questa lezione. Gli studenti vedranno diversi insiemi di dati tra cui scegliere.

Distribuisci: la Troubleshooting Models - Activity Guide. Gli studenti annoteranno qui i dati della loro indagine.

Mostra agli studenti la diapositiva che spiega la prima parte dell'attività odierna: Kim, Nico, Isaac e Zoey hanno problemi ad addestrare modelli accurati e la classe deve aiutare a risolvere i problemi. Gli studenti esamineranno ogni studente e cercheranno di descrivere la causa del problema e daranno consigli su come risolverlo o come evitarlo la prossima volta.

Fai questo: analizza i dati di ogni persona in Laboratorio IA e annota i risultati nella guida alle attività.

Girando tra i banchi: monitora gli studenti mentre completano questo compito. Gli studenti devono leggere la descrizione di ogni studente per capire perché i loro dati potrebbero non funzionare, quindi esplorare le schermate dei dati e dei risultati. Gli studenti dovrebbero sperimentare diverse funzionalità e sottoporre a verifica i modelli per capire dove potrebbero esserci problemi.

Suggerimenti didattici

Modelli di risoluzione dei problemi: ecco alcuni suggerimenti per aiutare gli studenti a scoprire i problemi con questi modelli:

  • Dati di Zoey: i modelli di Zoey avranno sempre un'accuratezza dello 0% o del 33% perché non ha raccolto abbastanza dati: gli studenti dovrebbero notare che l'insieme di dati ha solo 25 righe. Gli studenti potrebbero suggerire che Zoey raccolga più dati prima di provare ad addestrare nuovamente il suo modello.
  • Dati di Isaac: i modelli di Isaac saranno sempre poco accurati perché nessuna delle sue caratteristiche ha una forte relazione con la sua etichetta. Gli studenti dovrebbero notare che nessuna delle classifiche della tabella incrociata ha punti forti in merito a qualsiasi domanda. Se gli studenti esaminano le domande da soli, possono notare che non sembrano avere una relazione forte con l'etichetta che Isaac sta cercando di prevedere. Gli studenti possono consigliare a Isaac di scegliere domande diverse e di raccogliere nuovamente i suoi dati.
  • Dati di Kim: i modelli di Kim possono essere molto accurati, ma quando gli studenti testano il modello possono trovare le domande e le scelte di risposta molto specifiche e non inclusive: ad esempio, la domanda «cibo preferito per il pranzo» contiene solo opzioni a base di carne. Gli studenti possono suggerire che, anche se il modello è accurato, Kim potrebbe voler scegliere domande diverse che siano più ampie e inclusive piuttosto che così specifiche.
  • Dati di Nico: i modelli di Nico possono essere molto accurati, ma quando gli studenti testano il modello possono scoprire che la maggior parte dei consigli è per il «Band Club», indipendentemente da cosa scelgano. Gli studenti potrebbero aver bisogno di qualche suggerimento per accorgersene, ma la schermata di selezione dei dati mostra che Nico ha raccolto dati principalmente dai membri di una band, il che ha orientato il suo modello verso la raccomandazione del Band club. Gli studenti possono consigliare a Nico di evitarlo la prossima volta assicurandosi che sia un'ampia varietà di persone a completare il suo sondaggio.

Condividi: invita gli studenti a condividere le loro risposte. Man mano che lo fanno, potresti decidere di raccogliere i dati davanti alla classe e sottolineare ciò che gli studenti hanno scoperto sul modello.

Discussione: Hawa non ha ancora iniziato a raccogliere dati. Quali sono le tre strategie che le offriresti in modo che non commetta alcuni degli errori dei suoi coetanei?

Chiedi agli studenti di annotare le loro risposte nella loro guida alle attività. Possono anche condividerlo con un compagno per contribuire a generare più idee.

Obiettivo della discussione: gli studenti dovrebbero dare suggerimenti relativi alla raccolta di dati da diverse fonti, assicurandosi che disponga di dati sufficienti e assicurandosi che il sondaggio sia sufficientemente rappresentativo e generale da ottenere risultati interessanti.

Suggerimenti didattici

Pianificazione del sondaggio: questa discussione e il focus sulla pianificazione di un sondaggio sono simili a una parte del progetto che gli studenti completeranno la prossima settimana: dovranno pianificare il modo in cui raccoglieranno i dati per garantire che i loro dati possano generare un modello accurato. Può essere utile spingere gli studenti a ricordarlo quando inizieranno il proprio progetto la prossima settimana.

Mostra la diapositiva successiva, con il seguente testo: Isaac è preoccupato di non avere il tempo di generare un sondaggio completamente nuovo e chiedere di nuovo tutto a nuove persone, ma vuole comunque creare un'app. Quali sono le altre opzioni che può prendere in considerazione?**

Chiedi agli studenti di rifletterci individualmente e di condividere tutto con un compagno, quindi passa alla diapositiva successiva.

Mostra la diapositiva successiva, con Isaac che fa riferimento alla sua guida alla pianificazione e ricorda un'idea diversa che aveva per il progetto: un predittore di isolamento sociale.

Osservazioni

Poiché il piano iniziale di Isaac non ha funzionato, una strategia che potrebbe provare è quella di ripensare alle sue idee iniziali e vedere se ci sono altre app che potrebbe essere in grado di creare che potrebbero ancora risolvere questo problema. Anche se Isaac potrebbe non essere in grado di raccogliere i propri dati, potrebbe essere in grado di utilizzare i dati di qualcun altro per risolvere il suo problema.

Code Studio: chiedi agli studenti di passare all'esercizio successivo di Code Studio, dove vedranno a loro disposizione diversi insiemi di dati.

Fai questo: Isaac ha trovato alcuni insiemi di dati aggiuntivi del sondaggio sugli studenti da un sito web pubblico che pensa di poter utilizzare per creare l'app "Punteggio di solitudine" a partire dalla sua raccolta di idee. Isaac ha già selezionato «Solitudine» come etichetta, ma ogni insieme di dati ha caratteristiche diverse tra cui scegliere (come musica o film). Scegli uno dei set di dati per indagare e vedere se riesci a creare un modello accurato per prevedere quanto potrebbe sentirsi solo qualcuno.

Girando tra i banchi: monitora gli studenti mentre esaminano gli insiemi di dati. Possono provare diversi insiemi di dati a seconda dei loro interessi.

Suggerimenti didattici

Utilizzo di insiemi di dati di esempio: questa attività rappresenta una situazione in cui gli studenti potrebbero trovarsi durante il progetto la prossima settimana: potrebbero voler utilizzare uno degli insiemi di dati di esempio per approfondire il loro problema, soprattutto se non sono in grado di raccogliere dati sufficienti dalla loro indagine o la loro indagine non porta a un modello accurato. In questa situazione, trovare un insieme di dati alternativo è un'opzione praticabile per gli studenti purché documentino questa scelta nella loro scheda modello.

Osservazioni

Anche se non abbiamo un modello accurato, ciò non significa che sia la fine del mondo. A volte possiamo trovare un insieme di dati alternativo da utilizzare. Oppure, ricorda che possiamo considerarci scienziati: stiamo sperimentando e studiando come i nostri dati sono correlati per contribuire a creare un modello. E, proprio come gli scienziati, a volte un esperimento fallisce, e va bene! A volte parlare del motivo per cui l'esperimento è fallito è tanto importante quanto parlare del perché un esperimento ha avuto successo! Vediamo come Isaac potrebbe farlo con una "scheda modello" ricavata dai suoi dati originali.

Conclusione (5 minuti)

Diario

Discussione: se Isaac dovesse ancora utilizzare i suoi dati per creare un'app o utilizzare questo set di dati di esempio, cosa pensi che dovrebbe inserire nella sezione "Utilizzi previsti"? Cosa dovrebbe contenere la sezione Limitazioni?

Obiettivo della discussione: gli studenti devono rendersi conto che quando utilizzano questi insiemi di dati alternativi, devono comunque fare attenzione a documentare le loro decisioni nelle loro schede modello.

Creative Commons License (CC BY-NC-SA 4.0).

Questo compito è disponibile previa Licenza Creative Commons (CC BY-NC-SA 4.0).

Se sei interessato ad utilizzare i materiali di Code.org per scopi commerciali, contattaci.