Vai al contenuto principale
Oggetto:
Oggetto:

Informatica umanistica e analisi di testi

Oggetto:

Digital humanities and digital text analysis

Oggetto:

Anno accademico 2022/2023

Codice dell'attività didattica
STU0727
Docente
Livio Bioglio (Titolare del corso)
Corso di studi
laurea triennale in Lettere
Anno
1° anno
Periodo didattico
Secondo semestre
Tipologia
Affine o integrativo
Crediti/Valenza
6
SSD dell'attività didattica
INF/01 - informatica
Modalità di erogazione
Tradizionale
Lingua di insegnamento
Italiano
Modalità di frequenza
Facoltativa
Tipologia d'esame
Orale
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Il corso permettere di acquisire conoscenze di base nel campo dell'Informatica Umanistica (Digital Humanities), focalizzandosi in particolare sulle tecniche e sugli strumenti di analisi del testo.

The course permits to acquire a basic knowledge in the field of Digital Humanities, focusing in particular on techniques and tools for text analysis.

Oggetto:

Risultati dell'apprendimento attesi

Il corso intende sviluppare, nelle studentesse e negli studenti, le seguenti competenze e capacità:

  • conoscere le potenzialità dell'informatica applicata alle discipline umanistiche
  • conoscere e saper utilizzare ad un livello base alcuni strumenti di informatica umanistica
  • conoscere le principali tecniche di analisi automatica dei testi
  • saper utilizzare strumenti per l'analisi automatica dei testi
  • saper analizzare corpora e visualizzare in maniera efficace i risultati di queste analisi

The course aims to develop the following skills:

  • to know the potentiality of information technology applied to the humanities
  • how to use some computer tools for the humanities at a basic level
  • to know the main techniques of automatic text analysis
  • how to use tools for automatic text analysis
  • how to analyze corpora and visualize the results

Oggetto:

Modalità di insegnamento

Lezioni in presenza per una durata complessiva di 36 ore.

Classes for a total of 36 hours.

Oggetto:

Modalità di verifica dell'apprendimento

Esame orale su un progetto

Oral exam on a project

Oggetto:

Programma

Il corso è diviso in due parti.

Parte 1: introduzione all'Informatica Umanistica, ai suoi campi di applicazione, ai suoi formati standard e ad alcuni strumenti di facile utilizzo. Gli argomenti principali saranno:

  • Linked Open Data
  • Semantic Web
  • Acquisizione di immagini e di modelli 3D
  • Digitalizzazione di testi
  • Analisi delle reti sociali
  • Visualizzazione dei dati
  • Storytelling

Parte 2: introduzione alle tecniche e ad alcuni strumenti per l'analisi automatica dei testi. Gli argomenti principali saranno:

  • Introduzione a concetti base di Machine Learning e Intelligenza Artificiale - apprendimento supervisionato e non supervisionato, classificazione, regressione, clustering, reti neurali
  • Optical Character Recognition (OCR) e Handwritten text recognition (HTR)
  • Introduzione a concetti e tecniche di Elaborazione del linguaggio naturale (NLP) - word segmentation, lemmatization, stemming, word embedding, named entity recognition, sentiment analysis, topic discovery
  • Distant reading
  • Strumenti per l'analisi automatica di testi e corpora: voyant, mallet, ncode, google ngrams.

The course is divided into two parts.

Part 1: introduction to Digital Humanities. The main arguments are:

  • Linked Open Data
  • Semantic Web
  • Acquisition of images and 3D models
  • Digitization of texts
  • Social Network Analysis
  • Data visualization
  • Storytelling

Part 2: introduction to text analysis. The main arguments are:

  • Introduction to Machine Learning Artificial Intelligence - supervised and unsupervised learning, classification, regression, clustering, neural networks
  • Optical Character Recognition (OCR) and Handwritten text recognition (HTR)
  • Introduction to Natural Language Processing (NLP) - word segmentation, lemmatization, stemming, word embedding, named entity recognition, sentiment analysis, topic discovery
  • Distant reading
  • Tools: voyant, mallet, ncode, google ngrams.

Testi consigliati e bibliografia

Oggetto:

Testi consigliati per approfondimenti

Linked Data: Evolving the Web into a Global Data Space, di Tom Heath e Christian Bizer, disponibile gratuitamente qui.

Further reading

Linked Data: Evolving the Web into a Global Data Space, by Tom Heath and Christian Bizer, available here.



Oggetto:

Note

Le lezioni si terranno in presenza, fatte salve le eventuali nuove restrizioni sulla didattica in presenza imposte, per ragioni sanitarie, dalla Presidenza del Consiglio dei Ministri o da altre autorità.

---------------------------------

La lezione di venerdì 28 Aprile 2023 è annullata, e sarà recuperata il 23 Maggio 2023 in orario 11-14 in Aula 12 Palazzo Nuovo.

Classes will be held in presence, unless new restrictions on teaching in presence are imposed for health reasons by the Government or other authorities.

Oggetto:
Ultimo aggiornamento: 15/05/2023 11:06

Location: https://cdslettere.campusnet.unito.it/robots.html
Non cliccare qui!