- Oggetto:
- Oggetto:
Informatica umanistica e analisi di testi
- Oggetto:
Digital humanities and digital text analysis
- Oggetto:
Anno accademico 2022/2023
- Codice dell'attività didattica
- STU0727
- Docente
- Livio Bioglio (Titolare del corso)
- Corso di studi
- laurea triennale in Lettere
- Anno
- 1° anno
- Periodo didattico
- Secondo semestre
- Tipologia
- Affine o integrativo
- Crediti/Valenza
- 6
- SSD dell'attività didattica
- INF/01 - informatica
- Modalità di erogazione
- Tradizionale
- Lingua di insegnamento
- Italiano
- Modalità di frequenza
- Facoltativa
- Tipologia d'esame
- Orale
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Il corso permettere di acquisire conoscenze di base nel campo dell'Informatica Umanistica (Digital Humanities), focalizzandosi in particolare sulle tecniche e sugli strumenti di analisi del testo.The course permits to acquire a basic knowledge in the field of Digital Humanities, focusing in particular on techniques and tools for text analysis.
- Oggetto:
Risultati dell'apprendimento attesi
Il corso intende sviluppare, nelle studentesse e negli studenti, le seguenti competenze e capacità:
- conoscere le potenzialità dell'informatica applicata alle discipline umanistiche
- conoscere e saper utilizzare ad un livello base alcuni strumenti di informatica umanistica
- conoscere le principali tecniche di analisi automatica dei testi
- saper utilizzare strumenti per l'analisi automatica dei testi
- saper analizzare corpora e visualizzare in maniera efficace i risultati di queste analisi
The course aims to develop the following skills:
- to know the potentiality of information technology applied to the humanities
- how to use some computer tools for the humanities at a basic level
- to know the main techniques of automatic text analysis
- how to use tools for automatic text analysis
- how to analyze corpora and visualize the results
- Oggetto:
Modalità di insegnamento
Lezioni in presenza per una durata complessiva di 36 ore.
Classes for a total of 36 hours.
- Oggetto:
Modalità di verifica dell'apprendimento
Esame orale su un progetto
Oral exam on a project
- Oggetto:
Programma
Il corso è diviso in due parti.
Parte 1: introduzione all'Informatica Umanistica, ai suoi campi di applicazione, ai suoi formati standard e ad alcuni strumenti di facile utilizzo. Gli argomenti principali saranno:
- Linked Open Data
- Semantic Web
- Acquisizione di immagini e di modelli 3D
- Digitalizzazione di testi
- Analisi delle reti sociali
- Visualizzazione dei dati
- Storytelling
Parte 2: introduzione alle tecniche e ad alcuni strumenti per l'analisi automatica dei testi. Gli argomenti principali saranno:
- Introduzione a concetti base di Machine Learning e Intelligenza Artificiale - apprendimento supervisionato e non supervisionato, classificazione, regressione, clustering, reti neurali
- Optical Character Recognition (OCR) e Handwritten text recognition (HTR)
- Introduzione a concetti e tecniche di Elaborazione del linguaggio naturale (NLP) - word segmentation, lemmatization, stemming, word embedding, named entity recognition, sentiment analysis, topic discovery
- Distant reading
- Strumenti per l'analisi automatica di testi e corpora: voyant, mallet, ncode, google ngrams.
The course is divided into two parts.
Part 1: introduction to Digital Humanities. The main arguments are:
- Linked Open Data
- Semantic Web
- Acquisition of images and 3D models
- Digitization of texts
- Social Network Analysis
- Data visualization
- Storytelling
Part 2: introduction to text analysis. The main arguments are:
- Introduction to Machine Learning Artificial Intelligence - supervised and unsupervised learning, classification, regression, clustering, neural networks
- Optical Character Recognition (OCR) and Handwritten text recognition (HTR)
- Introduction to Natural Language Processing (NLP) - word segmentation, lemmatization, stemming, word embedding, named entity recognition, sentiment analysis, topic discovery
- Distant reading
- Tools: voyant, mallet, ncode, google ngrams.
Testi consigliati e bibliografia
- Oggetto:
- Oggetto:
Note
Le lezioni si terranno in presenza, fatte salve le eventuali nuove restrizioni sulla didattica in presenza imposte, per ragioni sanitarie, dalla Presidenza del Consiglio dei Ministri o da altre autorità.
---------------------------------
La lezione di venerdì 28 Aprile 2023 è annullata, e sarà recuperata il 23 Maggio 2023 in orario 11-14 in Aula 12 Palazzo Nuovo.
Classes will be held in presence, unless new restrictions on teaching in presence are imposed for health reasons by the Government or other authorities.
- Oggetto: