Recente Elevata quantità di errori di indicizzazione in FamilySearch

Non sai come utilizzare il forum? Posta qui le tue domande.

Moderatori: Collaboratori, Staff

Avatar utente
dgionco
Livello2
Livello2
Messaggi: 381
Iscritto il: mercoledì 2 ottobre 2013, 0:23

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da dgionco »

Io vorrei spezzare una lancia in favore dell'indicizzazione automatica.
Concordo sul fatto che l'origine AI dell'indicizzazione dovrebbe certamente essere segnalata.
Tuttavia queste informazioni possono essere usate in modo intelligente.
Io, ad esempio, sto cercando ricostruire l'albero famigliare dei miei lontani cugini in Brasile, che sono molte decine (facevano molti figli...).
Ricercando il mio cognome GIONCO variando delle lettere, in modo da riprodurre i possibili errori fatti dalla AI, sono riuscito a scoprire l'esistenza di documenti di atti riguardanti questi miei parenti.
Naturalmente è fondamentale che ci sia il rimando all'immagine del documento originale, in modo che sia possibile verificare la correttezza o meno della "trascrizione" datta da AI.

L'esperienza mi ha fatto constatare che almeno nel 20% dei documenti la trascrizione del cognome era falsa, ovvero non si trattava di miei parenti.
Ma nell'80% dei casi si trattava di documenti relativi ai miei parenti, ritrovati fra MILIONI di altri documenti (immagini), che mai avbrei potuto trovare personalmente.
La possibilità di prendere visione del documento originale mia ha poi consentito di trovare i dati corretti, anche se AI li aveva riportati sbagliati.

In conclusione direi che la decisione di FS di usare la AI per l'indicizzazione ha certamente una utilità insostituibile di trovare dei documenti che POTREBBERO riguardare quello che sto cercando, mentre non è affidabile per offrire i dati esatti.

Avatar utente
asimonetti67
Livello2
Livello2
Messaggi: 206
Iscritto il: sabato 5 dicembre 2020, 1:51
Località: Roma

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da asimonetti67 »

dgionco ha scritto:
giovedì 16 gennaio 2025, 7:19
Io vorrei spezzare una lancia in favore dell'indicizzazione automatica.
...
In conclusione direi che la decisione di FS di usare la AI per l'indicizzazione ha certamente una utilità insostituibile di trovare dei documenti che POTREBBERO riguardare quello che sto cercando, mentre non è affidabile per offrire i dati esatti.
Condivido quello che dici, anche se credo che dovrebbe essere possibile per gli interessati apportare delle correzioni, per migliorare la qualità del risultato.

MaryC
Livello1
Livello1
Messaggi: 13
Iscritto il: sabato 4 marzo 2017, 18:10

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da MaryC »

Pochi giorni fa ho trovato alcuni errori in una trascrizione di atti argentini su FamilySearch, e ho potuto correggerli.

giofol
Livello1
Livello1
Messaggi: 80
Iscritto il: sabato 30 dicembre 2023, 19:38

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da giofol »

dgionco ha scritto:
giovedì 16 gennaio 2025, 7:19

Naturalmente è fondamentale che ci sia il rimando all'immagine del documento originale, in modo che sia possibile verificare la correttezza o meno della "trascrizione" datta da AI.
Ma tu riesci a vedere gli atti brasiliani su FS? Perché ogni volta che trovo un rimando mi dice sempre che non è possibile visionarli.

MaryC
Livello1
Livello1
Messaggi: 13
Iscritto il: sabato 4 marzo 2017, 18:10

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da MaryC »

Io sì, questo è un esempio preso a caso:

https://www.familysearch.org/ark:/61903/1:1:Z2PQ-QH3Z

Si vede l'immagine, e basta cliccare su "Edit" per correggere la trascrizione.

Non so se vale per tutti gli atti brasiliani, però.

In molti paesi ci sono alcuni atti che FS non può mettere online perché il proprietario dei documenti è contrario. In tal caso, se sono stati digitalizzati, in genere danno la possibilità di vederli sul computer in un centro FS.

Invece non offrono più la possibilità di ordinare microfilm e microfiche di atti filmati ma non ancora digitalizzati.

Avatar utente
dgionco
Livello2
Livello2
Messaggi: 381
Iscritto il: mercoledì 2 ottobre 2013, 0:23

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da dgionco »

giofol ha scritto:
lunedì 20 gennaio 2025, 13:51
dgionco ha scritto:
giovedì 16 gennaio 2025, 7:19

Naturalmente è fondamentale che ci sia il rimando all'immagine del documento originale, in modo che sia possibile verificare la correttezza o meno della "trascrizione" datta da AI.
Ma tu riesci a vedere gli atti brasiliani su FS? Perché ogni volta che trovo un rimando mi dice sempre che non è possibile visionarli.
Nella maggior parte dei casi si può vedere la scansione del documento originale

Attendente
Livello1
Livello1
Messaggi: 136
Iscritto il: lunedì 31 luglio 2023, 20:31

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da Attendente »

Negli ultimi due aggiornamenti dicono di aver aggiunto 9,3 milioni di registri ecclesiastici per l'Italia e parlano un po' di più della loro I.A.:
https://www.familysearch.org/it/blog/nu ... nnaio-2025
https://www.familysearch.org/it/blog/ch ... ch-2025-it

Attendente
Livello1
Livello1
Messaggi: 136
Iscritto il: lunedì 31 luglio 2023, 20:31

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da Attendente »

Qualche risposta sui problemi di indicizzazione l'ho trovata nella FamilySearch Community:
https://community.familysearch.org/en/discussions

Ad esempio, questa:
https://community.familysearch.org/en/d ... w-hard-one

Avatar utente
Matteorm83
Livello2
Livello2
Messaggi: 331
Iscritto il: mercoledì 14 agosto 2019, 22:53
Località: ZELO BUON PERSICO

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da Matteorm83 »

Buongiorno,

Provo a tracciare un bilancio del recente avvio su Familysearch delle indicizzazioni dei documenti tramite algoritmi AI, almeno per quanto ha impattato le mie ricerche:

Aspetti negativi:
- La qualità di queste indicizzazioni è spesso di basso livello. Sono presenti vistosi errori di trascrizione sia dei nomi che dei luoghi e delle date.
- Lo studio accurato delle fonti è l'unico strumento per confermare, o meno, i risultati dell'indicizzazione automatica. Tuttavia, non tutte le fonti indicizzate sono accessibili liberamente. Questo può far sì che una fonte male indicizzata possa restare tale per lungo tempo, aumentando la possibilità di propagare eventuali errori se analizzate con superficialità.
- Riscontro che non si possono correggere i risultati delle indicizzazione se non nell'anagrafica della persona / evento associato. Questo può dar luogo alle stesse problematiche del punto precedente.

Aspetti positivi:
- La presenza di fonti indicizzate, anche male o non perfettamente, da la possibilità di compiere ricerche veloci laddove sarebbero necessari tempi molto lunghi. Un esempio: fonti che avevo già analizzato in passato, prive di indici annuali e per le quali ho impiegato 2 anni di ricerche spaziando tra 6 decenni e 20 comuni, sono adesso indicizzate. Nel giro di 3 settimane ho potuto visionarle nuovamentr e associarle a persone ed eventi.
- I documenti indicizzati mi hanno dato la possibilità di rintracciare delle persone che hanno lasciato tracce in comuni/ parrocchie non oggetto delle mie ricerche e di alcune sviste.

Conclusioni:
Dal mio punto di vista il bilancio di questa indicizzazione automatica è positivo perchè può accelerare notevolmente una ricerca e allargarne gli orizzonti. Tuttavia, servono ancora notevoli miglioramenti per migliorare gli algoritmi da un punto di vista qualitativo e per evitare la propagazione di errori.
Enea e Lena (Milano) < Matteo (1983 - Roma) < Pietro (1944 - Roma) < Bruno Dino (1914 - Chitignano) < Pietro (1888 - Chitignano) < Pasquale (1853 - Chitignano) < Luigi (1795 Circa - Chitignano) < Niccoló (1762 Circa - Chitignano) < Paolino (?)

Avatar utente
niko29
Livello3
Livello3
Messaggi: 742
Iscritto il: mercoledì 23 dicembre 2020, 16:42
Località: Milano

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da niko29 »

Concordo pienamente, anch'io ho rintracciato parecchie persone nei luoghi più disparati.
Diamo tempo al tempo, sono fiduciosa

Avatar utente
Jfk105
Livello2
Livello2
Messaggi: 499
Iscritto il: sabato 9 settembre 2017, 0:00
Contatta:

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da Jfk105 »

Ciao, concordo con Matteo e Niko.
Tralasciando i vistosi errori (nomi e luoghi assurdi, inesistenti, capolavori della fantasia artificiale o semplicemente dell'attuale scarsezza di riconoscimento della scrittura a mano...) l'indicizzazione che ne è scaturita ultimamente mi ha dato modo di trovare ad esempio una sorella di mia nonna a tutti ignota e nata in un quartiere di Milano che non avevo mai controllato (soprattutto avrei dovuto cercare cosa e quando?) e un fratello della mia nonna paterna (idem come sopra) ed innumerevoli figli di prozii che spero m'indichino la via per trovare - prima o poi - la morte della mia trisavola Michelina Rosalinda Merli.
Onestamente lo trovo un enorme passo in avanti e l'IA è uno strumento pazzesco se usato bene, deve crescere ed imparare con l'aiuto di persone reali e di dati sempre più consistenti, sperando che in futuro non ci consideri ininfluenti e ci estingua (vedi Terminator, insomma) :) (Sto scherzando, scusatemi).

Aggiungo che ho provato, con ChatGPT, a "fargli leggere" un'immagine di un atto scritto malissimo (grafia quasi illeggibile e sbiadita), in latino(!) per capire se la mia interpretazione di un nome fosse corretta: beh, a parte qualche errore dovuto appunto alla pessima qualità, il nome me l'ha confermato, ha capito che fosse una atto di matrimonio ecclesiastico e seppure con errori ha ricavato nome della Parrocchia e degli sposi. Per me è stupefacente (e lo dico da informatico).

Ultimo esempio: da anni sto inserendo i miei antenati in un database che continuo ad aggiornare con funzioni che man mano mi vengono in mente ma, poichè non sono un programmatore, l'ho sempre fatto a livello molto basilare e con (sicuramente) tantissimi "aggiramenti dell'ostacolo" per ottenere quello che voglio.. se lo guardasse un programmatore mi fucilerebbe per quanto è fatto male!
Invece a ChatGPT e Gemini scrivo quello che voglio ottenere, passo le informazioni cercando di essere molto specifico e preciso (i dati) e pian piano riesco ad avere il risultato che voglio (dopo innumerevoli sbagli, tentativi e modifiche)... un risultato che solo con le mie competenze MAI sarei stato in grado di raggiungere, MAI.
Scusate la logorrea, avrei dovuto chiedere all'IA di sintetizzare e riordinare :D
Ciao, J
Io (1968) – Ugo (1937) – Amleto Enrico (1907) – Ugo Luigi (1873) – Giuseppe Antonio (1832) – G.Battista (1796) – Adamo Cesare (1772) – Sante Cesare Melchiorre (1749) – G.Battista (1726) – Cesare (1669) – Giovanni (1630-1633) - Pietro (1600-1616)

Avatar utente
LeVit
Collaboratore
Collaboratore
Messaggi: 1098
Iscritto il: martedì 13 dicembre 2005, 14:57
Località: Gemona
Contatta:

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da LeVit »

La indicizzazione dei documenti su FamilySearch ( https://www.familysearch.org/it/getinvolved/indexing ) come conosciuta da chi ha almeno provato ad indicizzare qualche volta negli ultimi quindici anni, è definitivamente conclusa. Questo il msg che appare da qualche giorno:
"Il vecchio strumento di indicizzazione viene sostituito da nuove tecnologie che rendono più facile e veloce la ricerca dei propri antenati. Mentre l'IA accelera il lavoro di indicizzazione, i vostri sforzi volontari sono ancora necessari per aiutare a rivedere gli atti vitali."
"Questa attività di indicizzazione è stata ritirata. Puoi ancora accedere ai tuoi messaggi e gruppi fino al 30 aprile 2025. Le tue statistiche e altre attività di indicizzazione saranno ancora disponibili su Get Involved - Opportunities."

Già da ora è attiva la funzione di controllo (conferma o correzione)di quanto letto dalla AI:
https://www.familysearch.org/it/getinvo ... ortunities
Ho provato a controllare un centinaio di nomi, completi e non, e devo dire che la lettura della Ai non è peggiore della lettura deli indicizzatori umani (e assicuro che ne ho esperienza). Parlo della semplice lettura dei nomi delle persone indicata in un atto.
Devo dire innanzitutto che le istruzioni per la conferma o modifica dei dati sono davvero minimali.

Ho molte difficoltà invece ancora a capire come questi nomi possano trovare una collocazione logica nella interpretazione di un Atto.. Questo sia perché i nomi non sono letti in una sequenza logica nell'atto , sia perché pare non si capisca il ruolo dei vari personaggi che compaiono. Parroco, padre, madre. battezzato, padrino, madrina, firme dei testimoni... tutti sono sempre e solo nomi, letti correttamente o da correggere. Sicuramente ci sono tante cose ancora da capire, soprattutto sulla impostazione dei modelli standard.

Forse non interessa nemmeno la struttura dell'Atto. forse gli basta sapere che in quel registro, di quella parrocchia, ad una certa data, compare quel nome. Poi vai tu a vedere sulla immagine il senso preciso di quel nome.

Comunque per essere una procedura nata da pochi mesi, e se hanno già deciso di abbandonare la vecchia procedura, mi pare che difficilmente si tornerà indietro.

Avatar utente
LeVit
Collaboratore
Collaboratore
Messaggi: 1098
Iscritto il: martedì 13 dicembre 2005, 14:57
Località: Gemona
Contatta:

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da LeVit »

Per provare la nuova procedura:
https://www.familysearch.org/it/home/portal/
Registrarsi. (obbligatorio)
Poi dal menu principale: Partecipa / Opportunità
e si arriva qui: https://www.familysearch.org/it/getinvo ... ortunities

Avatar utente
asimonetti67
Livello2
Livello2
Messaggi: 206
Iscritto il: sabato 5 dicembre 2020, 1:51
Località: Roma

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da asimonetti67 »

LeVit ha scritto:
sabato 26 aprile 2025, 15:36
Per provare la nuova procedura:
https://www.familysearch.org/it/home/portal/
Registrarsi. (obbligatorio)
Poi dal menu principale: Partecipa / Opportunità
e si arriva qui: https://www.familysearch.org/it/getinvo ... ortunities
Tra i paesi non c'è l'Italia...

Attendente
Livello1
Livello1
Messaggi: 136
Iscritto il: lunedì 31 luglio 2023, 20:31

Re: Recente Elevata quantità di errori di indicizzazione in FamilySearch

Messaggio da Attendente »

Proprio in questo momento, e fino alle 12,00,

"Alcune funzioni di FamilySearch potrebbero non essere disponibili mentre apporteremo delle migliorie al sito".
Ultima modifica di Attendente il lunedì 28 aprile 2025, 9:11, modificato 1 volta in totale.

Rispondi