fbpx Il filo rosso che lega filologia e filogenesi | Scienza in rete

Il filo rosso che lega filologia e filogenesi

Primary tabs

Filologia e filogenesi, pur essendo discipline molto diverse, possono avere una serie di analogie interessanti tra i rispettivi approcci epistemologici. Nicolò Romano ne traccia degli esempi interessanti.

Immagine: diagramma in SplitsTree dell'articolo «The phylogeny of The Canterbury Tales».

Tempo di lettura: 10 mins

Due materie come la filologia e la filogenetica sono apparentemente molto distanti e diverse tra loro, ma in realtà negli ultimi anni mostrano sempre più affinità e somiglianze interessanti. Soprattutto con l’arrivo di metodi computazionali quantitativi nell’analisi testuale glottologica e filologica nei primi anni ’90, si è assistito in questi ultimi decenni a un rifiorire della ricerca grazie a reciproche contaminazioni. Scienze umanistiche e scienze dure si incontrano, assottigliando il confine ideale che le separa, grazie alle analogie metodologiche ed epistemologiche che le costituiscono. La filologia si occupa di studiare varie forme testuali, da poemi a fonti storiche, analizzandone soprattutto contenuto e forma. Essa fa uso di vari metodi, ma alle sue fondamenta vi è il metodo comparativo, che prevede una attenta analisi delle variazioni nei contenuti dei cosiddetti testimoni o codici. Un testimone è appunto una «apparizione» dello stesso testo originale, sotto forma di manoscritto, riedizione, ricopiatura o altro: è in pratica una copia del testo originale. Le alterazioni e variazioni studiate in filologia possono essere di varia natura e trovano precisa definizione sotto il nome di varianti. Queste possono consistere in errate trascrizioni di singoli termini, modifiche volontarie di intere frasi o addirittura eliminazione e inserimento di elementi o intere porzioni di testo. La filologia traccia infine un approfondito albero genealogico delle modificazioni storicamente occorse a un testo e alle sue copie, cercando inoltre di ricostruire il contenuto testuale di un’opera nella sua forma più attinente all’originale scritta dall’autore. Per svolgere questo lavoro il filologo non deve solo essere un profondo conoscitore di storia e glottologia, ma deve avvalersi sia di mezzi statistico-matematici come nella lessicostatistica sia, come dicevamo, di mezzi informatici.

Anche grazie all’implementazione di mezzi informatici e computazionali si notano ancora meglio le affinità di questa disciplina con la filogenetica. La filogenetica infatti è una branca della biologia sistematica che studia la diversificazione delle forme viventi nel tempo attraverso lo studio del loro corredo genetico. Grazie alla filogenetica è possibile ricostruire gli alberi genealogici delle discendenze degli organismi viventi, studiandone fenomeni come la nascita di nuove specie, l’estinzione o la presenza di antenati comuni. Nel caso non fosse già piuttosto evidente, gli obiettivi e addirittura i procedimenti della filogenetica e della filologia possono spesso sovrapporsi in maniera tanto esatta da essere talvolta congruenti. Naturalmente le due discipline presentano molte notevoli differenze, a partire dall’oggetto di studio: libri da un lato ed esseri viventi dall’altro.

I primi sono prodotti dell’intenzionalità umana e oggetti inanimati, i secondi invece sono prodotti dell’evoluzione biologica, complessi organismi viventi. Eppure, nonostante le due materie differiscano in maniera così evidente per l’oggetto di studio, sotto certe assunzioni sono estremamente simili.

Figura 1 Le somiglianze visive e concettuali tra un albero prodotto da filologi e il famoso disegno di Charles Darwin tratto da un suo taccuino, in cui rappresenta «L'albero della vita»

La filogenetica si concentra sullo studio del genoma dei viventi, ovvero l’interezza del patrimonio genetico informazionale codificato nel supporto chimico chiamato DNA. Un filamento di questo «supporto» è in parte costituito da quattro elementi discreti, le basi azotate (le famose AGCT). Assortite con grandissima variabilità, le basi formano stringhe che, «lette» dagli apparati cellulari, permettono di assemblare, tra le altre cose, le proteine: costituenti fondamentali di pressoché ogni struttura organica. Il fatto che il genoma sia costituito da elementi discreti come le basi azotate ci permette di vederlo come un enorme, lunghissimo testo. Questo è uno dei concetti chiave alla base della genetica e della filogenetica e anche la caratteristica fondamentale per individuare le analogie tra le due discipline. Così come un testo scritto va incontro a replicazioni che possono portare a variazioni (non tanto nei processi della moderna stampa, ma soprattutto in copia manuale, si pensi ai monaci amanuensi) anche i genomi dei viventi, replicandosi, possono generare mutazioni.

Osservati con una prospettiva diacronica, questi processi di «replicazione fallibile» dei contenuti portano nel lungo termine le tracce di tutte le varie modificazioni. Così si può conoscere, per esempio, in che momento storico l’Homo sapiens si sia diversificato a tal punto da divenire una specie a parte dai suoi antenati, ma anche sapere in che epoca sono avvenute varie rivisitazioni della novella Prologo e racconto della donna di Bath.

Infatti, il primo uso in ricerca filologica di tecniche computazionali proprie della filogenetica e in particolare della cladistica, si ha con la pubblicazione, nel 1998, di The phylogeny of The Canterbury Tales sulla prestigiosa rivista Nature. Lo studio descriveva l’applicazione di metodi informatici e software, comunemente usati in biologia evolutiva e filogenetica, per classificare le versioni alternative dei manoscritti della novella.

Figura 2 Dall'articolo originale The phylogeny of The Canterbury Tales (Nature, 1998)

Come si può vedere dalla Figura 2, il diagramma mostra l’analisi effettuata su 44 manoscritti tutti con differenze testuali nella novella. Il programma utilizzato dai ricercatori è SplitsTree, popolare tra i filogenetisti. Questo programma permette di rappresentare, tramite grafi matematici, varie tipologie di dati suddivise in famiglie con precise interdipendenze. In questo caso i punti più centrali sono i manoscritti che più si approssimano alla versione originale, presentando una maggiore somiglianza reciproca e un minor numero di incongruenze. Invece i punti più lontani sono dei testimoni col maggior numero di differenze. Dunque in questo caso la distanza dal centro aumenta all’aumentare delle differenze dal «capostipite» (più antico testo non originale pervenuto) della tradizione testuale in esame: l’archetipo. Analogo ma con qualche differenza da specificare è il caso dello stesso tipo di grafi usati in filogenetica.

Figura 3 Grafo ricavato dalla filogenetica di alcuni gasteropodi (Springer Nature, Jorger et al. 2010)

In Figura 3 è possibile osservare chiaramente lo stesso approccio di tipo cladistico applicato come di consueto a genomi di organismi, in questo caso 78 taxa di gasteropodi. Nel caso specifico di questo studio sono illustrate le parentele tra gruppi tassonomici, per cercare di conoscere quanto le lumache Acochlidiaceae fossero imparentate geneticamente tra loro e con altri taxa. Anche in questo caso si può notare che ci sono molti taxa che provengono da famiglie inizialmente più strettamente imparentate e che tendono a divergere più o meno gradualmente. La parentela qui è da intendersi semplicemente in termini di sovrapponibilità genomica, mentre i colori ci dicono in quali ordini quei genomi ricadevano per la classificazione, in base a somiglianze e differenze mutazionali.

Una cosa interessante da notare è la presenza di reticolazioni nel grafo sui gasteropodi e la loro assenza nel grafo sui manoscritti. Queste reticolazioni sono dovute all’incertezza nell’attribuzione di un genoma a una precisa discendenza piuttosto che a un'altra, dal momento che probabilmente presentano somiglianze genetiche notevoli con più genomi diversi e non è possibile dunque classificarli con elevata accuratezza.

Questi eventi non sono visibili nel nostro caso filologico, poiché i manoscritti con uno stesso testo, seppur con variazioni, non comportano l’insorgere di un nuovo manoscritto con, per esempio, un nuovo e inedito Racconto e prologo della donna di Bath che quindi non va riclassificato. Da questo punto di vista, il significato di un testo si assume come sostanzialmente conservato seppur con sottostanti variazioni testuali.

Un’opera letteraria qualsiasi viene analizzata dalla filologia essenzialmente in termini di forma e contenuto testuale, così come la filogenetica studia gli organismi in termini del loro contenuto genetico. La «forma fisica» attraverso cui il testo oggetto dello studio filologico viene studiata è principalmente appannaggio della codicologia, disciplina che studia il supporto materiale del testo, il suo processo di fabbricazione, il materiale di cui è composto, ecc. La «forma fisica» di un genoma, dall’altro lato, si può considerare come l’organismo vivente portatore, le cui informazioni di sviluppo e comportamento, seppur non completamente, sono codificate nel suo genoma. Vi saranno dunque varie separate discipline, come la zoologia, la botanica o la microbiologia che studieranno il cosiddetto fenotipo. Il caso della biologia è più delicato però: il «portatore» è in un certo senso emanazione del messaggio (i geni contengono il «progetto» del vivente) quindi bisogna far attenzione con questa analogia.

Insomma, appare via via più evidente come la filologia e la filogenetica presentino analogie metodologiche, dagli obiettivi del loro studio ai metodi per condurlo. Tuttavia queste non si esauriscono su questo livello, ve ne sono di speculari anche da un punto di vista più teorico e concettuale.

Prima dell’avvento della teoria dell’evoluzione di Charles Darwin, nella classificazione dei viventi ci si affidava principalmente all’individuazione di caratteristiche fisiche simili tra gli individui viventi. In generale, si considerava ogni individuo come «caso specifico» di una forma archetipica: la specie. Per cui un alano e un barboncino erano sì due organismi distinti ma anche essenzialmente simili. Darwin, da un certo punto di vista, superò questo approccio essenzialista concentrandosi non tanto su come mai gli esseri viventi fossero così diversi, bensì su come mai fossero tutti così simili nonostante tutta quella diversità. Consistette in una sorta di rivoluzione concettuale, dando una svolta al metodo di classificazione Linneano o Aristotelico, basati su categorie archetipiche nelle quali inserire gli organismi in base a quanto vi fossero «conformi».

Analogamente, nella filologia i filologi integrano le loro ricerche con assunzioni concettuali molto simili. Anziché concentrarsi sul trovare una spiegazione causale alle differenze di un testo (che possono benissimo essere assenti, in quanto certe variazioni possono essere casuali) possono concentrarsi sul trovare somiglianze e sulle loro possibili spiegazioni. Spiegare le somiglianze e spiegare le differenze tra due testi sono due approcci logicamente speculari, ma non forniscono le stesse informazioni allo studioso. Per fare un esempio, una scacchiera illustrata solo mostrandone le caselle bianche o solo le caselle nere sono due approcci che portano la stessa informazione all’osservatore. Le caselle nere sono quelle non-bianche e viceversa, ma questo è possibile solo perché le modalità con cui si presenta il fenomeno sono solo due e mutualmente esclusive. Nel caso di un dipinto, come a esempio La Tamise à Westminster, non potremmo fornire a uno spettatore le stesse informazioni rappresentando solo il cielo o solo il soggetto senza cielo. Questo perché il quadro presenta molte caratteristiche qualitativamente diverse e potenzialmente coesistenti, contrarie. Analogamente tra due testi non esistono solo congruenze e differenze, ma queste stesse caratteristiche si presentano in moltissime variazioni diverse: somiglianze e differenze ortografiche? Lessicali? Semantiche?

Figura 4 Claude Monet, La Tamise à Westminster, olio su tela (London National Gallery)

Sia i manoscritti che gli organismi inoltre si possono studiare su almeno due piani; i manoscritti possiedono un testo preciso che codifica i vari significati di cui si fa vettore, un organismo possiede un genotipo che codifica per le sue varie caratteristiche fenotipiche. Quindi abbiamo un piano informativo (testo e genotipo) e un piano espressivo (significato e fenotipo) in entrambi i casi. Così come in filologia possono esserci variazioni del testo quasi senza ripercussioni sul piano semantico, anche in genetica possono esserci mutazioni genetiche completamente silenti sul piano fenotipico. Anche l’inverso è in parte valido, con fenotipi modificati senza conseguenze genotipiche e significati interpretati differentemente senza modifiche testuali.

Le analogie tra la filologia e la filogenetica non finiscono qui, si potrebbe certamente parlare ancora a lungo dell’analogia per esempio dei processi di replicazione, trascrizione e traduzione genetici con riferimento ai copisti dei manoscritti. Si potrebbe parlare di effetti come la distruzione della biblioteca di Alessandria produsse una proliferazione delle edizioni dei manoscritti superstiti. Un evento del tutto analogo agli eventi catastrofici naturali con conseguenti derive genetiche. O ancora la ricerca dell’archetipo in filologia, non assomiglia un po’ alla ricerca dall’ultimo antenato unicellulare comune (LUCA) in filogenetica?

Tutte queste analogie non hanno lo scopo di banalizzare due campi di studio così affascinanti come la filologia e la filogenetica, piuttosto intendono sottolineare quanto l’indagine scientifica, seppur in campi diversi, possa assumere forme molto simili sotto la spinta di simili pressioni epistemologiche.

Le analogie emergono spontaneamente per la comunanza di intenti o le ritroviamo noi poiché proprio l’analogia è essenziale del nostro ragionamento a livello cognitivo? L’analogia può essere una guida ingannevole», diceva lo stesso Darwin ne L’origine delle specie, ed è certamente e spesso vero; eppure, come sottolinea anche il noto studioso Douglas Hofstadter, può essere il motore del pensiero, della concettualizzazione e anche una caratteristica fondamentale della creatività umana nella ricerca scientifica, a prescindere dai più o meno labili confini che tracciamo tra ambiti di studio. In questo senso la potenza dell’analogia, se incanalata con rigore, può aiutarci a valicare i limiti tra ambiti di studio, favorendo una contaminazione creativa anche estremamente prolifica come nell’esempio di filologia e filogenetica.

L’uso della creatività inarrestabile, rigorosa e sistematica della scienza, nell’indagine dei fenomeni del mondo, dovrebbe condurci a sfumare sempre più i contorni delle discipline scientifiche. La nostra curiosità infatti balza leggiadra e incurante dei confini, grazie anche alla spinta dell’analogia. Assecondandola nella sua leggerezza e sincera intenzione, potremo forse scoprire impensate meraviglie.


Scienza in rete è un giornale senza pubblicità e aperto a tutti per garantire l’indipendenza dell’informazione e il diritto universale alla cittadinanza scientifica. Contribuisci a dar voce alla ricerca sostenendo Scienza in rete. In questo modo, potrai entrare a far parte della nostra comunità e condividere il nostro percorso. Clicca sul pulsante e scegli liberamente quanto donare! Anche una piccola somma è importante. Se vuoi fare una donazione ricorrente, ci consenti di programmare meglio il nostro lavoro e resti comunque libero di interromperla quando credi.


prossimo articolo

Why have neural networks won the Nobel Prizes in Physics and Chemistry?

This year, Artificial Intelligence played a leading role in the Nobel Prizes for Physics and Chemistry. More specifically, it would be better to say machine learning and neural networks, thanks to whose development we now have systems ranging from image recognition to generative AI like Chat-GPT. In this article, Chiara Sabelli tells the story of the research that led physicist and biologist John J. Hopfield and computer scientist and neuroscientist Geoffrey Hinton to lay the foundations of current machine learning.

Image modified from the article "Biohybrid and Bioinspired Magnetic Microswimmers" https://onlinelibrary.wiley.com/doi/epdf/10.1002/smll.201704374

The 2024 Nobel Prize in Physics was awarded to John J. Hopfield, an American physicist and biologist from Princeton University, and to Geoffrey Hinton, a British computer scientist and neuroscientist from the University of Toronto, for utilizing tools from statistical physics in the development of methods underlying today's powerful machine learning technologies.