Come si impara una dipendenza. Il disturbo da uso di sostanze come apprendimento

La dipendenza dalle droghe o verso certi comportamenti, come il gioco d’azzardo, è un disturbo complesso, legato alla stratificazione nel tempo di effetti causali su più dimensioni interagenti, da quella genetica al piano psicosociale. Per questo spesso prende corpo in una spirale di sviluppo problematica, caratterizzata da una progressiva escalation di ricerca e uso della sostanza. In questa progressione si può assistere al passaggio da un uso controllato e volontario a una perdita del controllo, in cui il consumo tende ad assumere la forma della compulsione o alla fissazione di certi schemi riflessi di comportamenti, di automatismi.

 

Dall’uso volontario e controllato alla dipendenza: i principi del rinforzo

Wassily Kandinsky 1866-1944 , Cosacchi 1910-1 http://www.tate.org.uk/art/work/N04948

Questo passaggio, questo slittamento del rapporto con la sostanza, è di fatto un apprendimento, come tutte le trasformazioni di un comportamento legate alla ripetuta associazione di certe esperienze, percezioni, stimoli con determinate azioni. Più precisamente, è possibile concettualizzare il passaggio dal consumo di droghe controllato e volontario alla dipendenza nei termini di un apprendimento strumentale, cioè un apprendimento in cui le associazioni tra stimoli e comportamento dipendono anche dall’azione di una ricompensa ovvero da un incentivo o un rinforzo alla fissazione del comportamento stesso. Incentivo e rinforzo possono essere positivi o negativi. Nel primo caso avremo ricompense che promuovono l’apprendimento di un comportamento e quindi la sua ripetizione perché questo porta a una gratificazione, a una esperienza affettiva associata al piacere. Nel caso del rinforzo negativo abbiamo invece un tipo di apprendimento legato all’associazione tra certe percezioni, stimoli, situazioni e una conseguenza negativa, avversa, a una punizione, a una esperienza affettiva connotata dal dolore o da un certo grado di penosità o disagio. Il rinforzo negativo per questo tende a modellare un comportamento funzionale a evitare la conseguenza negativa. Su questo meccanismo, che in sostanza dipende dagli effetti comportamentali delle punizioni, peraltro afflitto da una serie di complessità problematiche e inefficienze, si reggono diversi aspetti (talora appunto inefficienti) dei sistemi educativi e di controllo sociale.

 

L’apprendimento di una dipendenza: dal rinforzo positivo a quello negativo

Esistono due aspetti fondamentali nella comprensione dell’azione delle sostanze in questo processo di apprendimento patologico. Il primo è che tutte le sostanze hanno la capacità di attivare i sistemi cerebrali da cui dipende l’esperienza della ricompensa, del rinforzo positivo. Il secondo è che l’uso di ogni sostanza determina nel cervello dei processi specifici di riadattamento delle funzioni neurofarmacologiche. Questi sono aggiustamenti attraverso cui il sistema nervoso cerca di compensare l’interferenza che la sostanza provoca nelle normali attività dei neuroni, dei centri e delle vie cerebrali. E sono compensazioni con cui si realizza un nuovo patologico equilibrio delle funzioni neurali in presenza della sostanza. Ma questa sorta di apprendimento neurofarmacologico determina la necessità della presenza della sostanza nel cervello, è alla base della sindrome di astinenza e dei suoi sintomi penosi.

L’apprendimento di una dipendenza potrebbe essere considerato una sequenza evolutiva patologica con cui i meccanismi sottostanti al disturbo, inizialmente associati a un rinforzo positivo, si trovano via via a dipendere da elementi di rinforzo negativo1. Come abbiamo visto, tutte le sostanze con potenziale d’abuso, alcol, tabacco e tutte le sostanze illegali, hanno la capacità di rinforzare il comportamento di assunzione perché attivano il sistema della ricompensa. Facendo leva sugli stessi meccanismi fisiologici per cui l’organismo è in grado di riconoscere e ricercare sostanze vantaggiose (quali ad esempio cibo, acqua, elementi associati a sensazioni di piacere o in grado di annullare sensazioni negative), le sostanze di cui si abusa sono dapprima assunte a intervalli regolari, in base alle loro proprietà di rinforzo positivo.

In individui vulnerabili, le risposte fisiologiche compensatorie e il neuroadattamento, associati a una esposizione regolare e ripetuta a sostanze psicoattive, possono determinare la necessità dell’assunzione per evitare i sintomi dell’astinenza. Questi sintomi sono le sensazioni penose che emergono quando, in un cervello che ha “appreso” a funzionare con la sostanza, l’effetto della sostanza si è esaurito. Per questi individui il mantenimento del rapporto con la sostanza diventa quindi anche espressione di un rinforzo negativo, cioè di uno stimolo che incentiva un comportamento strumentale appreso, in questo caso il consumo, perché capace di evitare una condizione avversa, dolorosa, penosa.

Più che essere considerati semplicisticamente alla stregua di meri sistemi di ricompensa o di punizione, il rinforzo positivo e il rinforzo negativo si riferiscono piuttosto a precisi costrutti psicobiologici che sottendono alla reiterazione di specifici comportamenti2 e, proprio per questa ragione, rappresentano anche un’utile possibilità nell’ambito del trattamento delle dipendenze. In questo senso, è necessario puntare a una comprensione profonda dei principi di rinforzo e a una più chiara determinazione dei vari stadi entro cui si articola il processo di sviluppo che conduce, in ultimo, alla cronicizzazione di un disturbo legato all’uso di sostanze. Ciò è essenziale per poter dar conto dei processi psicologici e neurobiologici che distinguono l’uso volontario e controllato (iniziale) di sostanze dalla formazione di un persistente stato di dipendenza e, parallelamente, per poter riuscire a migliorare l’efficacia delle strategie di intervento terapeutico.

 

Psicobiologia del rinforzo positivo e del rinforzo negativo

Il processo di rinforzo positivo ha luogo quando, in una determinata situazione, uno stimolo motivazionale e appetitivo piacevole e gratificante rafforza una precisa risposta comportamentale, producendo un aumento nella frequenza e nella durata della risposta (o uno stato di latenza più breve). Correla al rinforzo positivo l’attivazione del sistema dopaminergico mesolimbico e del sistema oppioide endogeno. In particolare il rilascio di dopamina che si verifica in occorrenza di una gratificazione sembra favorire la costruzione delle associazioni tra neuroni che processano gli stimoli sensoriali relativi alla situazione in cui avviene l’esperienza gratificante, con quelli che mediano l’esperienza soggettiva del piacere e con quelli che mediano la risposta comportamentale. Questa associazione rappresenta il correlato neurale dell’apprendimento di un comportamento strumentale modellato da un rinforzo positivo.

Sebbene in molti casi il rinforzo positivo sia contestuale a uno stimolo di ricompensa (vale a dire uno stimolo “apprezzato” e “valutato positivamente” dall’individuo), questo non rappresenta di per sé un requisito necessario perché uno stimolo possa rafforzare una risposta. Analogamente, stimoli che sono considerati soggettivamente appaganti non svolgono automaticamente un’attività di rinforzo.

Il rinforzo negativo è una condizione associata al consolidamento di quelle risposte comportamentali seguite da una riduzione o interruzione di uno stimolo avverso. Un elemento di rinforzo negativo può essere definito, quindi, nei termini di uno stimolo motivazionale che rafforza una risposta, per così dire, di fuga da sensazioni spiacevoli.

Dal punto di vista cerebrale le ricerche suggeriscono che l’evitamento di uno stato negativo, di dolore o penosità venga elaborato dal cervello come una sorta di ricompensa, sembra quindi attivare nuovamente il substrato neurale che media i rinforzi positivi: sistema della ricompensa, con dopamina e oppioidi endogeni.

Riguardo all’apprendimento di una dipendenza da sostanze, la condizione di rinforzo negativo appare ricorrente nelle situazioni in cui, a seguito dello sviluppo di una forma di tolleranza nei confronti della sostanza, l’individuo procede all’auto-somministrazione finalizzata alla riduzione di un bisogno motivazionale nello stato di astinenza, all’attenuazione del disagio quindi.

  

Rinforzo secondario e rinforzo condizionato

Si parla di rinforzo secondario (o condizionato) a proposito degli stimoli e dei contesti associati ripetutamente con l’uso della sostanza, come potrebbe essere il luogo in cui si assume una sostanza, un determinato stato d’animo o pensiero associati all’uso, un’altra persona con cui si consuma, un particolare sapore, odore, una sensazione fisica e così via.

Gli stimoli di rinforzo secondario, proprio in virtù della loro associazione all’uso, vengono incorporato nell’apprendimento del comportamento promosso dalla ricompensa innescata dalla sostanza (rinforzo primario) e diventano essi stessi elementi di rinforzo e quindi inneschi che possono determinare il consumo.

La presenza diffusa, la numerosità e l’ubiquità dei potenziali stimoli associabili al consumo fa sì che i fattori di rinforzo condizionato giochino un ruolo di primo piano anche nel complesso processo di sviluppo della dipendenza, determinando fenomeni di ampliamento del craving negli stati di astinenza o favorendo a livello subconscio i processi compulsivi di ricaduta3.

Sulla base della modello teorico proprio della cosiddetta “incentive-sensitization theory” proposto da Robinson e Berridge4 nei primi anni Novanta, l’intrinseco valore incentivante dei processi di rinforzo secondario, in risposta all’azione congiunta dei principi di rinforzo primario, può portare a un processo di sensibilizzazione (noto anche come “tolleranza inversa”) per cui, in seguito a una somministrazione ripetuta, si assiste all’aumento degli effetti delle sostanze d’abuso. In linea con quanto previsto da questo specifico impianto teorico, la sensibilizzazione rappresenterebbe uno dei meccanismi che soggiacciono alla capacità della sostanza d’abuso di controllare il comportamento di ricerca compulsiva tipico della dipendenza. Più specificamente, la sensibilizzazione verrebbe esercitata su quegli schemi motori, sugli automatismi appresi dei comportamenti di consumo, così che il comportamento di ricerca e assunzione verrebbe mantenuto indipendentemente dal desiderio effettivo di assumere la sostanza. Questo fenomeno sembra essere associato a un’attività rinforzata entro specifici circuiti subcorticali implicati nella regolazione delle vie mesolimbiche, come l’amigdala, lo striato ventrale, la corteccia prefrontale e insulare5.

Ciò che accade è che la ripetuta esposizione alle sostanze d’abuso rinforzanti determina un significativo e progressivo coinvolgimento di quei meccanismi neuronali deputati alla stabilizzazione delle memorie. «Un graduale coinvolgimento della trasmissione glutammatergica dalla corteccia prefrontale al corpo striato e al talamo (il cosiddetto loop cortico-striato-talamico) si traduce nella trasformazione di un processo esecutivo volontario in uno inconsapevole, compulsivo automatico»6. Una volta che il comportamento motivato si è stabilizzato nella memoria, il rilascio di dopamina non è più necessario per rinforzare il comportamento di assunzione della sostanza ma continua comunque a segnalare la presenza degli stimoli ad essa associati: i rinforzi secondari. Per questo i meccanismi dopaminergici risultano così attivabili e i fenomeni di craving amplificati anche in assenza della specifica sostanza d’abuso, a causa di una ri-esposizione all’azione di rinforzo (secondario) di stimoli e contesti condizionanti.

Considerando la vasta eterogeneità dei fattori socio-ambientali condizionanti (di rischio o di resilienza), la loro assoluta individualità, si fa sempre maggiormente strada la necessità di sviluppare analisi precliniche e strategie di trattamento individualizzate specificamente destinate ai meccanismi di rinforzo secondario.  Inoltre, dal momento che la dipendenza può essere descritta come un disturbo in evoluzione (laddove, come abbiamo visto, un uso occasionale e volontario può rapidamente trasformarsi in uno stato di disturbo da uso di sostanze), sarebbe utile riuscire a determinare i precisi cambiamenti che avvengono all’interno dei circuiti cerebrali associati a ciascuno stadio al fine di poter sviluppare nuove e più efficaci strategie terapeutiche.  

 

Serena Nicchiarelli e Stefano Canali

 

Riferimenti bibliografici 

  1. Koob, G. F., & Le Moal, M. (2005). Plasticity of reward neurocircuitry and the’dark side’of drug addiction. Nature neuroscience8(11), 1442-1444.
  1. Edwards, S. (2016). Reinforcement principles for addiction medicine; from recreational drug use to psychiatric disorder. Progress in brain research223, 63-76.
  1. Weiss, F. (2005). Neurobiology of craving, conditioned reward and relapse. Current opinion in pharmacology5(1), 9-19.
  2. Robinson, T. E., & Berridge, K. C. (1993). The neural basis of drug craving: an incentive-sensitization theory of addiction. Brain research reviews18(3), 247-291.
  1. Paulus, M. P., & Stewart, J. L. (2014). Interoception and drug addiction. Neuropharmacology76, 342-350.
  1. Everitt, B. J., & Robbins, T. W. (2005). Neural systems of reinforcement for drug addiction: from actions to habits to compulsion. Nature neuroscience8(11), 1481-1489.

User Avatar

Stefano Canali

Read Previous

Craving. Il desiderio irresistibile è un concetto desiderabile?

Read Next

Guerra e sostanze psicotrope: un connubio millenario

2 Comments

  • Come sempre, è un autentico piacere leggere gli articoli su questo portale. In particolare questo argomento di “apprendimento attraverso i rinforzi” è particolarmente stimolante.

    E’ da poco che mia moglie ed io abbiamo “ereditato” da mia figlia una gatta. Avendo già il cane, peraltro anziano, abbiamo dovuto escogitare delle strategie per poter garantire la pappa ad ambedue i nostri quadrupedi pelosi, in particolare quello ovviamente del gatto. La ciotolina della gatta doveva essere posta in un luogo decisamente inaccessibile per il cane, perché quest’ultimo è una costante minaccia in grado di fare suo anche ciò che era destinato al gatto, come ben sanno tutti coloro che hanno diversi animali in casa.

    Nonostante il fatto di aver individuato lo studio mio come posto ideale per l’ubicazione sicura della pappa del gatto, che viene messa sopra la mia scrivania piena di computer, fili, altoparlanti e quant’altro, ho potuto osservare un lento ma costante, continuo escogitare da parte del cane di strategie da attuare per accedere verso il premio ambito. Si sveglia di notte fonda per evitare il sottoscritto come guardia della ciotola, e lentamente accede, con frequenti pause per evitare un mio brusco risveglio, verso i piani inferiori della casa, come un vero e proprio ladro. Inoltre, si accolla ad altre persone in casa con la speranza che venga aperta la porta dello studio, segue anche il gatto come uno stalker, nella speranza di giungere al suo ambito scopo.
    L’odore, per noi poco percepibile, delle palline del cibo per gatti attiva continuamente l’area ventrale tegmentale del cane, eccitando i neuroni dopaminergici che proiettano assoni verso il nucleo accumbens nel quale, con una conseguente ondata di rilascio di dopamina, nella shell e successivamente nel core, porta a un rinforzo, sia di attesa di ricompensa (spesso mi chiedo come faccia ad accontentarsi di poche palline sbriciolate e parzialmente masticate da parte del gatto ma evidentemente la dopamina è una potentissima guida – inglese “drive”- che può anche magnificare la ricompensa oltre il reale valore), che lo dirige, sia come motivazione che come movimento verso la conquista dell’ambito premio.

    L’apprendimento di tutto questo per il mio cane è insito in ciò che sta DIETRO l’attesa per il piacere (rinforzo positivo) e il movimento verso la fonte del piacere (motivazione o drive), e cioè la SOPRAVVIVENZA, di cui il cibo è garante, insieme agli stimoli di bere acqua, di accoppiamento ed di accudimento (vedi Volkow, NIDA). Ovviamente, la sopravvivenza si garantisce anche dall’ evitamento di pericoli attraverso quegli stimoli negativi che creano, l’attesa per una pena (rinforzo negativo) e il movimento di allontanamento dalla fonte della pena (pericolo). Ambedue le situazioni hanno nella dopamina il primum movens, coadiuvata a seconda del caso dalla serotonina (in adolescenti per esempio), da ormoni e mediatori chimici dello stress (CRF, dinorfina, vasopressina, e noradrenalina), oltre al glutammato e il gaba come segnali “GO” e “STOP” dello scenario della gratificazione (Koob).
    Le droghe d’abuso dirottano (“highjack”) tutto questo magnifico “apprendimento della sopravvivenza” perché in primis trasformano l’ondata di rilascio della dopamina in inondazione catastrofica a mo’ di tsunami di essa, come ben illustrata tra gli altri da Koob e da Volkow. Questo rende il rinforzo positivo e il movimento verso il consumo un desiderio incontrollabile (“craving”) e la mancanza della sostanza una condizione insopportabile del vivere descritta da Koob come il “dark side of addiction” da evitare come un rinforzo negativo, con una motivazione pressoché incorreggibile verso il consumo. L’apprendimento della sopravvivenza di trasforma dunque in una corsa folle che, se non arrestata spontaneamente o – meglio – attraverso la cura, può portare in molti casi, alla morte precoce.
    Daniel L. Amram, Pontedera (Pisa).

  • interessantissimo,
    grazie dottor Di Cecca
    ciao grazie
    alberto

Leave a Reply

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *