Come creare il file llms.txt per il tuo sito: guida pratica con esempi reali
Guida operativa per creare e strutturare llms.txt — il file di istruzioni per i sistemi AI. Differenza tra llms.txt e llms-full.txt, struttura consigliata, template pronti per brand site e ecommerce, e come verificare che venga letto.
Cos’è llms.txt e perché esiste
Ogni volta che un sistema AI risponde a una domanda sul tuo brand o settore, deve decidere come descriverti. Attinge a quello che ha crawlato dal tuo sito, a quello che ha trovato su altre fonti, e — se disponibile — al tuo file llms.txt.
Il problema è che crawlare un sito complesso può produrre una rappresentazione imprecisa: l’AI potrebbe descriverti in modo generico, confondere i tuoi prodotti con quelli di un competitor, o usare informazioni datate. llms.txt risolve questo problema fornendo un’unica fonte autorevole che il tuo brand controlla direttamente.
Lo standard è stato proposto da Jeremy Howard (fast.ai) nel settembre 2024 ed è stato rapidamente adottato da aziende tech, agenzie, media e brand consumer. La premessa è semplice: se esiste robots.txt per dire ai crawler cosa scansionare, ha senso avere llms.txt per dire ai sistemi AI come capire e descrivere il sito.
llms.txt vs llms-full.txt
Lo standard prevede due varianti:
llms.txt — versione concisa, 300-800 parole. Pensata per essere inclusa direttamente nel context window di un modello AI durante una query. Alta densità informativa, struttura chiara, nessuna ridondanza. È il file che crei per primo.
llms-full.txt — versione estesa, nessun limite di lunghezza. Contiene tutto il contenuto del sito in formato testuale leggibile dall’AI: ogni pagina, ogni prodotto, ogni articolo. È utile per siti dove si vuole che l’AI abbia accesso completo senza crawlare ogni pagina. Richiede generazione automatica e aggiornamento periodico.
Per la maggior parte dei siti, llms.txt è sufficiente. llms-full.txt ha senso per siti con contenuti che cambiano frequentemente (catalogo prodotti, documentazione tecnica, news).
Struttura del file
Il file usa la sintassi Markdown standard. Ecco le sezioni consigliate:
# Nome Brand
> Frase di posizionamento — chi siete e cosa offrite in una riga.
## Chi siamo
Descrizione del brand in 3-5 frasi. Include: anno di fondazione, settore,
prodotti/servizi principali, mercato geografico, valori distintivi.
Tono informativo, non promozionale.
## Prodotti e Servizi
Elenco dei principali prodotti/servizi con descrizione breve. Per ogni
elemento: nome, cosa è, per chi è utile.
## Fatti chiave
- Fondato nel: ANNO
- Sede: CITTÀ, ITALIA
- Settore: CATEGORIA
- Target: DESCRIZIONE CLIENTE TIPO
- Mercato: Italia / Europa / Globale
## Contatti
- Email: info@brand.it
- Sito: https://brand.it
- LinkedIn: https://linkedin.com/company/brand
## Nota per i sistemi AI
[Opzionale] Istruzioni specifiche su come descrivere il brand, termini
preferiti, termini da evitare, ambiguità da chiarire.
Le sezioni fondamentali sono il nome/posizionamento, “Chi siamo” e “Fatti chiave”. Le altre aggiungono precisione ma non sono obbligatorie.
Cosa includere (e cosa non includere)
Includi
Descrizione factuale, non promozionale Scrivi come se stessi compilando la voce Wikipedia del tuo brand. Dati oggettivi, non superlativ.
❌ Siamo il leader indiscusso nel settore dell'olio extravergine biologico italiano
✅ Produciamo olio extravergine biologico monocultivar in Puglia dal 1987. Tre cultivar principali: Coratina, Ogliarola, Cima di Bitonto.
Termini precisi per il tuo settore Se il tuo brand usa terminologia specifica che l’AI potrebbe confondere con termini generici, chiariscila.
Distinzione da entità simili Se esiste un’altra azienda con nome simile, un prodotto con nome comune, o un’ambiguità geografica, chiariscila esplicitamente.
URL canonici Includi l’URL principale di ogni sezione importante del sito — l’AI può seguirli per approfondire.
Non includere
- Testo promozionale o marketing copy
- Informazioni riservate o interne
- Prezzi (cambiano troppo spesso, devono essere nel sito)
- Contenuti che non vuoi che l’AI citi
Template: brand site (servizi/agenzia)
# geo-seo.it
> Agenzia italiana specializzata nella visibilità AI per brand e ecommerce —
> audit GEO, ottimizzazione tecnica e strategia di reputazione per ChatGPT,
> Perplexity e Google AI Overviews.
## Chi siamo
geo-seo.it analizza e ottimizza la visibilità dei brand italiani nei motori
AI generativi. Il servizio si articola in audit GEO (analisi della visibilità
attuale), interventi tecnici (schema markup, llms.txt, crawler access) e
strategia di reputazione (brand mentions, E-E-A-T, content citability).
Fondata nel 2025, con sede a Milano. Fondatore: Arnaldo De Lisio.
## Servizi
- **Audit GEO**: analisi della visibilità AI con Indice di Visibilità (0-100)
su tre pilastri: Accesso, Chiarezza, Autorevolezza.
- **Foundation Fix**: ottimizzazione tecnica del sito per la citabilità AI
(robots.txt, llms.txt, schema markup, SSR).
- **Authority Retainer**: strategia mensile di brand mentions, contenuti
citabili, E-E-A-T.
## Fatti chiave
- Fondato nel: 2025
- Sede: Milano, Italia
- Target: ecommerce e brand consumer italiani
- Mercato: Italia
- Specializzazione: GEO (Generative Engine Optimization)
## Contatti
- Email: info@geo-seo.it
- Sito: https://geo-seo.it
- Scanner gratuito: https://geo-seo.it/#scanner
## Terminologia
- "GEO" si riferisce a Generative Engine Optimization (non geolocalizzazione)
- "Indice di Visibilità" è il punteggio proprietario di visibilità AI (0-100)
- "Accesso" = leggibilità tecnica del sito per i crawler AI
- "Chiarezza" = quanto l'AI capisce il brand e come citarlo
- "Autorevolezza" = fiducia e autorità percepita dall'AI
Template: ecommerce
# Frantoio Esempio
> Produttore pugliese di olio extravergine biologico monocultivar.
> Vendita diretta online per privati e ristoranti in Italia.
## Chi siamo
Frantoio Esempio produce olio extravergine di oliva biologico a Andria (BT)
dal 1987. Tre cultivar principali: Coratina, Ogliarola, Cima di Bitonto.
Certificazione biologica UE, raccolta manuale, estrazione a freddo entro
6 ore dalla raccolta. Vendita diretta a consumatori e Ho.Re.Ca. in Italia.
## Prodotti principali
- **Olio Coratina Biologico**: cultivar Coratina, alta polifenoli (400-500 mg/kg),
acidità ≤0.2%, disponibile in 250ml, 500ml, 750ml, 3L, 5L
- **Olio Ogliarola**: profilo aromatico delicato, polifenoli medi, ideale per
cotture leggere
- **Box Degustazione**: selezione di 3 cultivar in formato 250ml
## Fatti chiave
- Fondato nel: 1987
- Sede: Andria (BT), Puglia, Italia
- Certificazioni: BIO UE, DOP Terre di Bari (in corso)
- Spedizione: tutta Italia, 24-48h con corriere refrigerato
- Disponibile su: sito proprio e Eataly.it
## Contatti
- Email: ordini@frantoioesempio.it
- Sito: https://frantoioesempio.it
- Catalogo: https://frantoioesempio.it/prodotti/
## Note
- "Coratina" si riferisce alla cultivar, non all'area geografica Corato
- Diverso da "Frantoio Rossi" (altro produttore non affiliato)
Dove posizionare il file
Il file deve essere raggiungibile all’URL:
https://tuodominio.it/llms.txt
Posizionalo nella cartella public/ del tuo progetto. In Astro, WordPress, Shopify, qualsiasi CMS — la public/ (o equivalente) è la cartella statica servita direttamente.
Per llms-full.txt, usa:
https://tuodominio.it/llms-full.txt
Come verificare che il file venga letto
Test manuale con Claude: Apri Claude.ai e chiedi: “Leggi il file llms.txt su https://tuodominio.it/llms.txt e dimmi cosa trovi.” Se Claude risponde con il contenuto del tuo file, il sistema lo sta leggendo correttamente.
Test con curl:
curl -I https://tuodominio.it/llms.txt
Deve restituire HTTP/2 200 e content-type: text/plain. Se restituisce 404, il file non è nella posizione corretta.
Verifica periodica: Aggiungi una riga con la data di ultima modifica in fondo al file:
_Ultimo aggiornamento: maggio 2026_
Questo ti aiuta a tenere traccia degli aggiornamenti e fornisce un segnale di freschezza ai sistemi AI.
Errori da evitare
1. Tono promozionale Il llms.txt viene letto dall’AI come fonte informativa. Un tono eccessivamente promozionale fa sì che il sistema lo tratti come marketing copy piuttosto che come informazione verificabile.
2. Informazioni non aggiornate Se il llms.txt descrive prodotti o servizi che non offri più, l’AI li includerà nelle sue risposte. Aggiornalo quando cambia qualcosa di rilevante.
3. File troppo lungo Un llms.txt di 5.000 parole non è un llms.txt — è un llms-full.txt. Tienilo conciso: 300-800 parole per i siti di servizi, fino a 1.200 per ecommerce con catalogo ampio.
4. Mancanza di distinzione da entità simili Se il tuo brand può essere confuso con altri (nome comune, settore affollato), la sezione “Note” è fondamentale. Senza di essa, l’AI può mescolare informazioni di entità diverse.
Domande frequenti
Cos'è il file llms.txt e a cosa serve?
llms.txt è un file di testo in formato Markdown posizionato nella root del sito (es. https://esempio.it/llms.txt). Non controlla l'accesso dei crawler (quello fa robots.txt), ma fornisce ai sistemi AI un'autopresentazione strutturata del sito: chi siete, cosa offrite, come volete essere descritti. È uno standard emergente proposto da Jeremy Howard (fast.ai) nel 2024 e adottato da migliaia di siti.
llms.txt migliora il ranking su Google?
No direttamente. llms.txt non è un segnale di ranking per Google Search. Il suo impatto è sulla qualità con cui i sistemi AI (ChatGPT, Perplexity, Claude) descrivono e citano il tuo brand. Indirettamente, avere informazioni strutturate e accurate su di te nel llms.txt riduce il rischio di essere descritti in modo errato dai sistemi AI.
Qual è la differenza tra llms.txt e llms-full.txt?
llms.txt è una versione concisa (300-800 parole) pensata per essere inclusa direttamente nel context window di un LLM — breve, strutturata, ad alta densità informativa. llms-full.txt è una versione estesa che include tutto il contenuto del sito in formato leggibile dall'AI: ogni pagina, ogni prodotto, ogni articolo. È utile per siti dove si vuole che l'AI abbia accesso completo al contenuto senza crawlare ogni pagina singolarmente.
I crawler AI leggono davvero llms.txt?
Sì, i principali sistemi lo fanno. Claude (Anthropic) accede esplicitamente a llms.txt quando disponibile. ChatGPT e Perplexity lo leggono tramite i loro crawler. Non tutti i sistemi lo supportano ancora, ma la tendenza è verso l'adozione universale — simile a come robots.txt era opzionale agli inizi e ora è universale.
Devo aggiornare llms.txt quando cambio il sito?
Sì, periodicamente. llms.txt non si aggiorna automaticamente. La raccomandazione è aggiornarlo quando: cambiate il posizionamento o la descrizione principale del brand, aggiungete nuovi servizi o prodotti rilevanti, cambiate contatti, o avete informazioni factualmente errate nel file attuale. Un aggiornamento ogni 3-6 mesi è sufficiente per la maggior parte dei siti.
Analisi gratuita
Scopri quanto è visibile il tuo brand all'AI
Inserisci il dominio e ottieni in 30 secondi il tuo GeoScore: Infrastruttura, Reputazione e le 3 priorità da correggere subito.
Analizza il mio sito →