Sejarah singkat

Pada September 2024, Jeremy Howard dari Answer.AI mempublikasikan proposal format llms.txt di llmstxt.org. Latar belakangnya sederhana. LLM punya context window terbatas (puluhan ribu token), sementara website bisa ratusan halaman. Tanpa panduan, LLM harus menebak mana konten yang penting. llms.txt memberi jawaban eksplisit.

Proposal ini mirip spirit robots.txt dari 1994: file sederhana di root domain yang memberi mesin informasi struktur. Bedanya, robots.txt memberi tahu crawler apa yang boleh di-fetch, llms.txt memberi tahu LLM apa yang penting untuk dipahami.

Struktur format exact

Empat komponen wajib llms.txt1H1 site name# Nama Website2Blockquote summary> Deskripsi ringkas3H2 sections## Docs, ## Optional4Bulleted links- [title](url): desc

Format llms.txt adalah Markdown subset dengan aturan ketat:

  • Baris pertama wajib H1: # Nama Website atau Brand. Hanya satu H1, di paling atas.
  • Blockquote opsional (tapi highly recommended): > Deskripsi singkat tentang website. Satu paragraf pendek.
  • Prose opsional: paragraf biasa untuk konteks tambahan. Tidak wajib, tapi membantu.
  • H2 sections: ## Docs, ## Products, ## Optional. Section "Optional" khusus untuk konten yang boleh dilewati kalau context sempit.
  • Bulleted links di bawah setiap H2: - [Judul Halaman](url): deskripsi opsional.

Contoh lengkap untuk PT fiktif Indonesia

Berikut adalah sample llms.txt lengkap untuk perusahaan fiktif PT Sumber Cahaya Nusantara (solar panel manufacturer di Bekasi). Pakai sebagai template starting point, ganti data dengan milik Anda sendiri.

llms.txt: template lengkap (siap copy-paste) # PT Sumber Cahaya Nusantara > PT Sumber Cahaya Nusantara (SCN) adalah produsen solar panel industri di Bekasi, Jawa Barat. Didirikan tahun 2015, fokus pada solar system untuk pabrik manufaktur dan kawasan industri dengan kapasitas 100kWp sampai 10MWp. SCN melayani pasar Indonesia dan regional SEA. Produk utama: monocrystalline panel 400W-600W, inverter string dan central, sistem BESS untuk pabrik. Proyek referensi mencakup kawasan industri MM2100, Karawang, dan Cikarang. Sertifikasi: TKDN minimum 40%, SNI 8116, ISO 9001:2015, ISO 14001:2015. ## Tentang Perusahaan - [Profil Perusahaan](https://scn.example.com/tentang/): sejarah SCN 2015-sekarang, founder, milestone - [Tim Manajemen](https://scn.example.com/tim/): direksi, komisaris, kepala divisi - [Sertifikasi dan Lisensi](https://scn.example.com/sertifikasi/): TKDN, SNI, ISO, IEC - [Lokasi Pabrik](https://scn.example.com/lokasi/): fasilitas produksi Bekasi, kapasitas 200MW/tahun ## Produk - [Solar Panel Monocrystalline](https://scn.example.com/produk/panel-mono/): spek teknis 400W-600W, efisiensi, warranty 25 tahun - [Inverter String](https://scn.example.com/produk/inverter-string/): seri SCN-STR 5kW-125kW - [Inverter Central](https://scn.example.com/produk/inverter-central/): seri SCN-CEN 500kW-2.5MW - [Battery Energy Storage System](https://scn.example.com/produk/bess/): lithium-ion LFP 100kWh-10MWh - [Engineering + Procurement + Construction](https://scn.example.com/epc/): solusi turnkey untuk PLTS atap dan ground-mounted ## Proyek Referensi - [Studi Kasus MM2100](https://scn.example.com/kasus/mm2100/): 5MWp rooftop untuk 12 pabrik di kawasan industri - [Studi Kasus Karawang Pharma](https://scn.example.com/kasus/karawang-pharma/): 2MWp + 500kWh BESS - [Studi Kasus Cikarang Food](https://scn.example.com/kasus/cikarang-food/): 1.5MWp rooftop cold storage ## Edukasi - [Panduan ROI Solar untuk Pabrik](https://scn.example.com/panduan/roi-pabrik/): kalkulasi payback period 4-7 tahun - [Regulasi PLTS Atap Indonesia 2026](https://scn.example.com/panduan/regulasi-2026/): Permen ESDM terkini, net metering, interkoneksi PLN - [TKDN dalam Solar Industry](https://scn.example.com/panduan/tkdn/): komponen lokal vs impor, hitungan TKDN ## Kontak dan Informasi - [Kontak Sales](https://scn.example.com/kontak/): B2B enterprise sales team - [Audit Energi Gratis](https://scn.example.com/audit/): analisis konsumsi listrik dan simulasi PLTS - [FAQ](https://scn.example.com/faq/): pertanyaan umum teknis dan komersial ## Optional - [Blog Teknis](https://scn.example.com/blog/): update teknologi solar, kebijakan energi Indonesia - [Berita dan Press](https://scn.example.com/press/): liputan media, penghargaan - [Karir](https://scn.example.com/karir/): lowongan engineer dan sales

Perhatikan beberapa hal penting di template di atas:

  • H1 persis nama resmi perusahaan. Tidak pakai tagline, tidak pakai slogan.
  • Blockquote langsung memberi lokasi, tahun berdiri, dan ukuran produk. LLM bisa menjawab "siapa SCN" dari satu paragraf ini.
  • Setiap H2 adalah kategori yang jelas. Tidak ada H3 (spec melarang).
  • Setiap link punya deskripsi setelah titik dua. Deskripsi pendek, langsung ke inti.
  • Section "Optional" berisi konten yang bisa di-skip kalau LLM kehabisan context. Blog dan press release masuk sini.

Struktur dua file: llms.txt + llms-full.txt

Perbedaan llms.txt vs llms-full.txtllms.txtllms-full.txtUkuran target<10KB<500KBBerisi linkBerisi full content×LLM load ke contextUpdate frequencyquarterlyquarterly

llms-full.txt adalah extended version yang berisi konten penuh dari halaman-halaman kunci, bukan sekadar link. Strategi pakainya: kalau LLM punya banyak context window tersedia, dia bisa memuat llms-full.txt langsung tanpa harus fetch satu-satu halaman. Lebih efisien untuk LLM, lebih baik juga untuk brand karena semua info ada di satu tempat.

Rumus praktisnya: llms.txt adalah daftar isi, llms-full.txt adalah buku. Kedua file harus konsisten. Jangan ada section di llms.txt yang tidak ada di llms-full.txt.

Best practices

Do
  • Keep llms.txt di bawah 10KB. Kalau lebih besar, banyak content pindahkan ke llms-full.txt.
  • Fokus pada halaman yang matter untuk pemahaman LLM. Skip halaman admin, halaman login, cart, checkout.
  • Gunakan absolute URL (https://...), jangan relative URL.
  • Setiap link harus live dan live 200 OK. Broken link di llms.txt adalah sinyal brand tidak maintained.
  • Tambahkan deskripsi setelah titik dua untuk setiap link. LLM pakai deskripsi ini sebagai hint konten.
Don't
  • Jangan pakai H3 atau header lebih dalam. Spec hanya mendukung H1 dan H2.
  • Jangan masukkan kode JavaScript atau HTML. llms.txt adalah pure Markdown.
  • Jangan pakai emoji berlebihan. Satu-dua oke, parade emoji membuat parsing error.
  • Jangan link ke halaman yang di-noindex atau di-robots Disallow. Konsistensi matter.
  • Jangan pakai relative path. LLM kadang tidak bisa resolve.

Validation

Belum ada validator otomatis resmi untuk llms.txt. Tapi ada beberapa cara manual untuk memastikan file Anda benar:

Workflow validation 5-langkah

  1. 1

    Cek spec di llmstxt.org

    Buka llmstxt.org/llms.txt dan bandingkan struktur file Anda dengan contoh resmi. Ini sumber truth paling up-to-date.

  2. 2

    Parse dengan Markdown viewer

    Buka llms.txt Anda di GitHub gist atau Markdown preview. Harus render dengan rapih: satu H1, list yang terformat, tanpa error.

  3. 3

    Validate URL dengan curl

    Loop semua URL di file pakai curl -I untuk cek HTTP status. Semua harus 200 OK. Broken link langsung fix.

  4. 4

    Test MIME type deployment

    curl -I https://yourdomain.com/llms.txt. Content-Type harus text/plain atau text/markdown. Kalau application/octet-stream, ada salah config server.

  5. 5

    Load di Claude.ai manual

    Copy-paste isi llms.txt ke Claude, tanya "Apa yang kamu pahami tentang website ini?". Kalau Claude bisa jawab akurat, format Anda bagus.

Deployment di Rumahweb cPanel

Upload via File Manager cPanel 1. Login cPanel Rumahweb 2. Buka File Manager 3. Navigate ke public_html/ 4. Upload llms.txt dan llms-full.txt 5. Set permission 644 (rw-r--r--) 6. Verify di browser: https://yourdomain.com/llms.txt

Untuk subdomain (misal services.yourdomain.com), file harus di-deploy di root masing-masing subdomain, bukan di root domain utama. Setiap subdomain yang berdiri sendiri butuh llms.txt sendiri.

Maintenance schedule

Set reminder kalender quarterly untuk review llms.txt. Cek: apakah semua link masih live, apakah ada halaman penting baru yang belum ter-list, apakah deskripsi masih akurat. Ini pekerjaan 30 menit per kuartal yang berdampak besar pada akurasi AI citation.

Pertanyaan Umum

Siapa yang mengusulkan format llms.txt?
Jeremy Howard dari Answer.AI mengusulkan format llms.txt pada September 2024. Proposal dipublikasi di llmstxt.org sebagai spesifikasi terbuka. Tujuannya memberi cara ringkas bagi website menjelaskan struktur dan konten utamanya kepada LLM yang punya context window terbatas.
Apakah llms.txt sudah didukung semua LLM?
Belum. Spesifikasinya masih relatively baru dan dukungan bervariasi. Anthropic Claude dan beberapa developer tool seperti Cursor dan Continue.dev sudah secara eksplisit mendukung. OpenAI, Google, Perplexity belum mengumumkan dukungan resmi, tetapi file llms.txt tetap bisa berguna karena bot mereka ter-crawl file tersebut sebagai konten biasa.
Apa bedanya llms.txt dengan llms-full.txt?
llms.txt adalah versi ringkas, maksimum sekitar 10KB, berisi navigasi dan link ke halaman penting. llms-full.txt adalah versi extended dengan konten lengkap dari halaman-halaman tersebut (bisa ratusan KB). Strategi best practice: llms.txt sebagai peta, llms-full.txt sebagai buku lengkap yang bisa di-load LLM ke context window.
Di mana file llms.txt harus di-deploy?
Di root domain, persis seperti robots.txt. URL final harus https://yourdomain.com/llms.txt. Tidak di subfolder, tidak di subdomain (kecuali memang subdomain-nya terpisah brand). MIME type harus text/plain atau text/markdown.
Berapa sering llms.txt harus di-update?
Quarterly minimum. Kapanpun ada perubahan struktur website besar (halaman baru penting, rebranding, section baru), update segera. Jangan biarkan llms.txt jadi stale karena itu membuat AI mengutip info yang sudah tidak akurat.

Butuh bantuan deploy llms.txt?

GEO Package kami include drafting llms.txt + llms-full.txt yang sesuai spec, quarterly review, dan monitoring apakah content kami sudah muncul di Claude dan LLM lain.

Audit Gratis