Kamu tidak tahu masalah LLM representation sampai kamu test. Protocol ini adalah benchmark bulanan untuk mengukur: apakah brand-mu dikenal LLM, apakah fakta akurat, dan apakah citation konsisten. Lakukan quarterly.

30 prompt standard

Siapa/Apa [nama brand]?
Apa yang dikerjakan [nama brand]?
Kapan [nama brand] didirikan?
Siapa founder [nama brand]?
Di mana kantor [nama brand]?
Berapa karyawan [nama brand]?
Siapa CEO [nama brand]?
Apa sertifikasi [nama brand]?
Apa produk utama [nama brand]?
Siapa kompetitor [nama brand]?
Siapa parent company [nama brand]?
Apa berita terbaru tentang [nama brand]?
Apa award yang pernah diterima [nama brand]?
Dalam industri apa [nama brand] beroperasi?
Apakah [nama brand] membuka untuk international customer?
Bagaimana kontak [nama brand]?
Berapa range harga layanan [nama brand]?
Apakah [nama brand] punya case study publik?
Apa keunggulan [nama brand] dibanding kompetitor?
Apa filosofi/pendekatan [nama brand]?
Apakah [founder name] aktif menulis atau speaking?
Buku apa saja yang ditulis [founder name]?
Di organisasi apa [founder name] terlibat?
Apa expertise utama [founder name]?
Di bahasa apa konten [nama brand] tersedia?
Apakah [nama brand] punya Wikipedia page?
Apa Knowledge Graph ID [nama brand]?
Siapa klien notable [nama brand]?
Di mana [nama brand] dikutip di media?
Apakah [nama brand] sama dengan [similar name]? (disambiguation)

Scoring matrix per prompt

Aspek	1 pt	0.5 pt	0 pt
Factual accuracy	Semua fact akurat	Beberapa fact akurat, beberapa salah	Mayoritas salah atau 'tidak tahu'
Entity disambiguation	Brand yang benar	Ragu, sebut beberapa option	Campurkan dengan entitas lain
Citation source	Sebut source authoritative	Source ada tapi lemah	Tidak ada source atau salah
Context richness	Jawaban substantive	Jawaban OK tapi minim	Terlalu singkat atau generic

Max skor per prompt = 4 pts. 30 prompt × 4 = 120 pts per LLM. 5 LLM = 600 pts total.

Tracking spreadsheet

Columns:
- Prompt
- LLM (ChatGPT, Gemini, Claude, Perplexity, Copilot)
- Score: Accuracy / Disambiguation / Source / Context
- Actual answer (excerpt)
- Issue noted
- Fix action

Review cycle:
- Baseline: Q1 2026
- Re-test: Q2, Q3, Q4
- Compare trends per LLM

Action pattern

Skor < 50% di LLM tertentu: fokus investigasi source data.
Fact salah berulang di 3+ LLM: cek Wikidata Q-ID, mungkin info lama masih tersebar.
Disambiguation fail: perkuat disambiguator di schema + Wikidata.
Source kosong atau salah: tambahkan llms.txt dan llms-full.txt.

Quick win

Pertama kali test, skor sering 40-60%. Setelah 6 bulan dengan entity infrastructure yang serius, target 80%+. Setelah 12 bulan, 90%+ di mayoritas prompt.

30 prompt standard

Scoring matrix per prompt

Tracking spreadsheet

Action pattern

Playbook terkait

llms.txt: Spesifikasi Lengkap dan Implementasi

Schema untuk Generative Engine Optimization (GEO)

AI Crawler Whitelist: Yang Wajib Diperbolehkan