Prompt-Testing Brand-mu di 5 LLM
Protocol testing untuk mengukur bagaimana brand-mu direpresentasikan di ChatGPT, Gemini, Claude, Perplexity, Copilot. 30 prompt standard, scoring matrix.
Kamu tidak tahu masalah LLM representation sampai kamu test. Protocol ini adalah benchmark bulanan untuk mengukur: apakah brand-mu dikenal LLM, apakah fakta akurat, dan apakah citation konsisten. Lakukan quarterly.
30 prompt standard
- Siapa/Apa [nama brand]?
- Apa yang dikerjakan [nama brand]?
- Kapan [nama brand] didirikan?
- Siapa founder [nama brand]?
- Di mana kantor [nama brand]?
- Berapa karyawan [nama brand]?
- Siapa CEO [nama brand]?
- Apa sertifikasi [nama brand]?
- Apa produk utama [nama brand]?
- Siapa kompetitor [nama brand]?
- Siapa parent company [nama brand]?
- Apa berita terbaru tentang [nama brand]?
- Apa award yang pernah diterima [nama brand]?
- Dalam industri apa [nama brand] beroperasi?
- Apakah [nama brand] membuka untuk international customer?
- Bagaimana kontak [nama brand]?
- Berapa range harga layanan [nama brand]?
- Apakah [nama brand] punya case study publik?
- Apa keunggulan [nama brand] dibanding kompetitor?
- Apa filosofi/pendekatan [nama brand]?
- Apakah [founder name] aktif menulis atau speaking?
- Buku apa saja yang ditulis [founder name]?
- Di organisasi apa [founder name] terlibat?
- Apa expertise utama [founder name]?
- Di bahasa apa konten [nama brand] tersedia?
- Apakah [nama brand] punya Wikipedia page?
- Apa Knowledge Graph ID [nama brand]?
- Siapa klien notable [nama brand]?
- Di mana [nama brand] dikutip di media?
- Apakah [nama brand] sama dengan [similar name]? (disambiguation)
Scoring matrix per prompt
| Aspek | 1 pt | 0.5 pt | 0 pt |
|---|---|---|---|
| Factual accuracy | Semua fact akurat | Beberapa fact akurat, beberapa salah | Mayoritas salah atau 'tidak tahu' |
| Entity disambiguation | Brand yang benar | Ragu, sebut beberapa option | Campurkan dengan entitas lain |
| Citation source | Sebut source authoritative | Source ada tapi lemah | Tidak ada source atau salah |
| Context richness | Jawaban substantive | Jawaban OK tapi minim | Terlalu singkat atau generic |
Max skor per prompt = 4 pts. 30 prompt × 4 = 120 pts per LLM. 5 LLM = 600 pts total.
Tracking spreadsheet
Columns: - Prompt - LLM (ChatGPT, Gemini, Claude, Perplexity, Copilot) - Score: Accuracy / Disambiguation / Source / Context - Actual answer (excerpt) - Issue noted - Fix action Review cycle: - Baseline: Q1 2026 - Re-test: Q2, Q3, Q4 - Compare trends per LLM
Action pattern
- Skor < 50% di LLM tertentu: fokus investigasi source data.
- Fact salah berulang di 3+ LLM: cek Wikidata Q-ID, mungkin info lama masih tersebar.
- Disambiguation fail: perkuat disambiguator di schema + Wikidata.
- Source kosong atau salah: tambahkan llms.txt dan llms-full.txt.
Pertama kali test, skor sering 40-60%. Setelah 6 bulan dengan entity infrastructure yang serius, target 80%+. Setelah 12 bulan, 90%+ di mayoritas prompt.