Study Case Technical SEO: Penyebab 93% Halaman Website Tidak Muncul di Google

Padahal website sudah punya ratusan ribu halaman, tapi kok organic traffic-nya tetap segitu-gitu aja yah… hemm apa yang salah yah?

Jawabannya, bisa jadi meski sudah ter-index, Google tidak melihat halaman tersebut berkualitas, atau bisa juga Google tidak mengetahui halaman tersebut ada.

Coba kamu bayangin punya toko dengan 750 rak produk. Setiap rak ditata rapi, label harga jelas, packaging bagus. Tapi ternyata, dari 750 rak itu, cuma 52 yang bisa dilihat pengunjung. Sisanya? Tidak terlihat, susah dijangkau oleh orang dewasa dan masalah lainnya.

Kedengarannya absurd kan? Tapi ini bukan cerita fiktif.

Dari pengalaman kami mengaudit berbagai website berskala besar di Indonesia, terutama di industri yang memproduksi konten secara masif seperti job portal, e-commerce, dan property listing, kami sering menemukan pola yang sama: index rate yang sangat rendah.

Ada website yang punya ratusan ribu halaman, tapi yang benar-benar muncul di Google? Kurang dari 10%. Sisanya, lebih dari 90%, tidak terlihat oleh siapapun yang mencari lewat Google.

Dan ini bukan website abal-abal. Ini platform dengan ratusan ribu user, tim teknis yang cakap, dan konten yang terus di-publish setiap hari. Masalahnya bukan di kualitas tim, tapi di hal-hal yang sering luput dari perhatian.

“Banyak Halaman” Bukan Berarti “Banyak Traffic”

Ada miskonsepsi yang masih sering kami temui saat ngobrol dengan business owners, “Website kami sudah punya ribuan halaman konten, harusnya traffic naik dong?”

Sayangnya, tidak sesederhana itu.

Google punya proses sebelum menampilkan halaman di hasil pencarian. Pertama, Google harus menemukan halaman tersebut (discovery). Kedua, Google harus mengunjungi dan membaca isinya (crawl). Ketiga, Google harus menilai apakah halaman itu layak ditampilkan (index).

Masalahnya, Google punya batas waktu dan sumber daya untuk setiap website. Istilah teknisnya “crawl budget.” Kalau website kamu punya ratusan ribu halaman tapi Google hanya “mau” memproses sebagian kecil, maka mayoritas kontenmu tidak akan pernah muncul di pencarian.

Pertanyaannya, kenapa Google memilih untuk mengabaikan sebagian besar halaman?

Berdasarkan pengalaman kami menangani berbagai kasus, ada 4 penyebab utama yang paling sering kami temui.

Penyebab #1: Konten Duplikat yang Tidak Disadari

Ini temuan yang paling sering bikin kaget pemilik website.

Pola yang kami temui: ada satu entitas (bisa employer, seller, atau advertiser) yang publish konten yang sama berkali-kali dengan URL berbeda. Judulnya sama, deskripsinya copy paste, bahkan detailnya identik. Bedanya cuma ID atau waktu posting.

Dari perspektif Google, ini adalah beberapa halaman dengan konten yang sama persis. Google tidak akan menampilkan semuanya, sehingga Google pilih salah satu, dan sisanya ditandai sebagai duplikat lalu ditolak dari index.

Satu kasus mungkin terdengar sepele. Tapi ketika pola ini terjadi ribuan kali, dampaknya masif. Kami pernah menemukan website yang punya puluhan ribu halaman masuk kategori duplikat. Itu puluhan ribu halaman yang seharusnya bisa mendatangkan traffic, tapi justru “memakan” resources Google tanpa hasil.

Penyebab #2: Satu Konten, Banyak Variasi, Tapi Isinya Sama

Penyebab kedua ini lebih halus dan lebih sulit dideteksi.

Contoh klasiknya: satu perusahaan buka posisi yang sama di belasan kota berbeda. Atau satu seller listing produk yang sama di puluhan kategori. Sekilas terlihat wajar. Tapi ketika isi halamannya dibandingkan satu per satu, deskripsi, spesifikasi, bahkan copywriting-nya copy paste. Satu-satunya yang berbeda cuma satu field kecil seperti nama kota atau nama kategori.

Dari sudut pandang Google, halaman-halaman ini pada dasarnya adalah konten yang sama. Google kemudian harus memilih: mana yang layak di-index?

Dan yang menarik dari temuan kami, Google sering pakai external signals seperti backlink sebagai tiebreaker. Halaman yang kebetulan punya backlink dari website lain akan di-index. Sisanya? Ditolak semua.

Jadi kalau kamu punya strategi konten yang mengandalkan variasi lokasi atau kategori tanpa memperkaya isi kontennya, kemungkinan besar Google hanya akan memilih satu dan mengabaikan sisanya.

Penyebab #3: Konten Expired yang Masih Gentayangan

Ini klasik tapi masih sering terjadi.

Banyak website punya konten dengan tanggal kedaluwarsa: lowongan kerja, promo, event, flash sale. Setelah lewat tanggal itu, halaman tidak relevan lagi. Tapi di banyak website yang kami audit, halaman-halaman expired ini masih bisa diakses, masih return status 200 (OK), dan yang lebih parah, masih terdaftar di sitemap.

Artinya? Google masih menghabiskan waktu untuk mengunjungi halaman-halaman yang sudah tidak berguna. Crawl budget yang seharusnya bisa digunakan untuk memproses halaman baru, justru terbuang untuk halaman mati.

Dari pengalaman kami, persentase crawl requests yang gagal atau terbuang untuk halaman expired bisa mencapai 5-10% dari total crawl budget. Kedengarannya kecil, tapi kalau total crawl requests kamu ratusan ribu per hari, itu artinya puluhan ribu request yang sia-sia setiap harinya.

Sebenarnya halaman yang sudah expired gak masalah tetap aktif, tapi sebaiknya diubah jadi noindex dan tampilkan rekomendasi konten sejenis atau yang relevan supaya user tidak mentok di halaman mati.

Penyebab #4: Sitemap yang Tidak Berfungsi Sebagaimana Mestinya

Sitemap itu ibarat peta yang kamu kasih ke Google. “Ini loh halaman-halaman penting di website saya, tolong dong dikunjungi.”

Tapi di banyak website yang kami audit, sitemap-nya bermasalah di beberapa level. Pertama, coverage-nya sangat rendah, kadang kurang dari 5% dari total halaman. Kedua, semua URL di sitemap punya tanggal last modified yang sama persis, padahal seharusnya setiap halaman punya tanggal update yang berbeda. Google secara eksplisit mengatakan bahwa mereka mengabaikan lastmod yang tidak akurat. Ketiga, halaman expired masih tercantum di sitemap.

Dan yang paling ironis, kami sering menemukan kasus di mana URL yang sudah ada di sitemap pun ditandai “No referring sitemaps detected” oleh Google Search Console. Artinya Google tidak mengenali bahwa URL tersebut ada di sitemap, bisa karena sitemap index-nya tidak ter-update atau ada masalah teknis lainnya.

Bayangkan kamu kasih peta ke kurir, tapi petanya sudah sobek, alamatnya tidak update, dan separuh lokasinya sudah tutup. Kurir akan frustrasi dan akhirnya cuma kirim ke alamat yang dia sudah hafal.

Lalu, Apa yang Harus Dilakukan?

Dari pengalaman kami menangani berbagai kasus, ada beberapa prinsip yang berlaku untuk semua website dengan skala besar.

Pertama, audit index coverage secara berkala. Jangan hanya melihat berapa halaman yang kamu punya, tapi lihat berapa yang benar-benar ter-index. Angka ini tersedia gratis di Google Search Console.

Kedua, pastikan setiap halaman punya nilai unik. Kalau kamu punya 10 halaman dengan konten yang hampir sama, Google hanya akan pilih satu. Lebih baik punya 1 halaman yang komprehensif daripada 10 halaman yang tipis.

Ketiga, bersihkan konten expired. Halaman yang sudah tidak relevan harus dihapus dari sitemap dan diberi sinyal yang jelas ke Google (misalnya status 410 Gone atau noindex).

Keempat, perlakukan sitemap sebagai aset strategis, bukan file teknis yang di-generate sekali lalu dilupakan. Sitemap harus dinamis, akurat, dan hanya berisi halaman yang benar-benar layak di-index.

Ini Bukan Masalah Langka

Kalau kamu baca sampai sini dan merasa “kayaknya website saya juga gitu deh,” kamu tidak sendirian. Kami sering menemukan pola serupa di berbagai industri, terutama di website dengan konten yang di-generate secara otomatis atau dalam jumlah besar: e-commerce, job portal, listing property, bahkan media.

Kabar baiknya, masalah ini bisa diperbaiki. Dari berbagai kasus yang kami tangani, target realistis adalah menaikkan index rate 2-3x lipat dalam 3-6 bulan pertama setelah implementasi perbaikan.

Kalau kamu penasaran berapa index rate website kamu saat ini, atau merasa organic traffic tidak sebanding dengan jumlah konten yang kamu punya, kami di Apookat bisa bantu audit dan identifikasi masalahnya. Karena kadang, masalah terbesarnya bukan di konten yang kurang, tapi di konten yang tidak terlihat.

Apookat adalah creative agency yang berfokus pada growth business melalui SEO. Kami membantu bisnis menemukan dan memperbaiki hambatan teknis yang menghalangi pertumbuhan organic mereka.

Artikel terkait

Duplicate Content Diam-Diam Membunuh SEO Kamu

Waktu Membaca: 5:28 menit

Kalau konten kamu sering ditolak Google, itu bukan karena kualitasnya yang jelek, bisa jadi si Google nganggep konten kamu “barang yang sama” dengan halaman lain di website kamu sendiri. Pernah…

Baca artikel

Crawl Budget: Kenapa Google Tidak Mau Mengunjungi Semua Halaman Website Kamu

Waktu Membaca: 6:11 menit

Suka kesel gak sih udah capek-capek bikin puluhan bahkan hingga ratusan artikel, tapi kok ketika di cari di google gak ada, eh bahkan bukan gak ada, ke index ajah kaga.…

Baca artikel
Studi Kasus GEO: Brand Custom Jersey Mana yang Paling Sering Muncul di ChatGPT? (Fokus Kata Kunci Custom Jersey Cimahi)

Studi Kasus GEO: Brand Custom Jersey Mana yang Paling Sering Muncul di ChatGPT? (Fokus Kata Kunci Custom Jersey Cimahi)

Waktu Membaca: 7:13 menit

Ketika Calon Pelanggan Tidak Lagi Buka Google Ada perubahan perilaku pencarian yang diam-diam sedang terjadi dan dan masih banyak bisnis lokal yang belum sadar. Orang-orang kini bertanya langsung ke ChatGPT…

Baca artikel

Silakan berkomentar