BAGAN BAGAIMANA
SEARCH ENGINE BEKERJA, SEHINGGA DAPAT MENEMUKAN SITUS YANG DICARI
1. Web Crawling, dimana dikenal juga dengan sebutan
spider. Pertama kali search engine harus mencari file dari databasenya sebelum
menampilkan alamatnya, dibantu dengan sebuah software khusus yaitu spider yang
dapat memilih informasi yang ada baik dalam memilih informasi yang ada baik
dalam ratusan juta halaman web sekalipun serta membuat daftar kata-kata didalam
database, proses inilah yang disebut dengan Web Crawling.
2. Indexing, dimana point ini bekerja menyimpan
index dari tiap-tiap file yang ditemukan beserta alamatnya. Selain itu dengan
proses index dapat juga mempercepat kerja sistem spidering untuk mencari file
dalam website yang paling banyak digunakan.
3. Searching, yang lebih kearah penyediaan
fasilitas bagi pengguna untuk mencari kata-kata atau kombinasi kata paling
relevan yang ditemukan dalam index tersebut.
Biasanya data tentang halaman web disimpan didalam
suatu index database untuk digunakan di query kemudiannya. Beberapa search
engine, seperti google, menyimpan semua atau sebagian dari halaman sumber (yang
disebut dengan cache) begitu juga dengan informasi mengenai halaman web.
Halaman yang cached ini selalu memegang pencarian teks karena halaman tersebut yang
terindex, sehingga dapat bermanfaat manakala isi dari halaman tersebut telah
diperbaharui dan halaman tersebut tidak lagi digunakan. Jika user datang dan menggunakan
search engine serta membuat query, dengan memberi kata kunci yang khas, search
engine akan melihat index dan memberikan suatu daftar halaman web yang terbaik
sesuai dengan kata kuncinya. Hampir semua search engine mendukung penggunaan
boolean operator seperti AND, OR, dan NOT untuk lebih mengspesifikasikan query
pencarian.
Tidak ada komentar:
Posting Komentar