Menggunakan mesin pencari
Cara kerja mesin pencari
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak
halaman web, yang diambil langsung dari WWW. Halaman-halaman ini
diambil dengan web crawler — browser web otomatis yang mengikuti setiap
pranala/link yang dilihatnya. Isi setiap halaman lalu dianalisis untuk
menentukan cara indeks-nya (misalnya, kata-kata diambil dari judul,
subjudul, atau field khusus yang disebut meta tag). Data tentang halaman
web disimpan dalam sebuah database indeks untuk digunakan dalam
pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan
seluruh atau sebagian halaman sumber (yang disebut cache) maupun
informasi tentang halaman web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan dan memberikan
informasi hasil pencarian berupa pranala yang merujuk pada file, seperti
file audio, file video, gambar, foto dan sebagainya, serta informasi
tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya
yang semakin terus berkembang sesuai dengan perkembangan teknologi
informasi.
Ketika seseorang mengunjungi mesin pencari dan memasukkan query,
biasanya dengan memasukkan kata kunci, mesin mencari indeks dan
memberikan daftar halaman web yang paling sesuai dengan kriterianya,
biasanya disertai ringkasan singkat mengenai judul dokumen dan
kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin pencari real-time, seperti Orase.
Mesin seperti ini tidak menggunakan indeks. Informasi yang diperlukan
mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika
dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin
seperti Google, sistem real-time ini unggul dalam beberapa hal:
informasi selalu mutakhir, (hampir) tak ada pranala mati, dan lebih
sedikit sumber daya sistem yang diperlukan. (Google menggunakan hampir
100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya:
pencarian lebih lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi hasil-hasil yang
diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung
suatu kata atau frasa, sebagian halaman mungkin lebih relevan, populer,
atau autoritatif daripada yang lain. Kebanyakan mesin pencari
menggunakan berbagai metode untuk menentukan peringkat hasil pencarian
agar mampu memberikan hasil "terbaik" lebih dahulu. Cara mesin
menentukan halaman mana yang paling sesuai, dan urutan halaman-halaman
itu diperlihatkan, sangat bervariasi. Metode-metode nya juga berubah
seiring waktu dengan berubahnya penggunaan internet dan berevolusinya
teknik-teknik baru.
Sebagian besar mesin pencari web adalah usaha komersial yang didukung
pemasukan iklan dan karenanya sebagian menjalankan praktik
kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka
diberi peringkat lebih tinggi dalam hasil pencarian.
Pentingnya mesin pencari optimasi
Salah satu alasan yang menyebabkan diperlukan mesin pencari optimasi
adalah karena ada banyak World Wide Web Wanderer yang sudah ada, dan
akan terus bertambah di setiap bulannya.
Sebagai Contoh, seseorang mempunyai World Wide Web Wanderer untuk
menjual produk pertanian maka di Indonesia akan ada puluhan atau ratusan
Website sejenis. Sementara itu, jika ingin melihat segmen dunia maka
akan lebih banyak lagi jumlahnya. Untuk itu, dengan menempatkan posisi
di tingkat ada dalam hasil pencarian maka akan membuat website pengguna
tersebut ibarat toko strategis yang terletak di tepi jalan besar. Dengan
SEO yang bagus maka kemungkinan website anda dikunjungi oleh orang lain
akan lebih besar.
Dengan Kaidah SEO yang bagus, website menggunakan lebih jelas atau
keluhan sehingga akan lebih diperhatikan oleh mesin pencari. itulah inti
dari SEO, yaitu untuk membuat website anda diperhatikan oleh mesin
pencari.
Pencarian
Proses Pencarian
Melakukan pencarian dokumen yang dimuat pada suatu situs bisa begitu
mudah dan kelihatannya mungkin sulit juga. apalagi mengignat begitu
menyebarnya informasi dimana-mana, bahkan University of Calofornia
menyebutkan saat ini telah terdapat lebih dari 50 miliar halaman web di
internet, meskipun tidak ada ada satupun yang benar-benar tahu jumlah
persisnya.
kesulitan yang mungkin terjadi adalah karena WWW tersebut tidak terdata
dalam bentuk yang terstandardisasi isinya. tidak sama halnya dengan
katalog yang ada di perpustakaan, yang memiliki standardisasi secara
mendunia berdasarkan subjek dari judul buku, meskipun jumlahnya juga
tidak sedikit.
Dalam pencarian di web, pengguna selalu memperkirakan kata apa yang di
kira-kira terdapat pada halaman yang ingin anda temukan. atau kira-kira
apa subjek yang dipilih oleh seseorang untuk mengelolah halaman situs
yang mereka kelola, topik apa saja kira-kira yang di bahas.
Jika pengguna melakukan apa yang dikenal dengan pencarian pada halaman
web, sebenarnya tidaklah melakukan pencarian. tidak mungkin melakukan
pencarian di WWW secara langsung.
Pada web benar-benar terdiri dari banyak sekali halaman web yang ingin
disimpan dari berbagai server diseluruh dunia. Komputer pengguna tidak
langsung melakukan pencarian kepada seluruh komputer tersebut secara
langsung.
Apa yang mungkin pengguna lakukan hanyalah melalui komputer untuk
mengakses satu atau lebih perantara yang disebut dengan alat bantu
pencarian yang ada saat ini. Melakukan pencarian pada alat bantu itu
tadi ke database yang dimiliki. data base tersebut mengkoleksi
situs-situs yang ditemukan dan simpan.
alat bantu pencarian ini menyediakan hasil pencarian dalam bentuk
hypertext link dengan URL menuju halaman lainnya. ketika anda klik link
ini, dan menuju ke alamat tersebut maka dokumen, gambar, suara dan
banyak lagi bentuk lainnya yang ada pada server tersebut disediakan,
sesuai dengan informasi yang terdapat di dalamnya. layanan ini bisa
menjangkau ke manapun di seluruh dunia.
Tidak mungkin seseorang untuk melakukan pencarian ke seluruh komputer
yang terhubung internet ini, atau bahkan alat bantu pencarian yang
mengklaim bahwa melakukannya, tidak benar.
Kategori Alat Pencari
Saat ini, tiga bentuk dari alat bantu pencarian ini. Menggunakan
strategi yang berbeda untuk memanfaatkan kemampuan potensial dari
masing-masing nya, yaitu
Mesin Pencari dan Mesin Pencari-meta
Karakteristik:
Menyimpan data dalam bentuk teks penuh pada halaman yang terpilih,
Pencarian berdasarkan kata kunci, mereka mencoba mencocokkan dengan
tepat kata kunci tersebut dengan teks yang ada dalam dokumen,
Tidak perlu dilakukan browsing, dan tidak ada subjek dari kategori,
Database dijaring dan dikumpulkan oleh spidr, yaitu komputer yang
memiliki program robot, dengan kemampuan seminimal mungkin dari
pandangan atau sentuhan manusia,
Ukuran search engine:dari skala kecil hingga mampu menyimpan sangat
banyak (sekitar hingga 20 miliar halaman web).
Meta-search engine dengan cepat melakukan pencarian ke dalam
beberapa data base dari berbagai search engine dalam satu kali
permintaan. hasilnya adalah daftar yang hasilnya dan penggabungan hasil
pencarian dari beberapa mesin pencari yang mereka libatkan. Contoh :
Search engine: Google, Yahoo Search, Ask.com. Meta-Search : Dogpile,
Copernic, dan lainnya.
Subject Directories
Karakteristik :
Seleksi dari situs yang ada merupakan seleksi langsung yang
dilakukan oleh manusia, kadang kala para ahli untuk subjek tertentu,
Sering dengan hati-hati dievaluasi dan menjaga keterbaruan informasi
yang mereka miliki, namun tidak selalu, kadang-kadang tidak, terutama
untuk mereka yang telah memiliki data yang banyak dan bersifat general,
Biasanya dikelola dalam bentuk subjek dan direktori yang tersusun
secara hirarki,
Sering dilengkapi dengan catatan mengenai deskripsinya ( tidak untuk
Yahoo),
Subjek dapat di-browse subjek dan kategorinya atau melakukan
pencarian berdasarkan kata-kata tertentu,
Dokumen yang tidak penuh teks. pencarian diminta lebih spesifik
dibandingkan dengan pencarian melalui mesin pencari, karena kata kunci
tidak bisa dibandingkan dengan isi dari halaman suatu situs, melainkan
hanya pada subjek, kategori-kategori, dan deskripsi.
Terdapat ribuan atau bahkan lebih subjek direktori dalam praktek dan
kenyataannya apa saja yang dipikirkan di sana.
Specialized Databade (Invisible Web)
Karakteristik :
Merupakan web yang menyediakan akses melalui suatu kotak pencarian
ke dalam isi database pada sebuah komputer di suatu tempat,
Dapat saja berubah berbagai topik, dapat pula juga hal yang
komersial, pekerjaan yang spesifik, pemerintahan, dll
Juga terdiri dari banyak halaman yang menghasilkan hasil pencarian
dari katalog direktori online.
Prinsip Umum Dari mesin pencari
Sistem kinerja mesin ini ada beberapa hal yang perlu di perhatikan
terutama keterkaitannya dengan masalah arsitekrut dan mekanismenya.
Spider
Merupakan program yang men-download halaman-halaman yang mereka temukan,
mirip dengan browser. Perbedannya adalah bahwa browser menapilkan
secara langsung informasi yang ada (baik tekas, gambar, dll). Untuk
kepentingan manusia yang menggunakannya pada saat itu, sedangkan spider
tidak melakukan untuk menampilkan dalam bentuk yang terlihat seperti
itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia,
spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah
untuk mengambil halaman-halaman yang dikunjunginya untuk disimpan
kedalam database yang dimiliki oleh search engine.
Crawler
Merupakan program yang dimiliki search engine untuk melacak dan
menemukan link yang terdapat dari setiap halaman yang ditemuinya.
Tugasnya adalah untuk menentukan spoder harus pergi kemana dan
mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler
mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh
search engine.
Indexer
Komponen ini melakukan aktifitas untuk menguraikan masing-masing halaman
dan meneliti berbagai unsur, seperti teks, headers, struktur atau fitur
dari gaya penulisan, tag HTML khusus, dll.
Database
Merupakan tempat standar untuk menyimpan data-data dari halaman yang
telah dikunjungi, di-download dan sudah dianalisis. kadang kala disebut
juga dengan index dari suatu search engine.
Result Engine
Mesin yang melakukan penggolongan dan penentuan peringkat dari hasil
pencarian pada search engine. Mesin ini menentukan halaman mana yang
menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan
penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan.
Proses ini dilaksanakan berdasarkan algoritma perangkingan yang dimiliki
oleh search engine tersebut, mengikuti kaidah perangkingan hakaman yang
dipergunakan oleh mereka adalah hak mereka, para peneliti mempelajari
sifat-sifat yang mereka gunakan, terutama untuk meningkatkan pencarian
yang dihasilkan oleh serach engine tersebut.
Web Server
Merupakan komponen yang melayani permintaan dan memberikan respon balik
dari permintaan tersebut. Web Server ini biasanya menghasilkan informasi
atau dokumen dalam format HTML. Pada halaman tersebut tersedia layanan
untuk mengisikan kata kunci pencarian yang diinginkan oleh usernya. Web
Server ini juga bertanggung jawab dalam menyampaikan hasil pencarian
yang dikirimkan kepada komputer yang meminta informasi.
Tidak ada komentar:
Posting Komentar